このページでは、GEO(Gene Expression Omnibus)から取得したGene Countデータを用いてRNA-Seqデータ解析を開始する方法を解説します。
GEOに登録されているRNA-Seqデータでは、Supplementary FileとしてGene Countのテキストファイルが提供されていることが多くあります。
また、Supplementary Fileが用意されていない場合でも、GEOが標準化されたプロトコルで計算したGene Countデータが提供されていることがあります。
その場合は、以下のリンクから取得できます:
https://www.ncbi.nlm.nih.gov/geo/download/?acc=[GSE_accession_number]
Supplementary Fileは論文の解析結果と一致するという利点がありますが、FASTQファイルの処理方法は研究ごとに異なるため、異なるSeries間での統合解析には適さない場合があります。
一方で、GEOが提供する標準化されたGene Countデータを利用することで、複数のデータセットを統合した再解析が行いやすくなります。
いずれの場合でも、Gene Countのテーブルが取得できれば、FASTQファイルの前処理を行う必要がなく、RNA-Seqデータ解析をすぐに開始できます。
この動画では、以下の2つの方法について解説します:
- Supplementary File版
- GEO-calculated版
それぞれのGene Countデータを取得し、Subio Platformにインポートする手順を紹介します。
実験パラメータのインポートについては、こちらをご覧ください。
次のステップ
RNA-Seqデータ解析の全体チュートリアルはこちらをご覧ください。
この動画でデータのインポートが完了したら、その後の解析手順の参考としてご活用いただけます。