GEOに登録されているRNA-SeqのGene Countデータをインポートする

このページでは、GEO(Gene Expression Omnibus)から取得したGene Countデータを用いてRNA-Seqデータ解析を開始する方法を解説します。

GEOに登録されているRNA-seqのGene Countデータをインポートする

GEOに登録されているRNA-Seqデータでは、Supplementary FileとしてGene Countのテキストファイルが提供されていることが多くあります。

また、Supplementary Fileが用意されていない場合でも、GEOが標準化されたプロトコルで計算したGene Countデータが提供されていることがあります。
その場合は、以下のリンクから取得できます:
https://www.ncbi.nlm.nih.gov/geo/download/?acc=[GSE_accession_number]

Supplementary Fileは論文の解析結果と一致するという利点がありますが、FASTQファイルの処理方法は研究ごとに異なるため、異なるSeries間での統合解析には適さない場合があります。

一方で、GEOが提供する標準化されたGene Countデータを利用することで、複数のデータセットを統合した再解析が行いやすくなります。

いずれの場合でも、Gene Countのテーブルが取得できれば、FASTQファイルの前処理を行う必要がなく、RNA-Seqデータ解析をすぐに開始できます。

この動画では、以下の2つの方法について解説します:

  • Supplementary File版
  • GEO-calculated版

それぞれのGene Countデータを取得し、Subio Platformにインポートする手順を紹介します。

実験パラメータのインポートについては、こちらをご覧ください。

次のステップ

RNA-Seqデータ解析の全体チュートリアルこちらをご覧ください。
この動画でデータのインポートが完了したら、その後の解析手順の参考としてご活用いただけます。