RNA-Seq FASTQファイル処理の実行のしかた ~ Subio Platformへのデータインポート

Subio PlatformはRNA-SeqのFASTQファイルを受け付けます。これは fastp HISAT2 StringTie という3つのツールをMacまたはWindows10のコンピューターで実行させるものです。ワークステーションも、UNIXのコマンドラインによる操作スキルも必要ありません。普通のWindows10またはMacのコンピューターで動かせます。特にWindows PCを使う場合、RNA-Seqのデータ処理環境を構築する最も簡単で安い方法でしょう。コマンドラインを使える方にとっても、Subio Platformを使う方が操作がずっとラクです。さらに、StringTieの出力は通常TPMのみで、リードカウントはprepDE.pyというスクリプトを動かさなくては算出されません。Subio Platformを使えば、何もせずともTPMとリードカウントの両方のデータを使えるので、ノイズ除去のフィルターにはリードカウント、そのあとの統計解析にはTPMと使い分けることができます。誤った生物学的結論を導かないためにとても重要なことですが、それが簡単にできるのです。

パイプラインを実行する前に、これらのツールをインストールする必要があります。もし難しいようでしたら、RNA-Seqデータ解析環境構築支援サービスをご注文ください。

操作ガイド - RNA-Seq FASTQファイルのインポート

FASTQファイルは、.gz圧縮形式のままにしておいてください。同じフォルダー内に、途中結果のファイルが大量に生成されますので、ディスクに十分な空きスペースがあること(FASTQファイルの合計サイズの5倍以上)をご確認ください。もし、実行途中にディスクが足りなくなった場合は、途中で止まります。FASTQファイルは、外付けディスクにあっても大丈夫です。

Paired-end サンプルのFASTQファイルをインポートする場合は、ファイル名の付け方のルールに従ってください。

もし、v1.23あるいはそれより前のバージョンからSubio Platformをお使いの方は、Ensembl遺伝子のPlatformの作り方に従って準備をしてから、こちらのチュートリアルを始めてください。

RNA-Seq FASTQ ファイルをインポートする。

この後のチュートリアル、「RNA-Seqによる遺伝子発現データの解析について」もぜひご覧ください。