fastpは、通常使われるアダプター配列に対応しておりますが、特殊なキットを使っている場合にアダプター配列を認識できないことがあります。その場合は、fastpのオプション設定欄で
--adapter_sequence=AGATCGGAAGAGCACACGTCTGAACTCCAGTCA
のようアダプター配列を教えてあげてください。
また、アダプターを取り除いた後のリード配列も、ターゲット以外の人工物等が混ざっていることもありますので、length filterをかけてあげる必要があることがあります。あるいは、max_len1などの global triming オプションを使って強制的に長さを揃えることが有効な場合もあります。その他の fastpの実行オプションに関する詳細はこちらでご確認ください 。設定したオプションが意図したとおりに動かないときは、その順序を変えることでうまくいくかもしれません。正しく動作するオプション設定を試行錯誤して見つけてください。もし助けが必要なら、FASTQ処理の問題解決サービスにてお手伝いいたします。
fastpによる処理が問題ないでも、それ以降の HISAT2 や StringTie がうまく実行できないことがあります。エラーが発生する場合は、下記の回避方法をお試しください。
- 関連するすべてのパス(実行ファイル、リファレンスデータ、FASTQファイル)から半角スペース、半角記号、全角文字等を除いてみる。
- HISAT2は実行中に大量の一時ファイルを生成するため、大量のディスク容量を消費します。従って、FASTQファイルは、できれば1TB以上の空き容量のあるディスクに置いて実行してください。
- タイムマシンやGoogle Driveの「バックアップと同期」などの自動バックアップソフトや、インデックス作成など処理中のファイルに対するアクセスエラーを起こす可能性のあるプログラムの実行を止めてから、FASTQファイル処理を実行してみる。また、ネットワークから切断してから実行してみる。
- サンプルを一つずつ処理してみる。複数のFASTQファイルをまとめて処理するとダメな場合でも、一つずつなら実行できることがあります。
- 別のコンピューターを使ってみる。このとき、できるだけメモリーや空きディスク容量に余裕のあるコンピューターを選ぶ。FASTQファイルのサイズが非常に大きい場合、HISAT2の処理中にディスク容量が足らなく可能性があります。処理中のリソースの状況を見て、空きディスク容量が足りなくなってないか確認してください。また、Windows版とMac版で、問題の起きている環境とは違う方のOS版を使ってみてください。
- 一度はFASTQファイル処理を正常に行えていたのに、ある時を境にエラーが起きるようになって処理ができなくなった場合、ubuntuのリセットまたは再インストールで修復する可能性があります。「ubuntuのリセット」などのキーワードでグーグル検索してみてください。fastp, HISAT2, StringTieの再インストールは必要ありません。
- CPUが高性能すぎてコア数が16を超える場合、fastpが並列処理をうまく実行できない可能性があります。このような時は、High-speed processing. (It can slow other software.) オプションのチェックを外して実行してください。
以上のすべてを試しても問題を解決できない場合は、FASTQ処理の問題解決サービス、またはデータ解析サービスのご利用をご検討ください。