FASTQ to VCF (RNA-Seq) の実行環境を設定する方法(macOS バージョン)

この記事は、FASTQ to VCF ツールを使うための準備を行うためのものです。

GATK4のインストール

これを始める前に、RNA-Seq FASTQファイル処理パイプラインの設定のやり方(macOS 版)を完了してください。ここで説明されている fastp と HISAT2 の設定は同じなので、ここでは省略します。これらに加え、bioconda経由で GATK4 をインストールします。ターミナルで、下記のコマンドを実行してください。

$ conda install -c bioconda gatk4

実行環境設定パネル

設定のやり方は、ほとんどRNA-Seq FASTQファイル処理パイプラインの設定と同じです。fastp と HISAT2 の実行ファイルをダウンロードして、パスを設定してください。GATK の Resource Bundle ヒトのみの対応となっています (b37/hg19 または Grch38/hg38)。ヒト以外の生物種ではご利用いただけません。

ただし、HISAT2のウェブサイトから提供されているインデックスは染色体名が番号だけになっているので、"chr1"のように染色体名を変更するよう編集したfaファイルから構築し直したものを使わないとGATKの実行中にエラーが起きて止まります。そこで、この問題に対応したGRCh38用の"chr"付き HISAT2 インデックスGTFファイル を用意しました。zip圧縮されていますので、解凍してお使いください。

FASTQ to VCF (RNA-Seq) Environment Set-up Panel (macOS)

1. Java 8 Executable

anaconda3 のインストールディレクトリまで進み、その中の /bin/java を選択してください。

2. GATK jar Executable

anaconda3 のインストールディレクトリまで進み、その中の pkgs/gatk[version]/share/gatk[version]/gatk-package[version]-local.jar を選択してください。

3. GTF/GFF3 File

grch38版は、こちらからGTFファイルをダウンロードしてください。このGTFファイルは chromosome nameに "chr" を付加している点で、EBIの提供するものとは異なります。ちなみに、このバージョンのGTFで正しく動作させるためには、”chr”付きのHISAT2 Indexとの組合せで使う必要がありますのでご注意ください。

4. dbSNP VCF File

Google Cloud経由で提供されている gcp-public-data--broad-references から取得します。grch38の場合は、hg38/v0 フォルダーの下から、Homo_sapiens_assembly38.dbsnp.vcf をダウンロードしてください。

5. Known Indels VCF File

ステップ4と同様に、hg38/v0 フォルダーの下からHomo_sapiens_assembly38.known_indels.vcf Mills_and_1000G_gold_standard.indels.hg38.vcf をダウンロードしてください。リストにファイル名が見つからない場合は、2ページ目に移動してください。

ステップ4~5のファイルについて注意

Google Cloud上では、".vcf.gz"という拡張子で表示されていますが、ダウンロードしたファイルは ".vcf" などのように変わっていることがあります。生のvcfでもgz圧縮されたファイルでもどちらでも受け付けてくれますが、拡張子を修正しなければいけない場合があります。

新しいmacOSで、pythonが見つからないという問題が起きる場合の対処法

パイプラインに含まれるhisat2-inspectというプログラムを実行しようとしたときに、pythonが見つからないというエラーが発生する場合があります。このような場合は、Subio Platformをいったん終了して、ターミナルから次のコマンドでSubio Platformを起動させることでエラーの発生を回避できます。

open /Applications/Subio/Subio.app

hg19で解析する方へ

hg19で解析する場合は、HISAT2 Index (grch37_genome.tar.gz)GRCh37 GTFファイル はオリジナルのものをお使いください。そして、dbSNPとIndelsファイルは下記のものをお使いください。