Top of Technical Information

Subio Platform の動作がとても遅いです。なにか解決策はありますか?

Subio Platformを使うとき、パフォーマンスのボトルネックとなるのはデータへのアクセススピードです。従って、大量かつ高速なメモリーと、M.2 SSD 上で動かすことが解決策となります。解析に必要なメモリーのサイズについてはこちらをご覧ください。CPUはあまり重要ではありません。ミドルレンジのCPU(Intel Core i5-7400やAMD Ryzen 5 1400 クラス)で十分です。M.2 SSDドライブにOSとSubio Platformを入れて動かすので、十分の容量を確保してください。

このようなハードウェアによる解決が難しい場合は、必ずしも解決するとは限りませんが下記をお試しください。

他のアプリケーションを閉じる:

たくさんのアプリケーションが起動していると、たとえ走っていなくてもSubio Platformが使えるメモリーが少なくなる可能性があります。できるだけ不要なソフトは終了させるようにしましょう。

Viewとtabを非表示にする:

Turning Views and Tabs On/Off

100万プローブとか、数千サンプルとかあるような巨大なデータセットを扱うと、Subio Platformは非常に遅くなります。

このようなとき、Viewやタブの表示を切ることで、Subio Platformの応答を改善することができます。

解析が終わったら、Viewとタブの表示をもどして見ることができます。

Drawing Mode を Speed にする: 

Platform または Plug-in メニューから Preferences 画面を開いて、描画モードをデフォルトの Quality から Speed に変えると、グラフはなめらかでなくなりますが速く描画します。

Preference - Graphic Mode

グラフの軸の最大値と最小値を、実数で設定する:

軸の設定は、デフォルトでは max あるいは min となっていますが、これはその都度表示される最大値と最小値を走査することになります。実数を設定することで、このような処理を省略することができます。

Measurement の数を減らす:

Platform のMeasurement 数を減らすのは非常に効果があります。どのように生物学的意味を損なうことなく Measurement の数を減らすかについては、いろいろなやり方が可能です。少しトリッキーですが、下のムービーでどのように減らすかのアイデアをいくつかご紹介します。実際にやられるまえに、もし心配でしたらお気軽にご相談ください。contact us

TCGA PRAD, RNA-Seq & DNA Methylation Integration (Part 2)

TCGA の 301人の Prostate Adenocalcinoma 患者のDNA メチレーションデータ(Illuminaの HumanMethylation450 アレイで測定されたデータ)をSubio Platformにインポートしてみます。64GB のメモリーでも、48万プローブ×301サンプルのデータを解析するのは大変です。そこで、このケーススタディでは、いかにして大規模なコンピューターを使わなくてもデータ処理できるように、生物学的な意味を失わないように小さくするかをご紹介します。ご自身のコンピューターで大きなデータを扱えずに困っている方にとってヒントになると思います。

0:00 Getting clinical and DNA methylation array data from TCGA Data Portal.

0:50 Getting the annotation table of the Illumina methylation array from GEO site.

1:00 Editing the annotation table to separate into 3 to make it small.

3:05 Importing the separated annotation tables to create sub-platforms.

3:25 Importing experimental data of DNA methylation study.

4:10 Creating a Series and editing parameter to extract TCGA sample ID.

4:40 Filtering to remove probes which methylation status are unchanging.

5:45 Exporting the data of changing probes only.

6:15 Merging the data of changing probes from the separated 3 Series on Excel.

7:00 Importing the changing data into the platform of whole probes.

7:45 Creating a Series and restoring the sample IDs.

8:20 Covert data into Region Lists to make them available to tools in Advanced Plug-in.

8:40 Loading a genome of hg19 RefSeq genes.

9:20 Creating intervals to merge probes which are closely located and sharing similar values.

10:20 Exporting the intervals as BED files, and import them again as creating a platform of intervals.

11:00 Editing sample information to fill clinical information.

12:50 Creating a Series and editing parameters.

13:55 Editing DataSets as defining groups of samples.

15:10 Editing normalization scenario as pre-processing.

16:00 PCA on DNA methylation status.

17:00 Filtering to extract intervals which methylation status change between normal and tumor.

18:55 Applying Genomic Location Filter to extract genes having methylated or unmethylated intervals.

データインポートから解析まで一通り学びたい方は、オンライントレーニングをお申し込みください。