再解析の重要性

データ解析を誰かに依頼した場合、解析結果をエクセルかPDFでもらうことになりますが、解析の過程がどうだったか議論になることはほとんどありません。 なぜなら、もらった最終結果だけ見ても、潜在的にどのような問題があったかわからないからです。 しかしマイクロアレイやNGSのデータ解析の過程では、人の判断が必要なポイントがいくつかあるのが普通です。

そのようなときは、データがどうなっているかを見て、実験デザインや生物学的予測を加味して、最終的には主観に基づいた判断が必要になります。 なぜなら生物学の実験は完全でないからです。 そのような状況において、どのような仮定に基づいた解析をするべきか決定できるのは実験生物学者しかいません。 バイオインフォマティシャンにできることは、彼らの意思決定をサポートすることしかできません。

しかし現実には、データ解析を依頼した場合、そのようなディスカッションはなく、一方的に解析結果を渡されることが多いです。 これでは生物学的発見のチャンスが激減するのはおろか、誤った結論に至っても仕方がありません。

このため、最終結果だけでなく生データを共有することが勧められており、これがデータ解析の信頼性を担保する最低限の根拠となっています。 しかし、現実には生データが再解析されることはほとんどありません。 第三者による再解析がされなければ、データ解析の信頼性は絵に描いた餅です。

再解析されない理由はコストです。 コストはお金のことではありません。 「面倒だ。」「時間がかかる。」「自分ではできないから誰かに頼まないといけない。」などの理由は、すべてコストが高いということです。 たとえ生データが無料でも、コストは高いままなのです。 このコストを下げなくては問題が解決されません。

Subio Platformによるデータ共有のメリット

そこでSubio Platformでは、SSAという形式のファイルでデータ共有できる仕組みを提供しています。 SSAファイルの中には、生データはもちろん、遺伝子アノテーションなどの生物学情報、実験パラメーターやプロトコルなどの実験に関する情報、最終および途中の解析結果、付随実験の結果や関連論文などの添付ファイルなどが全部入っています。 SSAファイルを受け取ったら、無料のSubio Platformにドラッグ&ドロップするだけで、簡単にこれらの情報を見ることができます。

オミクスデータを解析するということは、さまざまな生物学データと統合して統計解析を適用しますが、これらのデータ(たとえば遺伝子アノテーション、サンプルの情報、実験データの生ファイル、統計解析の結果、補足するPDFなどの資料、ほか)をすべてまとめて、たった一つのアーカイブ(SSA)ファイルとして出力することができます。この SSA ファイルを渡したら、受け取った人はその人のコンピューターに無料の Subio Platform をインストールすると、SSAファイルをドラッグ&ドロップするだけであなたが解析していた状態を、そのコンピューター上でそっくりそのまま復元することができます。

SSAファイルは、オミクスデータをもっとも簡単に、低コストで共有する方法です。

メリット1 データをしっかり見ることができる。

P値やFold値のテーブルはデータの一側面にすぎず、そのデータから引き出せる情報はもっとたくさんあります。 Subio Platformはオミクス専用のデータブラウザ―ですので、さまざまな角度からデータを視覚化し、ドラッグ&ドロップで誰でも簡単に操作することができます。 このようなインタラクティブな視覚化ツールは、探索的データマイニングの肝です。

ただしこれにより、オミクスデータの持つ本質的な難しさはより鮮明になります。 エクセルやPDFでは見えなかった、はるかに奥深い世界が現れるので、とても難しいと感じる人も多いでしょう。 しかし、この類の難しさを隠すことはユーザーを欺くことに他なりません。 だから私たちは、ソフトウェアだけでなく、ユーザー自身による探索を支援するサービスの提供に力を入れているのです。

メリット2 再解析が容易にできる。

生データしかなければ、解析結果を受け入れるか、最初から全部やり直すかの二択になってしまいます。 これがコストが高くなる最大の理由ですが、ほとんどの場合、最初から全部やり直す必要はないのです。

SSAでデータを共有すれば途中結果も保存してあるので、任意のところから一部やり直すことが可能です。 そして、やり直した結果と元の結果を比較して選択することも可能です。 誰でも再解析に参加できるようになることで、解析の質が高くなり、誤った結論を排除することができます。

メリット3 多くのアイデアを取り込むことができる。

人は自分に見えるものしか見ることができません。 複雑で多層的なオミクスデータは、人によって違った見え方があります。 従って、さまざまな知識やスキルを持つ多くの人がデータを見ることで違う発見があり、それぞれの発見を持ち寄ることでチャンスは飛躍的に増えます。 ただし、せっかく拾ったチャンスの種を潰さないためには、数式や理屈で議論してはいけません。 みんなでグラフやチャートで視覚化されたデータを見ながら、インタラクティブに操作しながら議論できることが大事なのです。

戦略としてのデータ共有

Subio Platformを使えば、このような深いレベルでのデータ共有および共同作業環境を無料で実現できるのです。 このような環境を通じてオミクスデータを深く見ることができる人材を育てることが、チームとして決定的な競争力の差になっていくのではないかと思います。

Back to Top