RNA-Seq解析・マイクロアレイ解析・メチル化解析などのオミクスデータを可視化し、
“理解しながら解析する”ためのデータ解析ソフトウェアです。
データを見て、判断し、解釈する
ブラックボックスに頼らない解析へ
Windows / Mac 対応
チュートリアル通りに進めれば、結果は出る。
でも、その結果――
そうした疑問を残したまま、解析を終わらせていませんか?
R(DESeq2など)は、RNA-Seq解析で広く使われている重要な手法です。
一方で、初心者向けの学習では、まずコマンドを動かして結果を出すことが重視されがちです。
そのため、データの分布やサンプル間の違いを十分に確認しないまま、
コマンドをなぞるように解析を進めてしまうことがあります。
一方で、操作の簡便さを重視したGUIツールでは、
短時間で結果を得られる一方、
処理の前提やデータの状態を確認しにくい場合があります。
Subio Platformは、
データを“見ながら考えて”解析を進める
オミクスデータ専用ソフトウェアです。
「結果が正しいのか分からない」という不安を、
データを見ながら一つずつ確認できる状態へ変えていきます。
その違いを、ぜひご自身のデータで体感してください。
2009年のリリース以来、研究現場で継続的に利用されています
まずは、あなたのデータで確かめてみてください。
Windows / Mac 対応
Rやプログラミングの知識は不要
実際の解析フローを確認する
(デモデータ付きRNA-Seq解析チュートリアル)
RNA-Seq解析では、DESeq2やGSEAなどの統計ツールが重要な役割を果たします。
しかし、統計結果を得ることと、その結果を理解し、検証し、研究に活かすことは同じではありません。
統計ツールだけで解析を完結させようとすると、
現代のオミクス解析では、次のような課題に直面することがあります。
① 視覚的検証の欠如:バッチエフェクトを見落とすリスク
オミクスデータは極めて複雑です。可視化を伴わない解析は、バッチエフェクトや系統誤差を見落とす可能性があり、結論の信頼性が根底から揺らぐリスクを孕んでいます。補正にも限界があるため、ツールを動かす前に、生データに何が起きているかを確認するのが先です。
② 継続性の欠如:数ヶ月後、その解析を再現・説明できますか?
単発の解析はできても、数ヶ月後の再現や前任者のデータの引き継ぎは極めて困難です。多大な費用と時間をかけた知見が積み重ならず、その場限りの「使い捨て」になってしまうのは、研究者にとってもラボにとっても大きな損失です。
③ 効率性の欠如:解析以外の作業に奪われる時間
解析環境が大規模・複雑になるほど、データ整形やスクリプト管理、エラー対応などに時間がかかる傾向があります。その結果、本来集中すべきデータの解釈に十分な時間を割けない場合があります。
④ 探索性の欠如:静的なレポートで探索が終わってしまうリスク
ExcelやPDFの結果を受け取ると、解析がそこで終わったように見えてしまうことがあります。
しかし、解析結果は考察の「入り口」です。
注目している遺伝子がDEGリストに入っているかどうかだけでなく、
周辺のさまざまな事象に気づくことで、探索が始まります。
コマンドラインツールに挫折する人が多い一方で、
簡単に使えるツールも増えています。
しかし、それらは上記の4つの課題を本当に解決できているでしょうか。
簡単に使えることを売りにしたツールほど、
「データの確認 → 解析実行 → 解析結果の確認 → データの確認に戻る」
というサイクルを回しにくい場合があります。
重要なのは、単に使いやすいだけでなく、
そのツールを使って解析を理解できるようになるかどうかです。
バッチエフェクトやデータの偏りを把握し、解析結果の信頼性を高めます。
Subioで可視化・データ管理を行い、高度な統計解析はRやPythonで拡張できます。
過去データや公共データを再解析・統合し、新しい発見につなげます。
OSや解析環境の変化に左右されにくく、研究の継続性を支えます。
解析結果を渡すだけでなく、相手も再解析に参加できるデータ共有を実現します。
こうした課題に対して、Subio Platformでは、まず「データの質」を確認することを出発点としています。
オミクスデータに特化した解析ソフトとして、データの可視化を通じて、バッチエフェクトやデータの偏りを一目で把握できるよう設計されています。
多くのGUIツールは、エラーを起こさずに最小限の操作で処理を完了することを重視しています。
その結果、解析のブラックボックス化につながる可能性があります。
Subio Platformは「データで何が起きているのか」を理解するために作られています。
解析結果の信頼性は、前処理や正規化の段階で生じるバイアスをどれだけ正しく把握できるかに大きく依存します。
そのため、以下のような点を直感的に確認できます
可視化は「あると便利な機能」ではありません。
解析の信頼性を左右する重要なプロセスです。
バッチエフェクトは特定の条件に限らず発生し得ます。
サンプル数が増えるほど、その影響が現れる可能性は高くなります。
オミクスデータでは、まず存在する可能性を前提として考えるべきものです。
データセットの規模が大きいほど、そのリスクは高まります。
たとえ小規模なデータセットであっても、絶対にないとは言い切れません。
クラスターとバッチエフェクトの関係が一目で確認できます。
散布図やヒートマップと同時に、サンプルごとのデータ分布を確認できます。
Subio Platformなら、解析の各ステップでデータの状態を視覚的に把握できます。
詳しく見たい方はこちら:
多くのチュートリアルはコマンド操作の解説に終始していますが、
可視化なしでは、全体像を十分に把握できないまま解析を進めることになります。
ComBatのような補正手法を使えば、結果は自動的に出力されます。
しかし、補正がうまく機能しているかどうかは解析者が検証しなければいけません。
生データを見ていれば、あるクラスターがバッチエフェクトによるものと疑われる場合でも、
補正後の整えられたデータだけを見て解析していると、
それを生物学的に意味のあるクラスターと誤って判断してしまいがちです。
これはマイクロアレイ時代に、RMA補正後のデータ解析でよく見られた現象とよく似ています。
(RMAで“整ったデータ”が、必ずしも真実を反映しているとは限らない例はこちら)
信頼できる解析は、シンプルな前提から始まります。
バイアスの存在を常に疑い、生データをみて視覚的に確認することです。
解析の成否は、ツールではなく「データの見方」に大きく左右されます。
Subio Platformは、RNA-Seq解析をはじめとするオミクスデータ解析において、RやPythonと競合するのではなく補完する存在です。
Subio Platformが「直感的な可視化とデータ管理」を担い、RやPythonが「高度・専門的な統計計算」を担います。
Subio Platformを、RやPythonスクリプトのハブ、そしてマルチオミクスデータのハブとして活用することで、
直感的かつ信頼性の高い解析システムを、低コストで構築できます。
| 使いやすさ | 解析の理解しやすさ | 拡張性 | |
|---|---|---|---|
| コマンドラインツール(RやPythonなど) | △ | △ | ○ |
| GUIツール(特にブラウザベース) | ○ | △ | △ |
| Subio Platform(GUI+スクリプト連携) | ○ | ○ | ○ |
※ ○は各観点において高い適合性を示します。△は性能が低いことを意味するものではありません。
コマンドラインツールは、初心者には難しく感じられる一方、習熟した利用者にとっては非常に柔軟で拡張性の高い環境です。
一般的なGUIツールでは、表示内容や実行できる処理がツール仕様に依存するため、解析プロセスの確認や自由な拡張に制約が生じる場合があります。
Subio Platform は、GUIによる直感的な操作性と、スクリプト連携による柔軟性・再現性を両立できるよう設計されています。
具体的には、データのインポートから正規化・前処理まではSubio Platformで行えます。
フィルタリングや標準的な統計解析(t検定、PCA、クラスタリングなど)はプラグインで簡単に実行です。
より高度、あるいは特殊な統計計算が必要な場合には、タブ区切りテキストを介してRやPythonへデータを渡し、
計算結果を再びSubio Platformに取り込むことで、一貫した解析フローを維持できます。
サンプル数が増えてくると(目安として100サンプル程度以上)、
コマンドラインツールの高速性が有効になります。
しかし、いきなり全データに対してパイプラインを実行するのは、適切でない結果を招くリスクがあります。
まずは一部のデータを用いてSubio Platformで可視化・仮解析を行い、
解析方針を明確にしたうえでスクリプト化し、全サンプルに適用するのが実用的です。
コードが書けなくても、生成AIを使ってR/Pythonスクリプトを作成できます。
しかし、「その結果が妥当かどうか」を判断できるのは解析者だけです。
Subio Platformは、データをローカルで管理しながら、
RやPythonとの連携を含めた解析をローカル環境で完結させることができます。
その上で、AIの出力結果を“自分の目で検証できる環境”を提供します。
このハイブリッド解析の全体像については、以下の記事で具体例とともに解説しています:
実際の操作は、以下の記事で具体的に解説しています
Subio Platformは、RNA-Seq解析ソフトとしてだけでなく、オミクスデータ全体を扱う解析基盤として設計されています。
このような基盤上でオミクスデータ解析を継続することで、RNA-Seq解析をはじめとする様々なマルチオミクスデータが、検索・再解析可能な「研究資産」として自然に蓄積されていきます。
自身の実験データだけでなく、GEOやTCGAといった公共データも日常的に取り込むことで、
それらは統合された「生きたアーカイブ」へと成長します。
過去のデータは、単なる記録では終わりません。
新しい視点による再発見を待つ、研究資産です。
ケーススタディ339:
肝細胞癌(HCC)の複数データセットを比較したところ、遺伝子発現はプラットフォーム(RNA-Seq/マイクロアレイ)を越えて一貫している一方で、miRNA発現はデータセット間で驚くほど一致していませんでした。
注目すべきは、miRNA発現は各データセット内では一定の整合性を示している点です。すなわち、この問題は単一のデータセットを見ているだけでは見えず、複数のデータセットを比較して初めて明らかになります。
ケーススタディ189:
マウス乳腺発生に関する独立した複数のデータセットを比較したところ、研究間で非常に高い一貫性を示す発現パターンが確認されました。
これは、データを蓄積し比較可能にすることで、情報の信頼性を評価し、信頼できる結果を見極めることが可能であることを示しています。
Scan Genes over Seriesツール(System Plug-in):
GEO Profilesのような検索を、Subio Platformに蓄積されたデータに対して実行できます。
特定の遺伝子が他のSeries(データセット)でどのような挙動を示すかを、
プラットフォームや生物種の違いを越えて一覧することが可能です。
Subio Platformは、以下の形式の幅広いオミクスデータを扱えます。また、GEOやTCGAなどの公共データベースのデータも取り込み、再解析することが可能です。
難しいと感じた場合は:
公共データベースには多種多様なオミクスデータが蓄積されており、初めて扱う形式に出会うことも少なくありません。
未知のデータを扱うには、幅広い知識と経験が求められます。
もし扱いが難しいと感じた場合は、Subioのデータ解析サービスをご利用ください。
ご希望のデータセットをSSA形式で納品し、そのままあなたの「アーカイブ」に追加できます。
Subio Platform本体は無料で提供しています。
可視化やデータ管理は無料で行える一方、
より高度な解析機能やサポートは、プラグインや解析サービスとして提供しています。
まず無料の基本機能で何ができるのかを知りたい方は、こちらもご覧ください。
Subio Platformの基本機能でできること
価格の詳細については、価格表をご覧ください。
そのうえで、Subio Platformは長期的な研究利用を前提とした環境として設計されています。
使っていたツールが、突然使えなくなったことはありませんか?
バイオインフォマティクスは無料ツールによって大きく発展してきました。
しかしアカデミアでは「新規ツールの開発」が評価される一方で、「既存ツールの維持」は相対的に注目されにくい傾向があります。
そのため、ツールの継続性という課題は、現在でも十分には解消されていない側面があります。
OSをアップデートした際に、使い慣れた解析ツールが動かなくなるといった状況に直面することもあります。
それが研究の中核を担うツールであれば、解析の停滞や、プロジェクトそのものの中断につながる可能性があります。
「自律的な運営」が、安定した基盤をつくる
Subioはこの問題に対する一つのアプローチとして、外部要因(プロジェクト終了や政策変更など)に依存しない、自律的に維持可能な運営を前提に2008年に設立されました。
以来、長期的な継続性を重視した開発と運営を続けてきました。
開発者・アナリストの皆様へ:Subio Platformを基盤とした共創
私たちは、オープンソースでの配布と並行して、
Subio Platform上でもプラグインとして解析ツールを配布することができます。
既存の開発スタイルを維持したまま、新たな利用環境や提供経路を広げることが可能です。
こうした取り組みに関心のある方は、ぜひご相談ください。
Subio Platform独自の「SSAファイル」は、RNA-Seq解析をはじめとするオミクスデータ解析の結果を、単なる保存形式としてではなく再利用可能な形で扱うための仕組みです。
生データ、統計解析結果、解析パラメータ、研究ノートや関連資料(PDF)まで、解析作業のすべてを一つのファイルにパッケージ化します。
追加コストは不要で、簡単なインストールだけで、受け取った側でもその場で即座に再現・再解析できます。
解析結果を「渡すだけ」で終わらせず、受け取った側が自分の視点でデータを動かし、検証・再解析に参加できる点が大きな特徴です。
元データや解析条件も含めて共有されるため、受け取った側も手元で安心して試行錯誤することができます。
なぜSSAファイルによる共有が重要なの? ( 内容を見る)
GEOなどの公共データベースから生データをダウンロードしても、
実際に論文の結果を検証したり、自身の研究に再利用できる人は多くありません。
一方で、解析結果をPDFやExcelといった静的ファイルで受け取っても、
そこから生物学的な議論へ発展させるのは容易ではありません。
この「データはあるが動かせない」という状況こそが、オミクス研究における長年のボトルネックです。
こうした課題に対して、SSAファイルを使えば、共同研究者自身がデータを動かし、
それぞれの視点で再解析を行うことができます。
Subioは、データ共有を「単なる報告」から「議論型のデータ共有」へと進化させ、
共同研究の質を大きく高めます。
コマンドラインツールが広く使われている背景には、それが唯一の選択肢だからではなく、学べる環境が整っているという側面もあります。
しかしその一方で、私たちはまだ、オミクスデータの真の「読み解き方」を完全には理解していません。
解析アルゴリズムは、本来、実験生物学者による評価とフィードバックを通じて磨かれていくべきものです。
しかし現実には、そのフィードバックはバイオインフォマティクスのコミュニティ内部にとどまり、外部からの十分な検証や批判を受けにくい状況にあります。
AIの力を借りて最新の解析手法を取り入れつつも、
結果をブラックボックスのままにせず、自分の目で確かめながら進める研究者が増えれば、
解析結果に対する実験現場からのフィードバックも増えていきます。
そのような循環が、オミクスデータ解析をより実用的で、
研究現場に根ざしたものへ発展させていくと、私たちは考えています。
受け取った方が迷わず再解析を始められる、90秒ガイドです。
Subio Platformでは、独学で解析を進める方のために、ソフトウェアの使い方やチュートリアル、トラブルシューティング、ケーススタディを豊富に発信しています。まずは自分で手を動かし、データの本質に迫ってみましょう。
解析結果の正確さを保証したい、あるいは時間を節約したい場合は、安価で高品質なデータ解析サービスや、マンツーマンのオンライントレーニングも利用できます。あなたの研究フェーズに合わせて、最適なサポートを選択してください。
ここまで読んで「実際の操作を見てみたい」と感じた方は、
実際にデータにどのように扱えるのかをご覧ください。(約9分)
コマンドを学ぶのか? それとも、データ解析を学ぶのか?
まずは、あなたのデータで確かめてみてください。
プラグインは初回30%オフ、
さらに条件により最大50%まで割引可能
割引プログラムの一覧を見る
下のフォームに必要事項をご記入後、ダウンロードボタンをクリックしてSubio Platformをダウンロードしてください。
ダウンロードありがとうございます
まずはSubio Platformでデータを読み込み、
分布やバッチエフェクトを確認してみてください
初めての方は、デモデータで試せるチュートリアルから始めることもできます
Subio Platformでは、
可視化やデータ管理はそのまま無料で行えます
実際の解析で必要となる処理(統計解析・クラスタリング・発現差解析など)は、
RやPythonと組み合わせることで、無料で実行することも可能です
ただし、その場合はコードの作成や調整に時間がかかることも少なくありません
プラグインを利用することで、
これらの解析を短時間で実行でき、
操作に時間を費やすのではなく、
データの理解と解析結果の解釈に集中することができます
また、一部の機能はプラグインでのみ提供されており、
同様の解析をスクリプトで再現するのは難しい場合もあります
価格も決して高価ではありませんので、
よろしければ5日間の無料トライアルからお試しください
プラグインで生成した解析結果は、
プラグインのライセンスが失効した後も引き続き利用できます。
解析結果が見られなくなることはありません。
プラグイン・プラグインセットは初回30%オフ
さらに
紹介リンク1つにつき5,000円割引(最大50%まで)
※ご購入前にリンクを掲載のうえ、
見積もり依頼時にURLをお知らせいただくことで適用されます
※既存ユーザーの方も対象です