SOFT formatted family fileのSample_characteristics_ch1 に入っているすべての情報を抽出する

Subio Platformの、Import Samplesウィザードを使ってSOFT formatted family fileから実験データを抽出すると、自動的にSample Informationに情報が入ってきます。このとき、Sample_characteristics_ch1フィールドにはすべての実験パラメータが区切り文字 ”///” で連結されて入ってきます。しかし、Edit parameters, Edit Sample InformationのLook UpツールからSOFT formatted family fileを取り込むと、Sample_characteristics_ch1からは最後のパラメーターのみが入ってきて、それ以外の値が捨てられてしまう問題があります。

この問題を回避する方法として、ChatGPTにPythonコードを生成させて、JupyterLabで実行することで、実験パラメーターを簡単に取り出す方法を紹介します。実験パラメーターの表を出力すると、Edit Parametersで取り込ませるのには便利ですが、Sample Informationにそのようなデータを取り込むと列が爆発的に増えて管理不能になりかねません。したがって、Sample Informationに取り込む場合の方法と、Sample Informationに取り込んだ情報をEdit Parametersで実験パラメーターに利用する方法も併せて紹介します。

GEOのサンプルのCharacteristicsフィールドの実験パラメータを取得する

GEOのサンプルは、「Characteristics」というフィールドに実験パラメーターが入っていることがよくあります。このフィールドは、著者が研究内容を説明するために必要なパラメーターをいくつでもタイトルと値のペアの形で登録できます。しかし、コーディングができない人にとってすべてのサンプルの実験パラメータを集めることは少し難しいかもしれません。この動画では、ChatGPTとJupyterを使ってこの作業を簡単に行えるようにし、抽出した情報をSubio Platformにインポートして解析に役立てる手順を紹介します。