2019年9月23日月曜日

SBmapの使い方その7 リンク集

GARUDA

GARUDA GATEWAY
SBIが開発するGARUDAの総本山。お世話になっております。

ガジェットパック

マルチオミクス解析パッケージ
島津製作所の有償版製品紹介ページ

Shimadzu Multi-omics Analysis Gadget Pack
無償版配布ページ

マルチオミクス解析の部屋
大阪大学・島津分析イノベーション共同研究講座にあるマルチオミクス解析
パッケージの情報提供

MAP

blankmaps
大阪大学大学院情報科学研究科バイオ情報計測学講座で作成した白地図が
置いてあるGitHubレポジトリ

組織

大阪大学・島津分析イノベーション共同研究講座
システム・バイオロジー研究機構 - The Systems Biology Institute大阪大学大学院情報科学研究科バイオ情報計測学講座

2019年9月22日日曜日

SBmapの使い方その6 Shimadzu MS Data importガジェットの裏技



 前記事(SBmap 化合物名の基礎知識)で説明した使い方が基本です。しかし、GC-MS, LC-MS/MSでデータを取得する分析メソッドの化合物名を書き換えなくてはならない。という欠点があります。さらに、Trp(KEGG:C00078)というような表記を分析メソッドにするのは、ダサいからヤダ。というユーザーもおられるかもしれません。
 このような問題を解決するため、Shimadzu MS Data importガジェットには裏技が用意されています。Shimadzu MS Data importは化合物名と化合物IDとの対応表を内部に持っており、島津製作所製分析法パッケージで使用されている化合物名(例ではTrp)を見つけると、自動的に化合物IDを付与します。これにより、GC-MS, LC-MS/MSのデータ取得メソッドを書き換えなくても、Multiomics Data Mapperが機能できるようにしています(図1例H)。さらに、Trp(KEGG:C00078)というようなデータを読み込んだ場合、Trp のKEGG IDはC00078 という情報を記録しておく機能もあります。しかし、化合物名が対応表にない場合は、化合物IDが付与されないのでうまく動作しません(図I)。

図1

 ここからが皆さんを見込んでこっそりお伝えする裏技です。ここだけの話として誰にも教えてほしくないのですが(もちろん正規の保証外です)、この「化合物名と化合物IDとの対応表」はユーザーが自由に書き換えることができます。
  1.  Shimadzu MS Data importガジェットの右上の秘密のボタン「IDList」を押す。
  2. 「化合物名と化合物IDとの対応表(CompoundIDList.txt)」が「メモ帳」を使って表示される。
  3.  念のため、もともとの「化合物名と化合物IDとの対応表」を別のファイルにコピペして保存しておく。
  4. 大阪大学情報科学研究科バイオ情報計測学研究室がhttps://github.com/fumiomatsuda/blankmaps/tree/master/idsから公開(予定)の対応表ファイル(CompoundIDList.txt)の中身をコピペする。あるいは自作した対応表をコピペする。
  5. 「メモ帳」のセーブ機能を用いて保存する。
  6. 念のためGARUDAを再起動する。
右上が禁断のIDList


この方法で、「化合物名と化合物IDとの対応表」を書き換えると、下図2のようにマップ側に付与するIDを工夫することで、いろいろなことができます。繰り返しになりますが、あくまでもユーザーの独自の判断でご活用ください。SBmap08, SBmap09は島津製作所製GC-MS Smart Metabolites Databaseで取得した定量データに対応するため、これらの技をいろいろ繰り出しておりますのでご参考ください。


図2

SBmapの使い方その5 SBmap 化合物名の基礎知識

 島津製作所が配布、販売しているマルチオミクス解析パッケージGC-MS, LC-MS/MS等で取得した定量データを代謝マップ上に簡便に可視化する機能を持っています。本パッケージは、阪大、SBI、島津製作所の共同研究の成果をもとに島津製作所が製品化したものです。そこで、マルチオミクス解析パッケージで代謝マップ上に可視化する際に、知っておきたい化合物名の基礎知識をこっそりご説明いたします。
 本稿ではおもにメタボロームデータを念頭に記述を行いますが、同様の考え方でプロテオーム、遺伝子発現データの可視化にも利用できます。

各ガジェットの機能とIDの役割

 マルチオミクス解析パッケージはGARUDA上で動作する複数のガジェットの組み合わせで機能を提供します。GC-MS, LC-MS/MS等で取得した定量データを代謝マップ上に可視化するには、Shimadzu MS Data ImportガジェットおよびMultiomics Data Mapperガジェットという2つのガジェットを使用します(簡単な説明)。Shimadzu MS Data Importガジェットの役割は、様々なフォーマットのデータを読み込み、.sdfというフォーマットに変換することです。Multiomics Data Mapperガジェットの役割は.sdfフォーマットのデータを受け取り、各化合物の定量データを、「白地図」と呼ばれる代謝マップ中の対応する箱(ノード)に書き込むことです。
 通常は、図1の例Aのように、GC-MS, LC-MS/MS等でデータを取得するときに、Tryptophanのデータ取得するメソッドにTrpなどの化合物名を付与します。一方、白地図にも各箱(ノード)に化合物名Tryptophanが付与されています。この化合物名(代謝物名)は書き方が様々であり、TrpTryptophanのように異なることがよくあります。Multiomics Data Mapperガジェットは、TrpTryptophanが同じ化合物であると判定できないため、うまくデータが書き込まれません。(図1A

図1

 そこで、マルチオミクス解析パッケージ用に提供された白地図には化合物ID情報が追加で付与されています(SBmapに埋め込まれたID情報を確認する方法)。化合物ID情報の(KEGG:C00078)のうち、KEGGは、KEGGデータベースの化合物番号である。ということを示しています。C00078KEGGデータベースのL-tryptophanの化合物IDです。また、()で括るというルールになっています。Multiomics Data Mapperガジェットは、()で括られたIDが完全一致するというルールで紐づけを行っています。そこで図1BのようにTryptophanのデータ取得するGC-MS, LC-MSのメソッド名をTrp(KEGG:C00078)とすると、Multiomics Data MapperガジェットはTrp(KEGG:C00078)のデータを、化合物名Tryptophanが付与された箱(ノード)に書き込みます(図1B)。

 この化合物IDにもいくつか落とし穴があります。たとえばアミノ酸にはL体、D体、ラセミ体があり、それぞれ別個のIDを持ちます。白地図の多くはPhenylalanineの箱(ノード)に、L体のIDを付与しています。もし、図1CのようにPhenylalanineのデータ取得するGC-MS, LC-MSのメソッド名をPhe(CHEBI:28044)とするとCHEBI:28044はラセミ体のIDのため、期待したようにデータが書き込まれません(図1C)。このような事態を避けるため、大阪大学情報科学研究科バイオ情報計測学研究室では、メタボローム分析で分析対象になりそうな代謝物について、実用的な代謝物名、IDをリスト化し、これをもとに全データを生成しています。(まだ作り立てで誤りがおおいのですが、、)ご参考にしていただけると幸いです。
https://github.com/fumiomatsuda/blankmaps/tree/master/ids

1つの代謝物を複数の分析メソッドで測定する場合

 GC-MSを用いたメタボローム分析法では、例えばTryptamineから誘導体化反応時に生成する、Tryptamine-2TMSTryptamine-3TMSの両方を測定対象としています。このように、1つの代謝物を複数の分析メソッドで測定する場合は面倒なことになります。たとえば、Tryptamine-2TMSTryptamine-3TMSを測定するGC-MSの分析メソッドの双方にTryptamineIDを付与し、Tryptamine-2TMS (KEGG:C00398)Tryptamine-3TMS (KEGG:C00398)としたとします。白地図上のTryptamineの箱(ノード)に、対応するデータが2つあるため(コンフリクト)、どちらかのデータが貼り付けられることになり、それがどちらになるかは不明です(2つのデータを足し算するような機能は搭載されていません)(図2)。
図2

このコンフリクトを避けるには、図3のような方法があります。たとえば、GC-MSの分析メソッドのうち、Tryptamine-2TMS にのみ(KEGG:C00398)を付与すると、Tryptamineの箱(ノード)にはTryptamine-2TMSのデータが書き込まれることになります(図3F)。さらに、(text:Tryptamine-2TMS.)というIDを創作し(マイIDをユーザーが作成してもOKです。また最後にピリオドを付けます)、GC-MSの分析メソッドのTryptamine-2TMS に付与します。その上で、白地図にも、Tryptamine-2TMSのデータを張り付ける専用の箱(ノード)を追加し、(text:Tryptamine-2TMS.)を付与しておきます(図3F)。このような作業を行うと、Tryptamine-2TMSTryptamine-3TMSの定量データを別の箱(ノード)に書き込み、簡単に比較できるようになります(図3)。SBmap08, SBmap09は島津製作所製GC-MS Smart Metabolites Databaseを用いて取得したデータを念頭に作成しました。


図3

SBmapの使い方その4 SBmapに埋め込まれたID情報を確認する方法

SBmapには、化合物情報の紐づけ用にID情報が埋め込まれています。今回はその確認方法を紹介します。

1.SBmapで直接確認する。
1-1.VANTEDでSBmapを開きます。例はSBmap08




1-2.見たい代謝物の箱(ノード)を左ダブルクリック
例はallo-Chenodeoxycholate
「Edit Label」のAnnotatationにIDが記入されています。




(CAS:15357-34-3)(HMDB:HMDB0000514)(text:allo_CDCA)(text:allo-Chenodeoxycholate)(text:Allo-chenodeoxycholic acid)(text:Allo 5beta-cholanic acid-3alpha,7alpha-diol)

IDが()で括られて記入されています。

2.IDリストで確認する。
SBmapに埋め込まれたIDはIDs.txtというファイルのデータに由来します。

2-1 IDs.txt を入手する
https://github.com/fumiomatsuda/blankmaps
のidsの中にある。
2-2 エクセル、エディタ等でファイルを開いて確認する。
2 SBmap10 Chenodeoxycholate CDCA Chenodeoxycholate;Chenodeoxycholic acid;5beta-cholanic acid-3alpha,7alpha-diol 474-25-9 C02528 RUDATBOHQWOJDD-BSWAIDMHSA-N CHEBI:16755 HMDB0000518

等の記述から、ID情報を確認する。
IDリストに誤りを見つけた場合はご一報いただけると幸いです。かなりまだ間違いがあります。






SBmapの使い方その3 VANTEDの使い方

VANTEDの使い方に関する情報まとめです。

開発元旧 http://vanted.sourceforge.net/
開発元新 https://www.cls.uni-konstanz.de/software/vanted/


日本語のマニュアル https://sites.google.com/site/esitomonokai/daunrodopeji
ESI友の会作成のプロトコール集にVANTEDの使い方マニュアルあり。バージョン古めだが、そんなに変わっていないと思う。


SBmapの使い方その2 SBmapとは

SBmapとは大阪大学情報科学研究科バイオ情報計測学講座が作成した代謝マップです。研究室内での共有目的で、GitHub上にファイルを置いてあり、さらにめんどくさいのでPublicモードにしたのでどなたでも使用できることになりました。



blankmapsレポジトリ

  • オミクス解析データ可視化用の白地図です。
  • GML フォーマットです。
  • VANTED上で利用できます。
  • Shimadzu Multi-omics Analysis Gadget Packで利用できます。
  • α版ですので、間違いがまだたくさんあります。
これらのマップは大阪大学情報科学研究科バイオ情報計測学講座のメンバーが作成したものです。間違い等があると思いますので、各自の責任でご利用ください。間違いの報告は歓迎します。修正等は適宜行います。すべての共同研究者に感謝します。

SBmap01_primary metabolite

For Shimadzu LC/MS/MS Method Package for Primary Metabolites Ver. 2.
島津製作所阪大共同研究講座との共同研究の成果です。
More good-looking version is available Shimadzu webpage.

SBmap02_yeast MRM

For Shimadzu MRM Library for Metabolic Enzymes in Yeast
島津製作所阪大共同研究講座との共同研究の成果です。

SBmap03_medium

For Shimadzu LC/MS/MS Method Package for Cell Culture
島津製作所阪大共同研究講座との共同研究の成果です。

SBmap04_AspGluPro

Metabolic pathways related Asp. Glu, Pro biosynthesis
作者:松田史生&バイオ情報計測学講座、支援:新学術領域「代謝アダプテーション」

SBmap05_SerGlyThr

Metabolic pathways related Ser, Gly, Thr biosynthesis
作者:松田史生&バイオ情報計測学講座、支援:新学術領域「代謝アダプテーション」


SBmap06_gridmaps

新しくマップを作成する時につかう、整列済みのマップです。

SBmap07_cancer metabolism

がん細胞代謝研究用のマップです
作者:松田史生&バイオ情報計測学講座、支援:新学術領域「代謝アダプテーション」

SBmap08_GCMSSmartDB

Shimadzu GCMSSmartDatabase用
島津製作所阪大共同研究講座との共同研究の成果です。

SBmap09_GCMSSmartDBonMap

Shimadzu GCMSSmartDatabase用
SBmap07_cancer metabolismに由来しています。
島津製作所阪大共同研究講座との共同研究の成果です。

SBmap10_bile acid

For Shimadzu LC/MS/MS Method Package for Bile Acids
作者:松田史生&九州大学生体防御医学研究所馬場ラボ、支援:新学術領域「代謝アダプテーション」

sample_files

テスト用のダミーデータです。動作確認用にお使いください

ids

大阪大学情報科学研究科バイオ情報計測学講座で使用している化合物idのリストです。




SBmapの使い方その1 基本編

0.準備
・Multi-omics Analysis Gadget Packをインストール

・下記の2ファイルをhttps://github.com/fumiomatsuda/blankmapsから入手する。

  1. LabSolution出力のダミーファイル ./sample_files/DummyData_LabSolwithID.csv
  2. 白地図 ./SBmap07_cancer metabolism/SBmap07_190904_withIDs.gml(190904は最新の日付のものを選ぶ)

1. Garuda Dashboardを起動する
これがGARUDAの基本画面。並んでいるのがガジェット(スマホのアプリに相当)


2. Shimadzu MSdata Importを左クリック (左下の矢印が交差しているやつ)
こういうのが起動する。


3. データを読み込む
LabSolution, Insight由来のデータなら
File=>Metabolome=> Insight, LabSolution
で読み込むファイルを選択。


練習用のダミーファイルを
DummyData_LabSolwithID.csv
を読み込むと下記のようになるはず。
ここで(Sample Name)(time course)行を編集すると実験の構造を記述できるが今回は無視(同じサンプルのSample Nameを同じにする。time courseに数字を入れると時系列データとして認識される)


4. 右上のDiscoverボタンを押す
データを送り込めるガジェットのリストが出るので、Multiomics Data Mapperをダブルクリック


5. Multiomics Data Mapperが起動し、しばらくすると、Shimadzu Multi-omics Data にデータが読み込まれるのでそれまで待つ


6. 白地図を選択
左上近傍のPathway GML Fileをダブルクリック。「開く」ダイアログで白地図ファイルを選択
今回はSBmap07_190904_withIDs.gmlを使った。


7. 実行
右下のLaunch
を押すと、なにやら表示が出て左上のタブがOutput Filesに切り替わり
output.gml が生成している。


8. マップの表示

output.gml が表示されている状態で右上のDiscoveryを押す。データを送り込めるガジェット一覧が表示されるのでVANTEDをダブルクリック。
VANTEDが起動し、しばらく待つとファイルが表示される。最初はウィンドウが小さいので、ウィンドウを適宜広げるとデータ投影済みマップが表示される。