2019年9月22日日曜日

SBmapの使い方その5 SBmap 化合物名の基礎知識

 島津製作所が配布、販売しているマルチオミクス解析パッケージGC-MS, LC-MS/MS等で取得した定量データを代謝マップ上に簡便に可視化する機能を持っています。本パッケージは、阪大、SBI、島津製作所の共同研究の成果をもとに島津製作所が製品化したものです。そこで、マルチオミクス解析パッケージで代謝マップ上に可視化する際に、知っておきたい化合物名の基礎知識をこっそりご説明いたします。
 本稿ではおもにメタボロームデータを念頭に記述を行いますが、同様の考え方でプロテオーム、遺伝子発現データの可視化にも利用できます。

各ガジェットの機能とIDの役割

 マルチオミクス解析パッケージはGARUDA上で動作する複数のガジェットの組み合わせで機能を提供します。GC-MS, LC-MS/MS等で取得した定量データを代謝マップ上に可視化するには、Shimadzu MS Data ImportガジェットおよびMultiomics Data Mapperガジェットという2つのガジェットを使用します(簡単な説明)。Shimadzu MS Data Importガジェットの役割は、様々なフォーマットのデータを読み込み、.sdfというフォーマットに変換することです。Multiomics Data Mapperガジェットの役割は.sdfフォーマットのデータを受け取り、各化合物の定量データを、「白地図」と呼ばれる代謝マップ中の対応する箱(ノード)に書き込むことです。
 通常は、図1の例Aのように、GC-MS, LC-MS/MS等でデータを取得するときに、Tryptophanのデータ取得するメソッドにTrpなどの化合物名を付与します。一方、白地図にも各箱(ノード)に化合物名Tryptophanが付与されています。この化合物名(代謝物名)は書き方が様々であり、TrpTryptophanのように異なることがよくあります。Multiomics Data Mapperガジェットは、TrpTryptophanが同じ化合物であると判定できないため、うまくデータが書き込まれません。(図1A

図1

 そこで、マルチオミクス解析パッケージ用に提供された白地図には化合物ID情報が追加で付与されています(SBmapに埋め込まれたID情報を確認する方法)。化合物ID情報の(KEGG:C00078)のうち、KEGGは、KEGGデータベースの化合物番号である。ということを示しています。C00078KEGGデータベースのL-tryptophanの化合物IDです。また、()で括るというルールになっています。Multiomics Data Mapperガジェットは、()で括られたIDが完全一致するというルールで紐づけを行っています。そこで図1BのようにTryptophanのデータ取得するGC-MS, LC-MSのメソッド名をTrp(KEGG:C00078)とすると、Multiomics Data MapperガジェットはTrp(KEGG:C00078)のデータを、化合物名Tryptophanが付与された箱(ノード)に書き込みます(図1B)。

 この化合物IDにもいくつか落とし穴があります。たとえばアミノ酸にはL体、D体、ラセミ体があり、それぞれ別個のIDを持ちます。白地図の多くはPhenylalanineの箱(ノード)に、L体のIDを付与しています。もし、図1CのようにPhenylalanineのデータ取得するGC-MS, LC-MSのメソッド名をPhe(CHEBI:28044)とするとCHEBI:28044はラセミ体のIDのため、期待したようにデータが書き込まれません(図1C)。このような事態を避けるため、大阪大学情報科学研究科バイオ情報計測学研究室では、メタボローム分析で分析対象になりそうな代謝物について、実用的な代謝物名、IDをリスト化し、これをもとに全データを生成しています。(まだ作り立てで誤りがおおいのですが、、)ご参考にしていただけると幸いです。
https://github.com/fumiomatsuda/blankmaps/tree/master/ids

1つの代謝物を複数の分析メソッドで測定する場合

 GC-MSを用いたメタボローム分析法では、例えばTryptamineから誘導体化反応時に生成する、Tryptamine-2TMSTryptamine-3TMSの両方を測定対象としています。このように、1つの代謝物を複数の分析メソッドで測定する場合は面倒なことになります。たとえば、Tryptamine-2TMSTryptamine-3TMSを測定するGC-MSの分析メソッドの双方にTryptamineIDを付与し、Tryptamine-2TMS (KEGG:C00398)Tryptamine-3TMS (KEGG:C00398)としたとします。白地図上のTryptamineの箱(ノード)に、対応するデータが2つあるため(コンフリクト)、どちらかのデータが貼り付けられることになり、それがどちらになるかは不明です(2つのデータを足し算するような機能は搭載されていません)(図2)。
図2

このコンフリクトを避けるには、図3のような方法があります。たとえば、GC-MSの分析メソッドのうち、Tryptamine-2TMS にのみ(KEGG:C00398)を付与すると、Tryptamineの箱(ノード)にはTryptamine-2TMSのデータが書き込まれることになります(図3F)。さらに、(text:Tryptamine-2TMS.)というIDを創作し(マイIDをユーザーが作成してもOKです。また最後にピリオドを付けます)、GC-MSの分析メソッドのTryptamine-2TMS に付与します。その上で、白地図にも、Tryptamine-2TMSのデータを張り付ける専用の箱(ノード)を追加し、(text:Tryptamine-2TMS.)を付与しておきます(図3F)。このような作業を行うと、Tryptamine-2TMSTryptamine-3TMSの定量データを別の箱(ノード)に書き込み、簡単に比較できるようになります(図3)。SBmap08, SBmap09は島津製作所製GC-MS Smart Metabolites Databaseを用いて取得したデータを念頭に作成しました。


図3

0 件のコメント:

コメントを投稿