2015年7月3日金曜日

ノンターゲットメタボローム分析の課題その13 Metabolite featureの構造関連情報の記述法

 尿、血清サンプルのノンターゲットメタボロームデータ中に観察されるMetabolite featureには、化合物情報、あるいは構造関連情報が付与されます。アノテーションといいます。このピークはトリプトファンのピークです。というような具合ですね。
 たとえば前述のコンセンサスMetabolite FeatureリストでMFID0001と定義されている、保持時間2.1分、m/z 205.15に観察される、MS/MSスペクトルMS2をもつMetabolite featureがトリプトファンであると同定され、Known-Knownになったとします。
 このアノテーション情報をもとに、パスウェイへの投影とか、他のオミクス情報と融合して解析を行いたくなるわけですが、そのとき、MFID0001(保持時間 2.1 min, m/z 205.15, MS/MS MS2) になんて書けばいいでしょうか?トリプトファン、Trp?, tryptophan?, CAS?InChIKey?のどれがいいでしょうか?これが共通化されないと、統合解析なんて夢のまた夢です。でも、標準化はこれまで(努力はされましたが)ほとんど実現していません。なぜかというと、アノテーション法に以下のような技術的な課題があり、さらに問題の所在そのものがよく認識されていないからです。


  1. 化合物名をどのように記述するか?
  2. 部分同定しかできていないMetabolite featureをどのように記述するか?
  3. 化合物オントロジーシステムの管理
  4. 「同定した」とみなす基準とはなにか?コンセンサスをどのようにとるか?


以下何回かに分けてこれらの点について議論します。

0 件のコメント:

コメントを投稿