2017年7月25日火曜日

人工的なマススペクトル

発見型プロテオミクスの成功に貢献した技術基盤の一つが、ペプチドのフラグメンテーションルールに基づく、人工的なライブラリの作成法にあることは間違いありません。したがって、人工的なライブラリの作成技術が今後のマススペクトルデータを用いた代謝物構造推定に重要な役割を果たすとおもわれます。ただし、ペプチドのフラグメンテーションルールのような、簡単なルールですむ化合物がリピド以外にあるのかはわかっていません。リピドが成功した理由は、アグリコンに相当する主骨格部分(=フラグメンテーションが複雑)がない点にあります。

プロテオミクスから学ぶべきはもう一つのポイントは、同定結果の品質管理法です。初期プロテオミクスでは、緩めの閾値で同定数を競うナンバーゲームとなり、後に、そのほとんどが誤同定だったことが明らかになっています。逆配列のデコイ(偽)データベースを利用した誤同定率の推定法が開発され、発見型プロテオミクスのもっとも重要な技術基盤の一つとなっています。いまのところ、代謝物のマススペクトルのデコイデータベースの作成法や、マススペクトルの類似性のp値の計算法など、品質管理が可能な検索方法には大きな進展がありません。このような研究開発の基盤として、MassBankデータセットが果たす役割は大きいと思います。
したがって、人工的なライブラリを作成は、同定結果の品質管理法をどうするのかという問題とセットになっており、むしろ後者のほうが重要であると考えます。

他にも人工的なライブラリを作成する場合

  • 化合物IDも一般名もない化合物の人工マススペクトルデータにヒットしたとして、その化合物を何と呼べばいいのか? 
  • 異なる構造の化合物から、同じ人工スペクトルが生成しうる。そんなデータにヒットしたとして、その化合物を何と呼べばいいのか? 

などの論点があります。楽しい話題ですが、またの機会を待ちたいと思います。

0 件のコメント:

コメントを投稿