プロテオミクスから学ぶべきはもう一つのポイントは、同定結果の品質管理法です。初期プロテオミクスでは、緩めの閾値で同定数を競うナンバーゲームとなり、後に、そのほとんどが誤同定だったことが明らかになっています。逆配列のデコイ(偽)データベースを利用した誤同定率の推定法が開発され、発見型プロテオミクスのもっとも重要な技術基盤の一つとなっています。いまのところ、代謝物のマススペクトルのデコイデータベースの作成法や、マススペクトルの類似性のp値の計算法など、品質管理が可能な検索方法には大きな進展がありません。このような研究開発の基盤として、MassBankデータセットが果たす役割は大きいと思います。
したがって、人工的なライブラリを作成は、同定結果の品質管理法をどうするのかという問題とセットになっており、むしろ後者のほうが重要であると考えます。
他にも人工的なライブラリを作成する場合
- 化合物IDも一般名もない化合物の人工マススペクトルデータにヒットしたとして、その化合物を何と呼べばいいのか?
- 異なる構造の化合物から、同じ人工スペクトルが生成しうる。そんなデータにヒットしたとして、その化合物を何と呼べばいいのか?
などの論点があります。楽しい話題ですが、またの機会を待ちたいと思います。
0 件のコメント:
コメントを投稿