LC-MSを用いた通常のいわゆるターゲット分析では、事前に測定対象の検出位置(保持時間、質量電荷比)を決め、検量線を作成してシグナルのレスポンスと含量との関連をつけます。ターゲット分析のデータ処理では、既知の検出位置でのシグナルの強度値を抜き出して、その値から対象化合物の試料中含量を算出することです。ターゲットを特定している限り、対象化合物数や、サンプル数がどれだけ増加しても同じアプローチでデータを処理できるんですが、ターゲット以外の成分の予期せぬ変化を見つけ出すことはできません。
一方、ノンターゲット型のメタボローム分析では得られる情報を最大化するため、分析ターゲットをあらかじめ特定せず、測定データ中に含まれるすべてのシグナルを解析対象とします。分析データ中に含まれるすべてのMetabolite Feature(ピーク)を網羅的に検出し、それらの強度を数値化してから、サンプル間で共通して存在するシグナルを認識して、データを行列化し、各サンプル中でそれぞれのシグナルが、どれくらいの強度で検出されるかを記録した表(データマトリクス)を出力します。その上で、あらかじめ標準物質をもちいて取得したスペクトラムデータと照合して、各シグナルに代謝物情報を付与していきます(アノテーション)。このようなデータ処理を行うための専用ソフトウェアが必要になりますが、すでに、データ処理ソフトウェアが複数開発、市販され (XCMS, Metalign, MZMine,
ProgenesisQI等)、それらを用いた数10から数100サンプル規模のスタディが数多く実施されてきました。
しかし、まだまだ技術的な課題が多く残されています。
- 同一データを4種の市販ソフトで解析したとき共通して検出できたMetabolite Featureは全体の7%だった(Rapid Commun Mass Spectom (2015), 29. 119)。
- データのクオリティーを評価する方法がない。
- 化合物の同定がうまくできない。
- 複数のスタディの統合が難しい。
これまで、これらの問題に関する最近の論文を紹介してきました。今後、より大規模なノンターゲットメタボローム分析を実施し、研究室間でのデータ共有していくには、何が必要なのか、どうすればいいのか考えていきます。
0 件のコメント:
コメントを投稿