2015年5月14日木曜日

ノンターゲットメタボローム分析の課題その7 Metabolite featureの強度値の算出方法

LC-MSメタボロミクスでは、Metabolite featureの強度値としてピーク面積が一般に利用されています。ピークを波形処理して開始点および終了点を認識し、面積を計算する作業をフルオートで実施する必要があります。しかし、特にシグナルが近接する、弱い、形状が悪い場合などに面積計算のやり方次第で、値がおおきくばらつく場合があります。

ピーク波形処理を確認しましょう」で、博士が、「線の引き方でこんなに面積がちがうぞ!」とおっしゃっておられますが、ま、そういうことです。


問題は、ピーク面積を計算する際の線の引き方に「正解」がない、点にあります。また、さまざまな波形処理アルゴリズムが実装されているが、それぞれに癖があり、完璧なものは存在していません。さらに、波形処理の結果が「怪しい(要確認)」Metabolite featureはピーク面積計算結果からだけでは、判定できません。そこで、通常のターゲット分析では、ピーク波形処理結果を目で(人間のです。念のため)確認し、手作業での修正が行われています。しかし、個々人のことなる基準が反映されるため再現性が低いです(俺メタボロミクス)。また、メタボローム分析の実際において、検出した全Metabolite featureの確認作業は現実的ではないでしょう(そんな仕事。。。)。したがって堅牢なピーク波形処理法を確立し、品質管理(QC)法を標準化しない限り、自信をもってメタボロームデータの解析を進めることができません。
たとえば、以前行なった、メタボロームGWAS解析で、適当に処理したデータで解析したところ、検出されたQTLはピーク誤認識の結果生じた擬陽性でした。データ処理結果を批判的に検討し直す必要がありました。

解決案は以下の5つくらいでしょうか。
1.ピーク高を使う:2006年に作成したノンターゲット分析法(Matsuda et al. Plant J (2009)57, 555-577)では、データ処理にMetalignを用い、Metabolite featureの強度値の指標としてピーク高をもちいました。ピーク高はピーク面積に比べ精度が低いが、ピーク波形処理時に起きる「大失敗」が起こりにくいのです。
2.波形処理が怪しいMetabolite featureの検出1:ピーク面積計算結果から、波形処理が怪しいMetabolite featureを抽出できればよいです。1つのサンプルを複数回分析し、あるMetabolite featureの面積値や保持時間が大きくばらつく場合、ピーク波形処理に問題がある可能性が高いですよね。しかし分析数が倍増するため大規模スタディでは現実的ではないでしょう。
3.波形処理が怪しいMetabolite featureの検出2:メタボロームデータを用いた解析では、多数のメタボロームデータから生成したデータマトリクスに含まれる、Metabolite featureから、品質の悪いものを抽出できればよいとおもいます。波形処理結果をスコア化し、理想的な状態からの乖離を検出できればQCの指標として使えそうです。MRMPROBS(Anal Chem. 2013 85(10):5191-9.)はそのような試みの一つです。
4.確認イオンの導入:これまでの経験上、波形処理の課題の多くは確認イオンを導入すると改善できる場合が多いです。ノンターゲット解析ですべてのMetabolite featureに確認イオンを定義できるかはわかりませんが、インソースCIDで生じたフラグメントイオン、多価イオン、あるいはMSEで生じるフラグメントイオンなどを用いることが可能かもしれません。
5.複数の波形処理法を用いる:単独の波形処理法で完璧を目指すところに無理があるんじゃないでしょうか?そこで原理の異なる波形処理法、同一波形処理法だが内部パラメーターが違うものなどを、たとえば100種用意する。1つのMetabolite featureを100種の波形処理法で処理し、ピーク面積値を100個得る。えられた100個の面積値のメジアンはよいピーク面積の推定値となり得るだろう。また、ピーク面積値が100個波形処理法間で大きくばらつくMetabolite featureは、波形処理結果の品質が低い可能性が高い。このように、必要とされているのは、堅牢なピーク面積の決定法と、ピーク面積処理結果のQAです。以前紹介した zigzag index のようなアイデアをどんどん進めていく必要があります。

0 件のコメント:

コメントを投稿