2015年4月14日火曜日

保持時間の補正法

LC-MSを用いたノンターゲット型のメタボローム分析では、複数のメタボローム分析生データの間で、同じ保持時間、同じ質量電荷比 (m/z) に検出された代謝物由来のシグナル(ピーク)を「同じ代謝物のピーク」と認識します。ですので、あるピークの保持時間、質量電荷比が常に同じでないと困ったことになります。質量電荷比 (m/z) はほとんど一定に保つことは可能ですが、ピークの保持時間はLCの条件およびコンディションに依存しているため、どうしても前後に変動してしまいます。

このままだと、ピークの認識ミスにつながるので(同じ代謝物を別のものだと勘違いしたり、異なる代謝物を同じものだと勘違いしたりします)、保持時間を補正してぴったりそろうようにします。
保持時間の補正法には大きく分けて2種類の考え方があります。1つ目は、
・各メタボローム分析生データ毎にピークピッキングを行う。
・ある基準となるデータのピークリストにもっともぴったり重なるように、各データのピークリストの保持時間を補正する。
というものです。Lange et al.Critical assessment of alignment procedures for LC-MS proteomics and metabolomics measurements. BMC Bioinformatics (2008), 9:375 はこの方法で補正を行うソフトウェア、msInspect, MZmine, XCMSなどのパフォーマンスを比べたものです。著者らはソフトウェア間のパフォーマンスの差より、パラメーターのチューニングが大事だと結論しています。どういうことかなーと論文に示された結果をみても、この方法、どのソフトでもあんまりうまくいっていないみたいなんですよね。なので、パラメーターのチューニングが大事だという結論になるみたいです。
そこで、2つ目の方法です。現在利用可能なピークピッキングソフトウェアはおおよそこちらで保持時間補正を行っております。
・ある基準メタボローム分析生データにもっともぴったり重なるように、各メタボローム分析生データのクロマトグラムを前後ずらして補正する。
・補正後のメタボローム分析生データ毎にピークピッキングを行う。
ものです。こちらの方法についての性能比較はありませんが、Vu et al.Getting Your Peaks in Line: A Review of Alignment Methods for NMR Spectral(2013) Data Metabolites 2013, 3, 259-276 はNMRのデータ処理を題材に生データの補正法をレビューしています。補正法だけで20種類くらいあるのですが、LC-MSデータの補正でよく見るのはCorrelation Optimized Warping (COW) です。私も2004年頃にLC-PDAやLC-MSのメタボロームデータの保持時間補正にCOWを活用しており、下記のような補正をパワフルに行ってくれます



では補正されるんだから保持時間のことは気にしなくてもいいのか。といえばそれは違います。これまでの経験則から申し上げますと、補正はあくまでも補正にすぎず、完璧には補正はできません。ピークの誤認識を減らすには、データ取得時の分析法を工夫し、そもそも補正をしなくてもうまくいきそうなくらい保持時間のそろったデータをとることが何よりも大事です。その上で補正をかけるとかなりうまくいくようです。

1つ目に紹介した、ピークリスト作成後の保持時間補正があまりうまくいかない。とは、異なるスタディから得られた2つのデータマトリクス(ピークリスト)の統合がうまくいかないということを意味しています。近年、ノンターゲットのメタボロームデータを1年、2年の単位でとりためて、最終的に統合して解析したいんです(臨床検体サンプルを10-20サンプルずつ適時分析して、最後にデータを統合したい)というお話をお聞きしますが、数十サンプルの分析=>データマトリクス生成=>保持時間補正によるデータマトリクスの統合という流れは技術的に難しいかもしれません。そうなりますと、全サンプルをまとめて保持時間の補正=>全部をまとめたデータマトリクスの一挙生成というワークフローになります。全サンプルをまとめた保持時間の補正を成功させるには、データの保持時間がそろっていることが上述のように大事です。つまり、長期間にわたるLC-MSの分析について、保持時間を一定に保つべく分析屋がウデを大いにふるう余地があります。保持時間がずれない分析をする心構えはまた後日議論します。

0 件のコメント:

コメントを投稿