2015年6月28日日曜日

イノベーション

イノベーションって最近よく聞きます。日本語に訳すと「すごい」ですかね。イノベーションを起こす部下がほしい、あるいは育てたい、自分が率いる組織でイノベーションを起こすにはどうしればいいのかという話はいっぱいあります。ビジョンとか、融合、とか、風通しのいい組織とかですね。また、誰がどんなイノベーションを起こした(ジョブスはこうこうしてiPhoneがどうした)という実例にも事欠きません。そんな中で内田樹の「私家版・ユダヤ文化論」の終章は「イノベーションとはどんな人がおこすのか」について考察した珍しい論考です。本論における内田樹の議論はなかなかにまとめにくいのですが、文章を引用、改変しつつまとめると、

  • (ノーベル賞受賞や哲学者、芸術家のリストを見るに)ユダヤ人たちは多くの領域でイノベーションを担ってきた。
  • ユダヤ人たちが民族的な規模で開発することに成功したのは「自分が判断するときに依拠している判断枠組みそのものを懐疑する、自分が自己同一的に自分であるという自同律に不快を関知する(今をつくりかえてしまうよりよい何かがあると考え、そのために自分自身の限界を超えようとする)」能力である。イノベーションとはそういうことができる人によって担われる。
  • これはユダヤ教における特異な時間感覚に起因するらしい。
  • 「私はこれまでずっとここにいたし、これからもここにいる生得権利を有している」のではなく、「私は遅れてここにやってきたので、<この場所に受け容れられるもの>であることをその行動を通じて証明して見せなければならない」と考えるところから上記のようなイノベーティブな能力が生まれる。
  • 別の言い方をすると、「すでに存在するもの」の上に「これから存在するもの」を時系列に沿って積み重ねていこうとする思考ではなく、「これから存在せねばならぬもの(イノベーション)」を基礎づけるために「いまだ存在したことのないもの」を時間的に遡行して創造的な起点に措定しようとする思考がイノベーションを生む。
  • 私は遅れてここにやってきた、と考えることがイノベーションの起点である。これは善をめぐるアクロバティックな思考に由来する。
  • 私が過去に犯した罪について、神への恐れ、神の下すであろう厳正な裁きの予感が私を善に導くことはない。それは善ではなく恐怖であり、外部にある戒律に盲従して、処罰を免れようとする「幼児」である。
  • 自らの良心に基づいて善を指向する成熟した「大人」となるには、善への指向は私の内部に根拠を有するものでなくてはならない。それにはこう考えるしかない。人間はまず何かをして、それについて有責なのではない。人間はあらゆる行動に先んじて、私は自分の犯していない罪についてすでに有責なのである。「自分の犯していない罪」とは決してあってはならないことであるが、私の善性を基礎づけるために根源的な罪に関わる偽りの記憶を私は進んで引き受けなくてならない。「自分の犯していない罪」について有責であると認める、いいかえると、私は現在に対して返さなくてはならない借りがある。私は借りを返すためになにかしなくてはならない宿命を持つ。と考えることが善の起点であり、イノベーションの起点にもなる。
  • そして、善が存在するには。人間は「一度も存在したことがない過去」を自分の現在「より前」に擬制的に措定しなくてはならない。そのためにこそ、そのつどすでに取り返しがつかないほど遅れて到来したものとしておのれを位置づけなくてはならない。

ね。ややこしいでしょ。ですが、この枠組みでイノベーションに関するほとんどのネタを取り扱えますよね。

  • 異分野融合=>私は遅れてここにやってきた、場所を人工的に作る。
  • ビジョン=>宿命。あるいは「自分の犯していない罪」
  • 風通しのいい組織=>大人の組織

ってなぐあいです。
非イノベーティブな振る舞いも簡単に判定できます。

  • 「私はこれまでずっとここにいたし、これからもここにいる生得権利を有している」=>地元愛ヤンキー、ネタ大好き大阪人
  • 「すでに存在するもの」の上に「これから存在するもの」を時系列に沿って積み重ねていこうとする=>受験勉強あるいは、出口のみえなくなった応用研究
  • 「幼児」=>いわゆるリーダー

またイノベーティブの人材の育て方の指針も得られます。

  • 私は遅れてここにやってきた=>転校させる。あるいは、ルールのわかりにくい、複数のルールが併存するわかりにくい空間にかえる。
  • 「いまだ存在したことのないもの」を時間的に遡行して創造的な起点にする=>運命(さだめ)論教育(君が今ここにいるのも、誰かに出会うのも宿命あるいは運命であるのではやくあきらめたもんが勝ちである)
  • 善への指向は私の内部に根拠を有するものでなくてはならない=>なにかは自分で学ぶものだ。

ものすごく使える論考ですので、イノベーションに興味のある方はぜひ。

2015年6月17日水曜日

「正しく」読もうとしないこと

 システム生物学が、データの背後にある事実に関するお話を作る作業であるとするなら、サイエンスという小さな枠を超えたいろんな観点からその作業について吟味できるようになるでしょう。内田樹は「映画の構造分析」において数多くの吟味ポイントを示唆してくれています。例えばわれわれはデータの何かを見落とすことがあります。引用します。

 無知というのはなにかを「うっかり見落とす」ことではなく、何かを「見つめ過ぎて」いるせいで、それ以外のものを見ない状態のことです。それは不注意ではなくて、むしろ過度の集中と固執の効果なのです。(略)。
 私たちは何かを見落とすのは、不注意や怠惰のせいではありません。「見落とすこと」を欲望しているからです。そして「「見落とすこと」を自分は欲望している」という事実を見落としているからです。
 私たちが隠れている何かを組織的に見落とすのは、抑圧の効果なのです。
 ですから抑圧の効果を逃れるただ一つの方法は、自分の目に「ありのままの現実」として映現する風景は、私たちが何かから組織的に目を逸らしていることによって成立しているという事実をいついかなるときも忘れないこと、それだけです。 (「映画の構造分析」p116-7、文春文庫)

 私たちはなにかいつもかならず見落としているわけです。見落としているものを見つけるのは容易ではありませんが、おそらくそれは(なにしろ見落とすことを欲望するくらいのことですから)いやな感じの、目を背けたくなるような、できれば避けて通りたい何かとして見つかるはずです。

そして「正しくデータを読みたい」という気持ちこそが見落としを生む。のです。引用を続けます。

 ですから、今私たちがしているような「謎解き」もまた常に「(私はデータの背後にある真実を知りたいという)欲望の見落とし」の問題と背中合わせであることを忘れてはなりません。謎解きとか解釈とか推理というのは、要するに「お話」を一つつくることです。その解釈はおのれの欲望が生み出した「お話」です。そして、自分が作り出した「お話」を私たちは実に簡単に現実と錯認してしまうのです。
 分析者=解釈者は「病識」を持ち続けなくてはなりません。「私の解釈」は「私の欲望」の関数であり、その欲望は他人の目には筒抜けであり、その事実から私は全力を挙げて目を逸らそうとしている、ということを意識し続けていなければなりません。(略)
 解釈者の仕事は「パスする」ことです。(略)。「できるだけ多様な次なる解釈の起点になりうるような解釈」こそが「よいパス」なのです。(「映画の構造分析」p144-6、文春文庫)

 できるだけ多様な次なる解釈の起点になりうるような、大規模データの解釈、という読み筋があるとすれば、それは「どきどきわくわくするようなお話」となると思われます。となるとデータを読むコツはまず第一に「正しく」読もうとしないこと。次いで「おもしろい話をつくろうとする」ことと言える、のかもしれません。


2015年6月15日月曜日

先生はえらい

要約の達人2人目は(以下敬称略)内田樹です。内田樹は要約できないことを説明するプロです。世の中の大事なことのほとんどはもちろんそんなに簡単に要約なんかできはしません。名著「先生はえらい」において、内田樹はえらい先生に出会うことの意義と効能について中学生向けという制約をむしろうまく使って説明しながら、例え話(有名なF1ドライバーと自動車教習所の教官の違い)、脱線(アマゾンの無言交易とか、、)などを積み重ねることで、わからないはずの話をわかった気にさせる荒技を繰り出して、えらい先生に出会ったときの自分を前倒して一瞬体験させることに成功しています。すごいです。この本の内容は、一言でいえば「先生はえらい」ですので、要約すればするほどわけがわからなくなる話なのですが、自分がそのことにいままで気づいていなかったことに気づくのは一瞬なんです。あっそっか、そういうことね。なんですが、それを気づいていない人に理屈で教えることはできません。ただ多くの先生と呼ばれる人たちは、それだけでいいから気づいてもらいたく、わけのわからない話を学生にすることになるわけであります。ですので、清水研の学生は全員読むように。

ノンターゲットメタボローム分析の課題その12 QC法以外の補正法の検討

 LCMSを用いたノンターゲット型のメタボローム分析で、大規模な解析を行なうには、強度値を補正する手法が必要です。QC法はもっとも有力な方法として期待されます。pooled QCサンプルの作成するときに、全サンプルの1-2%程度以下のサンプルにのみ含まれるレアな代謝物は大希釈されるので、QCサンプルから検出できなくなってしまう可能性があります。このように、QC法は完璧ではありません。
 QC法では補正できないMetabolite featureを扱う他の方法が必要になるでしょう。2006年に作成した分析法(Matsuda et al. Plant J (2009)57, 555-577)では、イオン化効率、検出器感度の変化を追跡するための内部標準物質の設定に取り組みました。種々の安価、安定な非天然物から、実サンプルに添加してもサンプルマトリクスからの影響(イオンサプレッション)を受けにくいものを探索しました。その結果、d-カンファースルホン酸とリドカインを強度値補正用内部標準物質として有用なことを見いだしました。メタボロームデータ中の、強度値補正用内部標準物質の強度値にはイオンサプレッションの影響はない。と期待できます。そこで、全Metabolite featureの強度値を同一分析(インジェクション)の内部標準物質の強度値で除算するという補正を行いました。本法でもある程度補正がかけられることがわかっています。
 QC法ではイオン化効率、検出器感度の経時変化をMetabolite feature毎にそれぞれ補正することができる点が長所です。したがって、イオン化まわりのパラメータを途中変更しても、質量分析装置に個体差があっても、さらには質量分析装置の機種が異なっても、直近に取得したQCデータから、強度値を正しく補正できると考えられます。一方、内部標準物質法は全Metabolite featureのイオン化効率、検出器感度は、強度値補正用内部標準物質と同様に変化するという仮定に基づいています。しかし、イオン源の雰囲気、イオン化まわりのパラメータの変化や、装置の汚れ具合がイオン化効率、検出器感度に及ぼす影響は化合物ごとにばらばらになると考えられます。実際、本法よりQC法のほうがよい補正結果となることも判明しています(Front Genet. 2015;5:471)。つまり、本法は、QC法が適用できないときのバックアップとして位置づけるべきだろう。また、全スタディを比較する基準としていろいろ役立ちそうなので、検出器感度補正用内部標準物質の種類および濃度を、全研究室で標準化し、全サンプルに添加するとよいと思われます。

2015年6月13日土曜日

ノンターゲットメタボローム分析の課題その11 Metabolite featureの強度値にかんする問題点のまとめ

 LCMSをもちいたノンターゲット型のメタボローム分析を行なうとします。QC法で強度補正を行なうには、QCサンプルを作成する必要があります。どうやら、QCサンプルの設定がQC法の成否を分ける鍵になりそうです。

  • 1つのスタディ内でQC法で正確に補正可能なMetabolite featureとは、各スタディごとに作成するpooled QCから比較的高強度に検出可能なものに限らる。
  • あるスタディを行い、データ処理を行った結果、6000個のMetabolite featureが検出されたとする(全Metabolite featureとよぶ)。これは、少数、あるいは1サンプルからのみ検出されるような、レアなMetabolite featureもすべて含んでいる。
  • pooledQCを作成するとき、レアなMetabolite featureは大希釈されてしまうため検出限界以下になる場合もあり得る。
  • このスタディ用に作成したpooled QCから5950個のMetabolite featureが検出された場合、残り50個のMetabolite featureの強度値補正ができないことになる。
  • さらに、レアなMetabolite featureの割合が多く。pooled QCから3000個のMetabolite featureしか検出できなかった場合、残り3000個分のデータをムダになる。これを避けるには、pooled QC の作成法を工夫するか、QC法以外の強度値補正法が必要となる。
  • この見極めを行うためにも、血清、血漿、尿サンプルについて、1スタディ内のサンプル間でMetabolite feature強度にどの程度ばらつきがあるのか、をまず検討するべきである。
  • 研究室内で大規模統合解析を行う場合は、global QCで比較的高強度に検出可能なものが補正の対象となる。上記と同じ理由で、global QCの設定を誤ると、強度値を補正可能なMetabolite featureの数が減少してしまう(網羅性が損なわれる)。
  • 各スタディから検出された全Metabolite featureのうち、global QCで補正可能なものの割合が、どのくらいになるのかを事前に検討し、極力カバレッジが広いglobal QCサンプルを利用するべきだろう。
  • さらに上位のmaster QCを設定する場合も、同様の検討が必要になる。


2015年6月12日金曜日

清水研雑誌会6/12

今日の雑誌会の一人目はD1和田君のデビュー戦です。紹介した論文は Fu et al. Metabolic flux analysis of Escherichia coli MG1655 under octanoic acid (C8) stress. AMB 2015, 99:4397-408です。再生可能資源からバイオ生産したい化合物の中には、その生産宿主(微生物)にとって毒になるものも多いです。たとえばエタノールは消毒につかわれる溶剤ですので、普通の微生物は培地に数%のエタノールがふくまれると生育できません。酵母がエタノールに強いという性質をうまく使ってお酒をつくっています。この研究ではオクタン酸 (C8の直鎖カルボン酸) によって生育が阻害されている大腸菌の代謝で何が起きているのかを代謝フラックス解析によって調べたという論文です。その結果TCAサイクルの代謝フラックスが38%減少していること、NADHの再生量が25%減少していることを突き止めました。このように細胞内代謝経路の活性をダイレクトに調べることができる点が代謝フラックス解析の強力な点です。そこから細胞内の酸化還元バランスや、エネルギー状態についても議論できます。これは他の手法(遺伝子発現、代謝物蓄積量の計測)からはなかなか得ることのできない情報で、代謝について本質的な理解を行なう上でのファイナルアンサー、あるいは鍵となる技術です。清水研ではこの代謝フラックス解析の技術開発を行なっており、和田君もこの春から清水研に加入して代謝フラックス解析研究をがんばっています。代謝フラックス解析の専門家集団らしく、本論文についてもフラックス解析法の詳細について活発な議論が行なわれました。
二人目は清水研の若頭D2岡橋君で、 Webb et al. Structures of human phosphofructokinase-1 and atomic basis of cancer-associated mutations. Nature 2015, doi:10.1038/nature14405  です。われわれは、代謝の流れや代謝物の蓄積量が代謝機能とどのように関連しているのかに関心を持っていますが、代謝反応の触媒を担うのは酵素タンパクであり、その機能はタンパクの高次構造とつよく関連しています。ホスホフルクトキナーゼ (PFK)は解糖系の上流の制御を担う重要な酵素です。また、がん化した細胞ではPFKをコードする遺伝子に共通の変異があることがしられており、がんとの関連という観点からも興味深い酵素です。本研究ではヒトPFKの4量体の結晶構造を解き、構造とがん化にかかわる変異との関連について議論しています。代謝を理解するには、代謝を眺めるときの範囲を、全代謝反応レベルで広く見たり、1タンパク、1遺伝子レベルまで狭くみたり視野を自在に拡大縮小することが大事だと改めて感じさせてくれたイイ発表でした。

2015年6月11日木曜日

この物語を7文字で要約せよ。

大規模データの解析には、まず、お話を要約するスキルが重要みたいです。要約の達人といえば(以下敬称略)、山形浩生と内田樹でしょう。二人の東大出身者らしい天井知らずな頭の良さにしびれてみましょう。今回取り上げます山形浩生は「要するに」とか「雇用と利子とお金の一般理論の要約」などを書いちゃうくらい、要約大好きな、ひとです。最近はトマ・ピケティの「21世紀の資本」を翻訳し、そのついでに無精なわれわれにこの大著を要約、解説したあんちょこまでつくって無料で公開してくれています。ありがたや。このあんちょこをみると

  • 優先順位を階層ではっきり示す。
  • うまく要約できれば1-2行の箇条書きになる
  • 正確さと難しい言葉づかいは関係しない。

点などがが我々初心者の学習ポイントでしょうか。気楽に書いているように見えますが、実際に作るのは相当の技が要る点にも注意しましょう。ちなみに本記事のタイトルの答えは「いろいろあった」(国語入試問題必勝法より)であります。受験で要約問題など国語が苦手だった人は必ず読みましょう。清水研文庫にもそのうち入れておきます。

ノンターゲットメタボローム分析の課題その10 QC法で正確に補正できるMetabolite featureの範囲

 LCMSを用いたノンターゲット型のメタボローム分析で大規模な解析を行なうには、検出した代謝物シグナルの強度値を補正する必要があります。そこで、
・尿の分析なら代表的な尿サンプルを標準物質混合液とみなす(QCサンプル)。
・QCサンプルの分析結果を外部検量線として、QCサンプルに対する強度比として代謝物濃度を測定する。
・QCサンプルで作成した検量線の寿命は数時間である。検量線を数時間おきに引き直し、さらにその経時変化も加味する。
という手法が編み出されました。
 QC法で正確に補正可能なMetabolite featureとは、全サンプルから比較的高強度に検出されるMetabolite featureです。多検体の分析をおこなうと質量分析装置の検出感度が低下するため、Metabolite featureの強度値も経時的に減少してしまいます。そこで、QCサンプルの強度値情報を用いて、実サンプルの強度値も補正するわけです。QCサンプルを6-12回に1回分析し、QCサンプルの強度値情報の経時変化から、LOESS補間法などで検量線の基準線を作成します。この線を基準として、実サンプルの強度補正を行う手法が提案されています(Nature protocol(2011) 6, 1060など)。実サンプルの分析にQCサンプルを挟む頻度などのランオーダーを標準化することで、データ処理の効率、精度が向上すると期待されます。
 しかし、この方法はかなり強い補正をかけるので、明らかな問題点もあります。もし、実サンプルのMetabolite featureの強度値が検出限界ぎりぎりな場合、分析が進むと感度が下がって、下限値に到達するでしょう。以降は欠損値としてノイズレベルが強度値と見なされることになります。そこで、QCサンプルで実サンプルの強度値を補正すると、補正に起因するゆがみが生じてしまいます。このゆがみはデータ解析に悪影響を与えます(そういうトホホな実例なら任せてください。[例]シロイヌナズナメタボロームデータをもちいてMetabolite feature間のスピアマンの順位相関係数を計算したところ、多数のMetabolite feature間に明確なクラスターが観察された。これは、強度値補正に起因するゆがみの結果生じた擬陽性の相関だった。)。とくに、ノンパラメトリックな解析(順位相関など)に深刻な影響を及ぼすようです。メタボロームデータ中のMetabolite featureは強度値が検出限界に近い場合が多いと予想されます。QC法による補正はゆがみの原因にもなり得るんだと言う点には注意が必要でしょう。


2015年6月5日金曜日

清水研雑誌会6/5

本日の雑誌会の一人目はB4の後野君で Binder et al. A high-throughput approach to identify genomic variants of bacterial metabolite producers at the single-cell level. Genome Biology 2012, 13:R40 です。有用物質を効率的に生産する微生物を作り出すには、設計図を書き、ねらいを定めて合理的に作るアプローチと、ゲノムへランダムに変異を導入し、そのなかからいいものを選ぶ。という二つのアプローチがあります。前者(若紫系)はねらい通りに行けばすごいのですが、ねらいをはずすと大変なうえ、ねらい以外の思いがけない大当たりにぶつかることができません。後者(ナンパ系)は思わぬ大当たりを拾える可能性が高いのですが、大当たりを拾うには、微生物1細胞ごとの生産能力を評価する大変な手間がかかります。そこで、微生物細胞内の目的物質濃度が高くなると、蛍光を発するようなセンサーを微生物に組み込んでおけばいいじゃん。というアイデアを形にしたのがこの論文です。細胞内リジン濃度が高くなると蛍光タンパクを発現するようにしたプラスミドをコリネ菌に形質転換します。この株にランダムに変異を導入した細胞集団から、リジン高生産変異体を蛍光強度を指標としてセルソーターで選び出し、既知以外の変異を持つ株のリシーケンスを行なって、新規の有用変異を見つけ出しています。質疑応答ではリジンセンサーのメカニズムの詳細と、この新しい変異は既知ものと比べてどうなの?等が出ました。
二人目はB4の渡辺君で Xu et al. Improving fatty acids production by engineering dynamic pathway regulation and metabolic control. PNAS  2014 111(31):11299-304. です。代謝中間体の細胞内濃度を検出して、細胞内濃度が低いときは上流の反応をOF,下流をOFF,濃度が高いときは上流の反応をOFF,下流をONにできれば効率が良さそう、ですよね。そこで、脂肪酸生合成の鍵中間体のマロニルCoAのセンサーとなるにfapRという転写因子をもちいた回路を作成しています。これがうまくいって脂肪酸生産量が3倍くらい向上しています。さらに、細胞内マロニル酸濃度が時間的に増減、すなわち振動する。といっています。しかし、なんでうまく動くんでしょう?質問ではD2岡橋くんから、マロニルCoAのセンサーがONになると、酵素タンパクの発現量があがる。というのはわかるけど、高かった発現量が下がるって何が起きているの?というナイスな質問がありました。さすがです。また、振動するかしないかは3回生でならった制御理論でわかるはずという指摘もありました。発表者は二人とも落ち着いたイケメン感あふれるプレゼンで安心して聞けました。