2017年7月2日日曜日

AIでオープンイノベーションにはビッグデータ自作


最近、「これAIでなんとなんない?オープンイノベーションとかできそうだし。」という真剣なお話をうかがうことがあります。

 AIにどんな質問に答えてほしいの?といえば、もちろん、どんな質問をしたらいいのか教えてくれるAIなんですが、もうすこしかみ砕くと、もうかる事業はなにかとか、運命のヒトにいつ会えるのかとか、Natureに載る研究テーマは何かとかを質問したいわけです。
 巷の議論では、古今東西のなんでも知っているスーパー物知りさんAI「聖徳太子?」「ホームズの相方?」が一人いて、その人に聞けばなんでも教えてくれる。というような構図がなんとなく垣間見られます。

この構図をすすめていくと
1.スーパー物知りさんAI「聖徳太子」を作る技術、データが特定企業に独占されているため、「聖徳太子」に質問する権利が高価である。

2.「聖徳太子」はみなに同じことを教えてくれるため、聖徳太子のお答えから圧倒的にあたらしいイノベーションor知財性が出るような気がしない。

3.そこで、「自分たちしか知らない知識データ」を「聖徳太子」にオプションで付けたくなるが、「聖徳太子」を作る技術を利用する権利も独占なため高価になる。


  • でもGoogleがそのうちタダで検索できる「聖徳太子」を作ってくれるはずなので心配しなくていい。


4.通常は、質問したくなる時というのは、なにか調べ物をしているときで、「何か」について調べているはずです。専門的なことを調べている場合、質問相手は「聖徳太子」である必要はなく、その道の専門家な小さいAIでよいかもしれない。

5.「専門家」に質問したい人は少ないので、AI作成は独自に行う必要があるだろう。

6.もし自分好みの「専門家」を作ることができて、質問にすごいいいお返事をしだした場合、その専門家AIが公開されることはないだろう。


  • 専門家AIを作成する技術はオープンになる可能性があるが、役に立つ専門家AIが表に出ることないかもしれない。
  • あるいは高価な専門家AIに質問する権利を販売する。というようなビジネスモデルがありえるかもしれない。


7.知識ベースのエキスパートシステムの場合、質問が形式化できるだろう。おそらく

  • ○○と××と△△の共通点あるいは黒幕は誰?(AKB48, NMB48, HKT48の共通点は?=>女性アイドルグループ、黒幕は秋元康)
  • ○○と××といえばなに?(NMB48で結婚といえば=>須藤など)

というものになると思われる。基本的にはバスケット解析?Word2Vecですな。

8.自分好みの「マイ専門家AI」が作れるかどうかは、教える知識に依存する。ここでいう知識とは、概念と概念との関係性とその強度を定義したグラフ(知識グラフ=ポンチ絵)のことらしい。で、そのグラフとは、テキストマイニングすればつくれるんじゃない?ということになっている。となると、

  • 自分たちしかもっていない知識や知見があること
  • それをテキストデータとして電子化し、アーカイブ化していること

が重要になる。さらに、

  • 報告書の要約に、「知識グラフ=ポンチ絵」そのものを書かせる。

とテキストマイニングをしなくて済むのだろうか?セマンティックWEB??

9.知識グラフを自動で作るために、テキストマイニングが必要なのであって、知識グラフそのものは手作業でキュレーションしたほうが精度が高くなりだろう。
となると

  • Cellの内容を知識グラフ化したデータを高精度にキュレーションしたもの
  • Wikipediaの知識を文章を知識グラフ化したデータを高精度にキュレーションしたもの

などは、「マイ専門家AI」を作成する際の、基礎コンポーネントになりえるため、高い価値があるかもしれない。

10.いずれにせよ、AIを作る使う技術の共通インフラ化が進み、「マイ専門家AI」を手軽に作れる時代がすぐ来るような気がする。となると、電子化した独自データの質、量で勝負が決するのは間違いない。またそういうデータは門外不出であるとおもわれるので、自力で作成するしかない。

というわけで、「これAIでなんとなんない?オープンイノベーションとかできそうだし。」というお話に対するコメントは


  • AIに質問したいことを形式化しておくべきだ。
  • AIを作る、使う技術は(すぐ)共通インフラ化するだろう。
  • その技術で作ったAIそのものはオープンにはたぶんならないので、自力で作る必要があり、それには、ビッグデータをお金で買うか、自前で集める必要がある。
  • ビッグデータをとる技術もオープンイノベーションの領域になるかも。
  • データは現場で生み出されるので、とにかく工場にあるありとあらゆるものにセンサーを付け、事務所、実験室の書類、ノートも電子化して記録して、取っておくことが今できる一番いいとりくみである。


ということで、ポイントとなるキーワードは「センサー」「記録魔」「ライフログ」となるみたいであります。ビッグデータの自作ですね。







0 件のコメント:

コメントを投稿