最近、「これAIでなんとなんない?オープンイノベーションとかできそうだし。」という真剣なお話をうかがうことがあります。
AIにどんな質問に答えてほしいの?といえば、もちろん、どんな質問をしたらいいのか教えてくれるAIなんですが、もうすこしかみ砕くと、もうかる事業はなにかとか、運命のヒトにいつ会えるのかとか、Natureに載る研究テーマは何かとかを質問したいわけです。
巷の議論では、古今東西のなんでも知っているスーパー物知りさんAI「聖徳太子?」「ホームズの相方?」が一人いて、その人に聞けばなんでも教えてくれる。というような構図がなんとなく垣間見られます。
この構図をすすめていくと
1.スーパー物知りさんAI「聖徳太子」を作る技術、データが特定企業に独占されているため、「聖徳太子」に質問する権利が高価である。
2.「聖徳太子」はみなに同じことを教えてくれるため、聖徳太子のお答えから圧倒的にあたらしいイノベーションor知財性が出るような気がしない。
3.そこで、「自分たちしか知らない知識データ」を「聖徳太子」にオプションで付けたくなるが、「聖徳太子」を作る技術を利用する権利も独占なため高価になる。
- でもGoogleがそのうちタダで検索できる「聖徳太子」を作ってくれるはずなので心配しなくていい。
4.通常は、質問したくなる時というのは、なにか調べ物をしているときで、「何か」について調べているはずです。専門的なことを調べている場合、質問相手は「聖徳太子」である必要はなく、その道の専門家な小さいAIでよいかもしれない。
5.「専門家」に質問したい人は少ないので、AI作成は独自に行う必要があるだろう。
6.もし自分好みの「専門家」を作ることができて、質問にすごいいいお返事をしだした場合、その専門家AIが公開されることはないだろう。
- 専門家AIを作成する技術はオープンになる可能性があるが、役に立つ専門家AIが表に出ることないかもしれない。
- あるいは高価な専門家AIに質問する権利を販売する。というようなビジネスモデルがありえるかもしれない。
7.知識ベースのエキスパートシステムの場合、質問が形式化できるだろう。おそらく
- ○○と××と△△の共通点あるいは黒幕は誰?(AKB48, NMB48, HKT48の共通点は?=>女性アイドルグループ、黒幕は秋元康)
- ○○と××といえばなに?(NMB48で結婚といえば=>須藤など)
というものになると思われる。基本的にはバスケット解析?Word2Vecですな。
8.自分好みの「マイ専門家AI」が作れるかどうかは、教える知識に依存する。ここでいう知識とは、概念と概念との関係性とその強度を定義したグラフ(知識グラフ=ポンチ絵)のことらしい。で、そのグラフとは、テキストマイニングすればつくれるんじゃない?ということになっている。となると、
- 自分たちしかもっていない知識や知見があること
- それをテキストデータとして電子化し、アーカイブ化していること
が重要になる。さらに、
- 報告書の要約に、「知識グラフ=ポンチ絵」そのものを書かせる。
とテキストマイニングをしなくて済むのだろうか?セマンティックWEB??
9.知識グラフを自動で作るために、テキストマイニングが必要なのであって、知識グラフそのものは手作業でキュレーションしたほうが精度が高くなりだろう。
となると
- Cellの内容を知識グラフ化したデータを高精度にキュレーションしたもの
- Wikipediaの知識を文章を知識グラフ化したデータを高精度にキュレーションしたもの
などは、「マイ専門家AI」を作成する際の、基礎コンポーネントになりえるため、高い価値があるかもしれない。
10.いずれにせよ、AIを作る使う技術の共通インフラ化が進み、「マイ専門家AI」を手軽に作れる時代がすぐ来るような気がする。となると、電子化した独自データの質、量で勝負が決するのは間違いない。またそういうデータは門外不出であるとおもわれるので、自力で作成するしかない。
というわけで、「これAIでなんとなんない?オープンイノベーションとかできそうだし。」というお話に対するコメントは
- AIに質問したいことを形式化しておくべきだ。
- AIを作る、使う技術は(すぐ)共通インフラ化するだろう。
- その技術で作ったAIそのものはオープンにはたぶんならないので、自力で作る必要があり、それには、ビッグデータをお金で買うか、自前で集める必要がある。
- ビッグデータをとる技術もオープンイノベーションの領域になるかも。
- データは現場で生み出されるので、とにかく工場にあるありとあらゆるものにセンサーを付け、事務所、実験室の書類、ノートも電子化して記録して、取っておくことが今できる一番いいとりくみである。
ということで、ポイントとなるキーワードは「センサー」「記録魔」「ライフログ」となるみたいであります。ビッグデータの自作ですね。
0 件のコメント:
コメントを投稿