« テロリストとインターネット | メイン | 巧妙化するネット犯罪 »

質問の答え、ネット上から検索 個々の「知識倉庫」活用

日経産業新聞: [9 月 7, 2004 ]

マイクロソフトがAsk MSRという開発プロジェクトを進めている。MSRはMicrosoft Research(マイクロソフト研究所)の略で、マイクロソフトらしい直球の名前だ。「マリリンモンローはいつ生まれたのか?」といった自然文をインプットすると、インターネット上から答えを探してくる検索ツールである。

Ask MSRはこんな仕組みになっている。
1) まず、元の文章を分解し、その中の言葉を組み合わせていろいろな構文を作ってみる。機械的に行うので、間違った構文ももちろん誕生するが、「マリリンモンローが生まれたのは」という正しい構文も中には生成される。
2) 全ての構文で、インターネット上を検索する。
3) いろいろな検索結果が返ってくるが、間違った構文を含むページは少ないので、この時点で間違った構文は消えるので問題ない。また、正しい構文でも間違った記述をしたページが検索されてしまうこともある。しかし、インターネット全体を見れば、より数多くあるのは正しい答えのほう。よって「マリリンモンローが生まれたのは1926年」という正解が検索結果の上に表示される。

マイクロソフトの開発者は、「検索結果の上位3位に正解がある確率は75%」としている。試しにGoogleで「Marilyn Monroe born」という三つのキーワードで検索してみると、上位には正しい答えが記されたページが並ぶので、確かにAsk MSRは機能するだろう。

これまでも「自然文検索に正しい答えができるようにしよう」という試みはたくさんあったが、それは人工知能を利用するものだった。そして、通常その答えの源泉は、注意深く作り上げたデータベースだった。ところが、Ask MSRが利用するのは「インターネット上に圧倒的多数の人々が作り上げた知識倉庫」である。つまり、「インターネット上には、世界中の大勢の人たちが情報を掲載している。ただ、そのほとんどは無名の人たちによるものだし、真偽のほども定かではない。しかしその量の膨大さから、全体としてみれば、より正しく有益な情報が浮かび上がってくる」という事実の活用だ。

最近では、ごく普通の個人でも簡単にインターネット上に自分のホームページを持つことが可能になった。中でも毎日のようにさまざまな出来事を書きとめるものはブログと呼ばれるが、ブログはその作成の簡単さもあって、爆発的に増加しており、私自身も2年近く続けている。私のブログでは読んだ人は誰でも自由にコメントが追加できる仕組みになっているのだが、いつも感心するのは、どんな質問を投げかけても、必ずといっていいほど誰かが答えを返してくれることだ。また、私が書いた内容に関する興味深い情報を教えてくれる人もいる。

IT関連で著名なコラムニストのダン・ギルモアもブログを持っているが、彼は昨年、自身の書く本の骨子をブログで公開、さまざまな人からのフィードバックを受けた上で最終稿に持ち込むという手法で執筆中。「インターネットを始めとした新たなメディアの誕生でいかにジャーナリズムが変わりつつあるか」がテーマで、うち一章はインターネットを利用した本の執筆プロセスそのものに割かれる予定だ。

どれほどの専門家であっても、個人が知ることのできる量には限界がある。そしてインターネットの向こう側には、たとえ個々の知識は断片的であっても、全体としては壮大な知識が広がっている。Ask MSRはこの新たな知識の海を活用する試みとして注目に値するだろう。

9 月 7, 2004 in 日経産業新聞 | Permalink

トラックバック

この記事のトラックバックURL:
http://www.typepad.com/services/trackback/6a00d8341c3b6353ef00e5503877858834

Listed below are links to weblogs that reference 質問の答え、ネット上から検索 個々の「知識倉庫」活用:

» MSR from blog Business
情熱起業列島で面白いと紹介されていたblogを読んだ。 # 偶然だけど、上記blogの持ち主もmckinsey経験者のようだ。 ## 1つ前の記事参照 話が逸れてしまったが、MSR。かのDoxBox様がご在籍です�... [続きを読む]

トラックバック送信日 2004/09/10 7:56:45

» [web][essay]完璧な検索/検索の現在 from 古池や蛙飛び込むどうでもよい
http://blog.japan.cnet.com/watanabe/archives/001622.html 以前,機会があって整理した事がありますが,僕の考えではこんな感じになりました.名前 ... [続きを読む]

トラックバック送信日 2004/09/14 8:43:24

» �ηä������夬�� from isologue ��by ����ů����̳��
�ʻ��ϥ��������ʤΤǰ��ֺǽ��Υ��꡼���������Ƥޤ��󤬡��˵�ư���Υ��������ˡ��֥ߥΥե�����γ�ҡפȤ����Ͷ���γ�Ҥ��ФƤ��ޤ����ߥΥե�����γ�Ҥ����ۤ��줿���֤Ǥϡ��Ļ������ʳ����ż��Ȥ��������ʤ����Ȥ������ꡣ ���¤α������֤Ǥ����ȤǤϤ뤫�󤯤ޤǤ... [続きを読む]

トラックバック送信日 2004/09/16 17:31:06

» 「縁尋奇妙」時代のコミュニケーション戦略 from カトラー:katolerのマーケティング言論
久米繊維工業の久米信行社長の本「メール道」(NTT出版)の出版パーティーがあった [続きを読む]

トラックバック送信日 2004/09/26 9:17:39

» グーグルニュースの曼荼羅あるいは神学 from カトラー:katolerのマーケティング言論
グーグルニュースの日本版のサービスが先週から始まっている。 日本の主要マスコミ [続きを読む]

トラックバック送信日 2004/09/26 9:22:08

コメント

いつも拝見しています。とても勉強になっています。
さて、私も似たような研究はしているのですが、個人的に一番欲しいのは、略歴情報だったりします。人名と略歴と検索エンジンに入れても、まず必要な情報にたどり着けません。ネットには確かに膨大な情報が山積していますが、偏りがありますね。

投稿情報: kenny | 2004/09/10 7:06:50

cocoon-san

サーチのパーソナライズはAmazonもGoogleもいろいろ試しているので、もっと良いものはできていくるのではないでしょうか。(必ず、プライバシーとの兼ね合いが問題にはなりますが・・・・)

kenny-san

略歴ですか・・・どこかで働いていたことがある、という情報は入手できることはありますね。でも、確かにそれをまとめて時系列にするのは難しいですね。

なお、私自身で検索してみたところ
「渡辺千賀」「略歴」では出てきませんでしたが、単に「渡辺千賀」だったら、いくつか略歴が出てきました。なので、人には寄りますが、調べようはあるかもい知れませんね。

また、ネット情報の情報は偏りがあるのに加え、間違っていることもあります。たとえば、9-11はCIAの・アメリカ国家の・FBIの陰謀だった、といった説はあまたあります。9-11に限らずこの手の「XXの陰謀」説、はあちこちに流布していますが、これはまず99・999%嘘ですし。このあたりの判断を行うのは、最後は自分、ということなのでしょうか。

投稿情報: chika | 2004/09/13 23:36:24

お久しぶりです。毎回、楽しみに記事を拝見しています。
お書きになったテーマに関連していると思われる小生のブログのエントリー記事をTBさせていただきました。

投稿情報: katoler | 2004/09/26 9:27:35

コメントを投稿