Google Newsに対抗する大学生 ?CEEK.JP 開発者 吉田 光男氏にお聞きする?

2024年4月
1234567
891011121314
15161718192021
22232425262728
2930  

 昨年はGoogleをはじめ、Microsoft、Yahoo!などのサーチ分野が非常に盛り上がった年であった。1つ々の出来事を見ていくと、Googleの躍進/株式公開といった話題や、Microsoft、Yahoo!が本格的にサーチに取り組み始めたこと、さらにAmazonのA9などサーチ業界に新しいプレーヤが登場したといった話題があった。ニュースサイトの中でもサーチのニュースが多く取り上げられ、全体的にサーチ分野が注目された年だったと言えるだろう。

 その中でも「ニュース検索」の分野は、特に注目された分野であると言える。なぜならば、Google Newsの日本語版が登場したからだ。アルゴリズムによって自動生成されるGoogle Newsは、日本語版が登場する前から話題になっていたが、それがついに登場した。

 そのGoogleの動きに対抗するかのように、ニュース検索のサービスを始めている。例えば、ドリコムやMicrosoftなども「ニュース検索」を試し始めている。

 このように様々な企業が「ニュース検索」に動いているが、その中で「個人」が1人で作りあげたニュース検索サイトがある。「CEEK.JP NEWS」というそのサイトは、メタ検索サイト「CEEK.JP」と共に筑波大学の現役の学生である吉田光男氏が作りあげたものだ。CEEK.JP NEWSは、某雑誌の年末特集記事で「今年のネットを盛り上げた最重要サイト」に選ばれているほか、無敵会議でも紹介されるなど、非常に注目を集めているサイトだ。

 今回は吉田氏にCEEK.JP/CEEK.JP NEWSの事やニュース検索についてお話を伺った


-まず、CEEK.JPの開発の動機をお聞かせください。

吉田「(CEEK.JPを開発した当時は)1つの検索エンジンから「目的の検索結果」を探すのは難しい状態で、いくつかの検索エンジンを利用しなければならない状態でした。それならば、はじめから複数の検索エンジンの検索結果を表示してくれるような検索エンジンがあれば良いと思い、CEEK.JPを作り始めました。」

-CEEK.JPの評判はいかがでしょうか?

吉田「多くの方に使っていただいているようです。特に学術的な専門用語のような『はじめから検索結果が少ないと予想される語』の検索に、よく使っていただいています。また、自サイトの検索ランキングを調べるのに使っている方もいるようです。」

-吉田さんは、去年の春頃からCEEK.JPと並行して、ニュース検索サイトである「CEEK.JP NEWS」を始められています。こちらの反応はいかがでしょうか?

吉田「こちらも、多くの方に使っていただいております。CEEK.JP NEWSはトップページに1日に3000件ぐらいのニュースが流れているのですが、単純にブラウザからアクセスするだけではなく、アクティブデスクトップを利用してアクセスしているユーザもいるようです。また、平日のアクセスが多くなる傾向があります。」

-ちなみに、現在はCEEK.JPのサーバは何処に置いてあるのですか?

吉田「自宅に置いてあります。サーバは場所をとるので、本来は冷蔵庫をおく場所にサーバがおいてあったりします。」

-何台くらいサーバが置いてあるのですか?

吉田「学生が家にサーバ何台も置いてあるのもアレかと思いますが、ニュースやメタ検索用とファイルサーバと実験用のサーバなどを置いてあります。電気も、もちろん30Aにしてます(笑)」

-それはすごいですね…

吉田「余談ですが、SoftEtherの登くんの家も30Aですけど、エアコンを入れていてレーザープリンタの電源が入ると、全部、電源が落ちるようです(笑)。以前は、登くんの所にサーバを置いていたのですけど、たまに(CEEK.JPのサーバが)ダウンするんですよ。そうすると登くんに『レーザープリンタ入れた?』といったようなメッセージを飛ばしていました(笑)」

-「なるほど、システムダウンの原因が『エアコンを入れた』という事だったのですね(笑)。昔は、CEEK.JPはよく落ちていたのですが、それが原因だったのですか?(笑)」

吉田「月末以外に落ちていたのは、たぶんそれですかね。月末に落ちていた時はサーバに負荷がかかっていたからです。現在では一応負荷対策が済んでいます。」

-「負荷がかかるというのはどういう事ですか?」

吉田「私の技術的な問題ですが、現在のニュース検索は検索時にかなり負荷がかかるのです。以前は、メールアドレス収集のボットが来ると落ちるような状態があったのですが、現在はボットを弾くことで対処しています。しかし、この対処は、本質的なものではなく、暫定的な処理であるため、もうちょっとましな改良を検討中です。」

-「先ほどSoftEtherの登さんのお話が出ましたが、確か吉田さんは『未踏』にも応募されたのですよね?」

吉田「はい応募しました。書類審査は通ったのですが、2次審査で落ちました。色々と理由はあると思いますが、ひとつの理由としては知的財産権の問題がクリアできていないと指摘されました。」

-「それはどういうことでしょうか?」

吉田「ちょうどその時に、読売新聞社とLINE TOPICSの『ニュース記事の見出しに著作権があるか否か』という裁判がありました。あの裁判で、もしニュース記事の見出しに著作権があるという事であれば、私のプロジェクトは相当なリスクが出てきます。そのような事もあったのだと思います。まぁ。単純に実現能力が足らないと判断された可能性の方が高そうですが。」

-「CEEK.JP NEWSでは『ニュース検索』の他にRSSの配信も始められています。これはどうして始められたのですか?」

吉田「検索結果をRSSで欲しい方が多いのですが、検索負荷の関係で見送っています。ただ、少しでも便利にしよいうことで、最新のニュースだけはRSSで配信しています。」

-「RSSの評判はいかがでしょうか?」

吉田「『ニュース検索』(ページビュー)の5倍ぐらいのアクセスがあります。RSSリーダを利用している人の使い方次第(RSSの結果をキャッシュしているだけの場合もある)ですので、正確な数字はわかりませんが、少なくとも普通にニュースを検索しているユーザよりはRSSを利用している人が多いと思います。」

-「ニュース検索をしているユーザ数は、それほど多くないという事ですか?」

吉田「ニュース検索の場合、検索をしている人の実数はそれほど多くありません。検索をしている人よりもニュース検索のトップページを眺めている人の数の方がはるかに多いです。」

-「確かにニュースを検索する機会は、普通の人はあまりやらないかもしれませんね」

吉田「ニュースを検索する時は、キーワードで検索する機会は少ないかもしれません。ただ、キーワードのランキングを出しているので、そこから『検索』する人は多いです。」

-「iモードなどモバイルにも対応されていますが、こちらの方はいかがですか?」

吉田「モバイルは今の流行を知れれば良いと思い。現在では、最新のニュースを5件出しているのですが、これではすぐにニュースが流れてしまいます。今後はキーワードランキングを出すなど、もう少し工夫したいと思っています。適当に作っただけですから。」

-「CEEK.JP NEWSの検索対象は、いわゆるマスコミのニュースサイトだけです。今後はBlogなどの個人サイトも検索対象にされる事はありますか?」

吉田「(一般論として)マスコミが信用できるかどうかは別として。私の中では『マスコミの情報は信用』という前提で運営しており、マスコミ以外はニュース検索で取り扱わない方針です。(Blogのような)三次情報を含めてしまうと、それだけでニュース検索の意味は無くなってしまうと考えています。また、地方新聞社に掲載されている通信社のニュースも表示していません。」

-「それはどうしてですか?」

吉田「通信社は他のニュースサイトに配信しているわけですが、全ての記事を扱ってしまうと同じニュースが何回も表示されてしまいます。確かに、通信社のニュースは影響力は大きいですが、単なる2次配信までも記事として扱うと、それもノイズになってしまいます。」

-「ニュース検索ですが、GoogleやMSNなどの他にもいくつかのベンチャーがニュース検索に進出しています。吉田さんは、ニュース検索は単体でビジネスになるとお考えですか?」

吉田「ビジネスになる、ならない以前にニュース検索単体では『できない』と思います。」

-「先ほどニュース検索にBlogを含めないとおっしゃいましたが、吉田さんはニュースの定義をどのように考えていらっしゃいますか?」

吉田「職業としている人が、一次情報を元に、二次発信をするのがニュースだと考えています。ですので、Blogは職業としてやっているわけではないので、ニュースとして扱いませんし、プレスリリースも一次情報ですのでニュースとして扱っていません。そう定義することによって、大量の情報をある程度フィルタをかけて提供できると思います。」

        • ————————————————————

 まずは、インタビューを快く引き受けていただいた吉田さん、ありがとうございました。(そして、公開まで予想以上の時間がかかってしまい、本当に申し訳有りません。)今回の吉田さんのインタビュー終了後には、CNET JapanでBlogを連載されている、渡辺聡さんや、OCNの「ブログ人」を統括されている河村 明さん、アリエル・ネットワークの徳力 基彦さん、無印吉澤さんの4名にも加わっていただき、今後のニュース関連の動きについて色々と議論をさせてもらった。参加された方、ありがとうございました。この時の議論はBlogやデスクトップ検索の話題など非常に興味深い話題が多く出たので、機会があれば少しずつ紹介できれば良いと考えている。

 今回のインタビューで個人的に思ったのは、想像していた以上にライセンスや法律の問題があるということだ。個人的にP2P技術に興味を持っているので、「ITを使った先端技術」と「従来メディア」の対立はある程度、見てきたが、「サーチ」でもこのような「対立構造」を見るとは思わなかった。今年は、サーチ技術の発展と同時に、IT企業が従来のメディアと「仲良くしていく方法」を考えさせられる年と思う。