Google アラート〜Web検索を発展させたWebページマイニング?〜

Volume070:2006年4月11日(火)
検索エンジンを始め、数え切れないほど多種多様なサービスを行っているGoogleですが、β段階ながら「Googleアラート」なるサービスを提供しています。
このGoogleアラート、情報収集ツールとして結構便利。


【PUSH型情報配信サービスのGoogleアラート】

GoogleアラートはいわゆるPUSH型(配信側が能動的に情報を提供する)の情報サービスです。
PUSH型のサービスとして一番ポピュラーなのは、RSS(Rdf Site Summary)だと思いますが、GoogleアラートはRSSとは全く違うタイプの情報収集ツールです。
いやむしろ、データマイニングツール(データ発掘ツール)に似た感覚を持つサービスだと思います。


【Googleアラートの特徴】

どこが「データマイニング」なのかというと、その情報の抽出過程にあります。
まず、Googleアラートは自分で検索するキーワードを指定します。 同時に、タイプ、頻度を指定します。↓

これらの情報に従って、Googleが収集したページの中から最近上位に登場したページだけを抜き出して、メールで知らせてくれます。
GoogleアラートのFAQによれば、ページを抽出する基準は、以下のようになっているそうです。↓
アラートの種類 抽出されるページ
ニュース Googleニュースで検索結果の上位10件に新規に登場したページ
ウェブ Googleウェブ検索で検索結果の上位20件に新規に登場したページ
ニュース&ウェブ ニュースとウェブを合わせたもの
グループ Googleグループ検索の上位50件に新規に登場した投稿
実際送られてくるGoogleアラートの内容を見ると、必ずしも上表の規則に従っているものばかりとも考えにくい感じはするのですが、基本的な仕組みは確かにそうなっているのでしょう。
実際、結構一般的なキーワードを指定しても、一度に送られてくるのは1〜3項目と非常に少ないこともあります。
そしてそのページは、Googleが集積している膨大なWebページ情報の中にあって、何らかの理由があって上位に浮上してきたページだけに、その人にとって重要な情報かどうかはともかく、最近人気が出てきたページだったり、独自性があるページであったりすることが多く、結構ためになります。


【Googleアラートの活用例】

Googleアラートをどうやって有効活用するかは人それぞれですが、筆者は、ちょっと気になったキーワードをとりあえず登録しておいて、一応アンテナを伸ばしておく、的な使い方で使っています。
特に威力を発揮するのは、ある事柄に関してWebで調べものをしたものの、今ひとつ決定的な情報を得られなかった場合。その時点ではダメでも、その後、有用なページが登場する可能性もなくはないわけです。かといって継続的にその話題をウォッチし続けるのは限界があります。そういうときにGoogleアラートにキーワードを登録しておきます。
いわば、「何か変化があったら教えてね」とGoogleアラートに依頼しておく感覚です。
そうすれば、あとは放っておいても、Googleが日々行っているWebページのクロール結果を元にページを評価し直して、その結果、ランキングに変化があったら報告してくれるわけです。このような処理を経て報告される(と想像される)Googleアラートは、一種、重要ページの抽出作業を機械化してくれているわけです。
そういう意味で、データを単純に収集するためのサービスではなく、一種のデータマイニングツール(Webページマイニングツール?)という感じがします。


【余談:もしかしたらRSSを置き換えるかも知れない?】

現時点ではRSSで得られる情報とGoogleアラートで得られる情報は、まったく別物ですし、どちらかがどちらかを置き換えられるものでもありません。
ですが、何となくGoogleアラートは、RSSをも包含したサービスを目指している感じがするのは筆者の希望的観測でしょうか?(^^;
例えば、検索条件として、「XXドメイン以下に属するページの、XX日以内に更新されたページ」という指定が出来るようになれば、実質的にRSSと同じです。しかも、収集対象のサイトがRSSに対応していなくてもよいのですから、こちらの方が圧倒的に汎用性は高いです。←ただし、Googleがクロールを完了してなければダメなので、速報性という点ではRSSに譲りますが。
ただ個人的な意見を述べさせて頂くと、RSSはいわば一方的な情報の提供で、ユーザー側でフィルタリングを行えない(行いにくい)のがどうも気持ちよくないです。
これだけ情報があふれているインターネットの世界で、データはどう得るかよりも、大量のデータの中からいかに自分に必要な情報を見つけ出すかの方が重要になっていると思います。できることならGoogleアラートのような仕組みで新着記事を抽出できるようになってほしいと思う今日この頃。



●関連リンク●

↓Googleアラート日本語版(ベータ)
http://www.google.co.jp/alerts?hl=ja
↓Googleアラートの使い方はこちら
http://japan.cnet.com/news/media/story/0,2000056023,20081193,00.htm