« 人月の神話―狼人間を撃つ銀の弾はない (1) | メイン | グーグルがSNS用API「OpenSocial」を公開 »

2007年11月 7日

グーグルの日本語N-gramデータ公開

?u?b?N?}?[?N???B???

どうも最近グーグルさんの動きが活発なようですね。自分のメモ的意味合いも込めて紹介。まずはグーグルが日本語N-gram自社データを公開したという話。

グーグルの巨大データベース

まず、N-gramとは
N-gramは自然言語処理の領域で、単語同士の結びつきを統計的に処理する計算モデル。「グーグルで検索」「グーグルで調べる」「グーグルで探す」のように特定の単語(例では"グーグル")と、他の単語の結びつきを予測できる。 - @IT
というものです。グーグルがウェブサイトから収集したデータをもとに1?7-gramまで公開したそうです。

グーグルのような超巨大データベースを持っているところが、このように実用的にも研究的にも非常に貴重なデータを出してくれるというのは、非常に意義深いことだと思います。

外部関連サイト
グーグルが日本語N-gramデータを公開 ? @IT


  1. オープン化するYahoo!JAPAN
  2. ヤフー、iTunesと提携
  3. IBMがSecond Lifeで開発者を支援
  4. Yahoo! Japanの月間ページビュー数が世界一
  5. Yahoo! Japanが新トップページ発表



トラックバック

このエントリーのトラックバックURL:
http://webcrawl.s288.xrea.com/mt/mt-tb.cgi/404

コメントを投稿

サイト内検索

Google
 

2008年8月

          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
アーカイブ

Author Info.

mypic mkataigi
Webエンジニア
mail:makoto@wcrawl.com