データーマイニング

最近、データーマイニングについて勉強しています。

データーマイニングとは、大量のデーターを分析して、なんらかの傾向をつかむ手法のことです。

シェイクスピアの作品に使われている単語を全て解析すると、使用単語の分布が違う作品があることがわかりました。その作品は他人の作品ではないか?という説があります。

ブログデーターを収集して、使われている単語を分析し、急激に使用頻度の増えた言葉をピックアップすることで、今のトレンドを見出そうという試みが、あちこちのサービスで行われています。

この手法を上手く利用すれば、ある話題に対して、「良いのか悪いのか」「+なのか?なのか」を判断できると思うのです。

幾つか本を購入しました。
少しずつ勉強していきます。

テキストマイニングを使う技術/作る技術―基礎技術と適用事例から導く本質と活用法

那須川 哲哉
東京電機大学出版局
2006-11
定価 ¥ 3,150

powerd by amazon360

たつをのチャレンジログさんで紹介されてました。

次世代データベースとデータマイニング―DB&DMの基礎とWeb・XML・P2Pへの適用

石川 博
CQ出版
2005-04
定価 ¥ 3,150

powerd by amazon360

↑統計学を研究している友人から教えてもらいました。

アルゴリズム
スポンサーリンク
当ブログの記事に共感していただけたら、また読みに来ていただけると嬉しいです。読んでくれる方の数が多くなると、更新するヤル気に繋がります(^^)
フォロー、ブックマークしていただけると、ブログ更新を見逃しません
わかったブログ

コメント

タイトルとURLをコピーしました