刺身の上にたんぽぽ乗せる日記

プログラミングしたり、自販機の下に落ちてる小銭を集めたりしてます

続・最近の話題抽出

適当にクラスタリングしてみたらこんな感じになった。

ハ 8
ヤバイ 8
ソフトバンク 8
部分 9
ゆき 9
ドイツ 12
小林 15
完全 17
アメリカン, 航空 22
プラス, NEW, ラブ 28
民団, 外国, 異論 32
白, 旭, ヤクザ, ゴルフ 33
お前, 社長, 社員 39
バス, 地下鉄, 民営, 市営, 市バス, 年収, 近く 80

比較的いい結果になったと思う。
下の方の6つくらいは大分意味があるクラスタリングができてると思う。

で、どうすんの?と言うと結構困る。
これでgoogle news辺りから関連ニュースを引っ張ることはできるんだけど、それで面白いものができるのかね?ニュースが色々見れるのは面白い気がする。