刺身の上にたんぽぽ乗せる日記

プログラミングしたり、自販機の下に落ちてる小銭を集めたりしてます

ブログ記事タイトルの形態素解析

適当にやった。名詞だけを抽出して何かしら面白い結果が得られるか見てみた。
データセットは最近の3000件。

ロシア 33
メンバー 34
夫 34
www 34
体調 35
ー 37
スライム 37
声 39
Part 39
iPhone 39
話題 40
フジテレビ 43
五輪 44
人気 44
声優 46
ピザ 46
韓 46
吉田 47
所長 48
アニメ 49
東京 49
社会 49
これ 51
どこ 51
平松 52
福島 53
問題 54
政治 55
芸能 55
今 56
ネット 58
俺 58
中国 58
スレ 61
男 62
人 64
幹部 67
サッカー 70
野球 71
何 72
職員 77
W 89
原発 89
韓国 92
橋下 93
恋人 106
゚ 113
画像 117
日本 123
橋 129
大阪 384

想像以上に最新の話題を反映している。
橋下関連、ロンドン五輪関係、原発関係という感じが見える。これらの単語・記事をクラスタリングすると一層面白いことができそうだな。