2006-06-15 データ収集開始 web データソースを数十セットしてクロールさせてみたけど、やっぱり偏ってる。そりゃあそうか。あと、みんな書くフォーマットが違うからマッチングがすげぇ面倒くせぇ。クロール手法を賢くしないとだめかね。