刺身の上にたんぽぽ乗せる日記

プログラミングしたり、自販機の下に落ちてる小銭を集めたりしてます

スレ紹介とレス紹介を分けようかね

ジョルジュあんてなのコメント欄にキティさんが「レス紹介は楽でいいなぁ」とか書いてたのでちょっと考えてみた。

  • RSSに記載されているURLから直接HTMLを取得
    • 全文がRSSに記載されていないと全部レス紹介になりかねない
  • ページをパースして記事部と非記事部を切り分ける
  • 記事部の長さ/レスの数でスレの紹介かレスの紹介かを分ける
    • 単純に文字数で判断
    • レス数1〜10をレス紹介、それより長いやつをスレ紹介

こんな感じでできそうだね。

副産物的に、RSSに全文が掲載できないタイプのblogを利用している人もcrawlして集められる。というか、笑わないプログラマがあるちゃぶろが全文掲載できないのでうんこ。

短い奴だけ読みたい、って人もいると思うからそこそこいいアイディアだと思うんだけどどうかね?