エロ画像検索システムは惨めに終わりました
工数4時間。南無。
ネタばらしすると、yahooの画像検索のRPCインターフェースを使って、アダルトフィルタありと無しで検索して、その結果の差分がアダルト画像として認識ってことをやってみたわけだが、結果は惨敗だった。
とりあえず以下結果とか考察とか。
- 全くエロくないものがひっかかる。「チャイナ」で検索してただ普通にチャイナ服を着ている人がひっかかる。別に露出もないし、セクシーなポーズもない。
- 人名で検索すると、絶望的にエロが見つからない感じがする。あまり調べてないからわからないけど、ぱっと思いついた数人は全くだめだった。
- 職業、コスチューム系はまぁまぁだった。母体にエロが多いせいか、ウマい具合に非エロがフィルタされていた。
- アニメとかだと、同人系のエロがひっかかることがある。cowboy bebopとかでうまくいった。
- 非エロとしてフィルタされたデータが本当にエロいか、というのは並べてみたわけじゃないから断言できないけど、正しいっぽい。
- アダルトフィルタは子供にエロ画像を見せないのが重要なわけで、エロであるという判定のfalse positiveはfalse negativeになるのに比べて圧倒的に重要なため、必要以上にfalse positiveにしていると思われる。つまり、エロ画像を高い精度で探し出すという目的にはそぐわない。
結果は散々だったけど、
- yahooイメージ検索RPCライブラリ
- 俺のオカズ検索用フィルタ
はできたので、とりあえずよしとしてみる。
おまけ:
kudzuで検索して見つかるエロ画像。
http://overstated.net/photos/kudzu/kudzu-car-thumb.jpg
何が起きているのだろうか?