(某事件の容疑者名を検索すると、中身が新聞報道のベタ移しとノイズだらけのコメントで占められたまとめサイトがずらりと並ぶに及び、やはり速報系まとめサイトなど要らんと確信する今日この頃......というか検索エンジンも相当品質が落ちましたね(´・ω・`) )
— 不破雷蔵(懐中時計) (@Fuwarin) 2014, 9月 24
現在進行形の某事件の容疑者名が上がったので、その名前を検索しようとしたところ、報道記事をコピペしてあとは罵詈雑言的なノイズコメントばかりがずらりと並んだ時事的まとめサイトや、新聞記事の内容をコピペしたのみで「続きはこちら」のリンクだけの自動生成サイト、さらにはそのまとめサイトや報道記事へのリンクだけが自動収集されたリンク一覧サイトが一挙に上位表示されて、検索機能の精度の「向上ぶり」を改めて認識する昨今。検索利用者の検索目的の認識とか、相関関係と因果関係の勘違いとか、根本的な部分に検索側のロジック上の問題が生じているような気がするのよね。スパム業者を追いかけている間に、本末転倒状態になっている感が。
で、そんな話について、いくつかのアドバイスが。
@Fuwarin googleに関しては検索結果を非表示にできる設定ありますよ http://t.co/p6DsClwfqL
— Zgohho@おから飯 (@zgohho) 2014, 9月 24
@Fuwarin 除外検索じゃ駄目でしょうか。「-ちゃんねる」のように、ノイズに頻出する語句の頭にマイナスをくっつけて検索をすると、かなりふるい落とせると思います。試しに「-死体遺棄 -ちゃんねる」で、記述時期が2014年9月以前のものを選んだところ、相当スッキリしました。
— 惰眠 (@Damin_EN500) 2014, 9月 24
一つ目はGoogle Chromeの拡張機能として「Personal Block List」ってのがあって、それを使えばかなり良好な結果を得られるとのこと。例のQ&Aのデータベース、あるいはWikipediaを使ったコピペサイトもまとめて消せるので、便利といえば便利(Google側もどうしてこの類のサイトを表示対象とするのか、かなり理解が出来ない)。特にブロック対象としては「コピーサイトは検索結果から消しましょう」の項目のリストが参考になる。
とはいえ、これはGoogle Chromeを使っていることが前提で、しかも利用者本人のみの話。さらに利用者側に限っても、逐次設定を追加していかねばならないという理不尽さ。まさにスパムメール対策と同じ。
もう一つの方は検索時の除外機能を利用するというモノ。テクニック的には以前から使っているけど、ノイズを減らすためには複数のチャネル設定が必要になるので、非常に面倒くさい。理不尽さを覚えさせるという点では、直上の「Personal Block List」と同じ。しかも使っている本人にしか有効にならない。
根本的な品質問題として、検索、具体的にはGoogle側に対処してもらうしか方法はないんだよねえ、結局のところ。
コメントする