以前からアプリ等のレビューにスコアは不要と思っている。
— h.omae (@pigeon6) October 3, 2020
訓練されたレビュアー以外はスコアをつけるのは無駄どころか害悪。なぜなら何点がどういう意味かということについての合意がないから。一般の人が参加するレビューはとの2つだけがよい。あえて足すならnot for meを足して3つ。
大前さんの仰ること,これとても重要な点です.
— Shigekazu Ishihara (@shigekzishihara) October 3, 2020
心理学測定法でも,その項目にはグレードが必要なのか?反応数がある程度多いことが期待できるなら,1/0の頻度のほうがよくないか?
というのは,まずよく考えなければならないと教えるところです.
メルカリも3段階の評価止めて「良い」「悪い」の2沢にしましたよね。
— キャトルフィーユ (@quatrefeuilles3) October 3, 2020
3段階時の「普通」を「普通に良かった」の意味で使う人がいたようでトラブルの原因になったようです。
5段階評価のアマゾンのランキングがよい例だけど、スコア式のレビューにどれほどの意味があるのだろうかという問題。例えば100点満点でこれは80点、こちらは60点とかいう感じではあるのだけど、その基準は人それぞれだから、それらを単に数量化して平均値を出したり、点数の分布を表示しても意味はないのではというもの。アマゾンの5段階評価の場合、単純に満足できれば星5つにしてしまう人もいれば、基準が星5つでダメな点があるたびに1つ減らしてしまうとか、星3が平均でそれ以上のよいものは4つ、超よいもので代えがたい素晴らしさでようやく星5つとか、星の数の基準は人それぞれ。中には「普通が5つで、それ以外は4つ、最悪は3つです」と指定するメーカーもあるほど。
運営側で明確な基準を提示していないし、仮にあったとしてもどれほどの人が読んでいるのだろうかという問題もある。要は、解釈の違いがばらばらの答えを集計しても出て来た結果に統計的な意味はないのではということではある。だったらイエスかノーかの二択、よくてそれに加えて「(対象物の良し悪しはともかく)自分向けではない」を加えて三択。この方がスマートでしかも精度が高い。
多段評価は多分に善意で用意された仕組みではあるのだけど、テストの点数のように絶対的な指標が存在しない限り、あまり意味がないどころかぶれが生じて悪影響を及ぼしかねない。指摘されている通り、コミュニティ上の評価の仕組みは、良し悪し・自分に合わないの三択に移行していくのではないかな。
コメントする