期日前の出口調査は麻生失言以外目立った変化なし。8馬身差で自民圧勝ですかねえ。お疲れ様っしたー
— やまもといちろう (@kirik) 2014, 12月 12
ビッグデータいらねーじゃんw QT @kirik: 期日前の出口調査は麻生失言以外目立った変化なし。8馬身差で自民圧勝ですかねえ。お疲れ様っしたー
— 雷丸 (@Ikazuchi_maru) 2014, 12月 12
最初から要らねえって言ってんだろw サンプリングで充分なんだよ RT @Ikazuchi_maru: ビッグデータいらねーじゃんw QT @kirik: 期日前の出口調査は麻生失言以外目立った変化なし。8馬身差で自民圧勝ですかねえ。お疲れ様っしたー
— やまもといちろう (@kirik) 2014, 12月 12
コンピューターの処理能力が格段に向上したことなどを受けて、これまでは到底精査が出来なかった大量のデータを一気に用い、細かい部分まで検証をして世の中のあれこれを探求したり予想しようという、いわゆる「ビッグデータ」を用いようじゃないかというムーブメント。データの量が煩雑すぎるので、いかに合理的かつ適切に精査し、その結果を人間の能力で把握できるように可視化するかが一つの課題となる。まぁ簡単に例えると、ライフゲームで地球上の人間全員を全部別々のものとしてシミュレートするのがビッグデータによるもので、これまでは一つの国に付き数十人ぐらいでサンプリングして検証したって感じ。あるいはボードゲーム(特にシミュレーションゲーム)において、サイコロで結果を判定するような。
で、そのビッグデータを用いて衆議院議員選挙をシミュレートしたところ、結局サンプリングによる検証と同じ結果が出たというところから始まった話。サンプリングデータによる検証の裏付けとなったということで、悪いことではないのだけど、投入するリソースを考えた上でのコストパフォーマンスまで考えると......というところ。
騙されてカネつぎ込んだ会社が...w QT @kirik: 最初から要らねえって言ってんだろw サンプリングで充分なんだよ RT ビッグデータいらねーじゃんw QT 期日前の出口調査は麻生失言以外目立った変化なし。8馬身差で自民圧勝ですかねえ。お疲れ様っしたー
— 雷丸 (@Ikazuchi_maru) 2014, 12月 12
つかサンプリングの方が積極的に良いかもなぁと.ランダムなサンプルを作る方に金使った方が効率的でしょう。。。 @kirik 最初から要らねえって言ってんだろw サンプリングで充分なんだよ RT @Ikazuchi_maru: ビッグデータいらねーじゃんw
— 飯田泰之 (@iida_yasuyuki) 2014, 12月 12
つか、そもそもサンプリングって、ビッグデータが使えない時代にその代替手段として生み出された方法なのだから、概して双方で同じような結果が出るのは当たり前なのよね。ビッグデータで無いと無理な方面で使うのならともかく......。
— 不破雷蔵(懐中時計) (@Fuwarin) 2014, 12月 12
(ぶっちゃけ、ウェブサイトの黎明期やブログ、ソーシャルメディアの創世記に「これを使えば御社は大飛躍」的な感じで、ページ単価50万円とかぼったくる商会的な事案が脳内をよぎるのでありんす)
— 不破雷蔵(懐中時計) (@Fuwarin) 2014, 12月 12
ビッグデータを使えばより細かい、より確証度の高い推測を成せる可能性がある。但しその推測を成す過程の公式の上で間違いがあると、いくらデータの量が多くても推論は明後日の方向に行ってしまいかねない。さらにいえば、コストパフォーマンスの上で結局優先順位が下ガリざるを得ない。「綿密な結果を出せるから」といって、プレイする時にサイコロを1アクション毎に500個振らせるゲームなどしたくないよね? 見方を変えると先日のヤフーが行った予想のように、それ自身がセールスポイントであり、さらに内部リソースを活用することで、コストパフォーマンスをあまり考えなくても良い場合は、むしろビッグデータを使った方が良いこともあるのだけど。
ところが昨今では何でもかんでもビッグデータという感は否めない。
.@Fuwarin 選挙とか統計で分かりやすいものの推定にビッグデータ分析って不要なんですよね。たとえば、震災後公共交通が止まった時の人の動きとか予想しがたい自称に対する、膨大で多様な情報の中から重要なポイントを見つけ出すとかに役立つのがビッグデータ。
— SKMT/坂本英樹 (@sakamotoh) 2014, 12月 12
なので、「これからはビッグデータ!」と、これまでのサンプリング調査を否定している会社は信用しなくていいと思ってます。 RT @Fuwarin つか、そもそもサンプリングって、ビッグデータが使えない時代にその代替手段として生み出された方法なのだから、概して双方で同じような結果
— いわん (@Ivan_Whisky) 2014, 12月 12
指摘の通り、ビッグデータには得手不得手がある。ビッグデータで初めて検証ができるものもあり、思いっきり精度が上がり有用性が高まるものもある。それらにはビッグデータを使うべき。ただ、オールマイティーカードのように振りかざして、言葉面で騙される人たちを鴨にしている事案も結構あるのではないかな、という気がする。上でも指摘しているけど、ウェブサイトやブログ、ソーシャルメディア、そして昨今では震災周りの放射線測量などなど。
まぁ、山師のネタは尽きるところが無い、ということだな。
コメントする