総務省に「このデータ、全体的に間違っている可能性が。その原因はこれでは無いのかな」という大胆不敵な質問メール。内容が内容なだけに、お返事は来週以降になるでしょうが、結果次第ではあちこちで頭を抱える事態が生じかねないのです。
— 不破雷蔵 (@Fuwarin) 2018年6月15日
お返事が来たらLSのネタぐらいにはなるでしょう。場合によっては当方自身も泣きながら色々と二度手間モードに突入しますが。
— 不破雷蔵 (@Fuwarin) 2018年6月15日
今年発表分のはすでに分析記事を書き上げ、あとは逐次本家サイトに掲載して、それからヤフー個人にも編集掲載するだけの状態の、通信利用動向調査。このデータって8月ぐらいに公開される情報通信白書にも多数用いられる、結構重要な調査結果ではあるのだけど......今年の分、つまり2017年調査分の値は、色々と首を傾げる所があった。
高齢者の数が増加しているので全体値に色々と偏りが生じているから云々との但し書きはあったけど、高齢者の増加は2017年に始まった話じゃない。統計上の誤差領域をプラスして考えても、かなりひずみがあったりする。
で、データの精査と記事の執筆をしている最中に、これはどう考えてもおかしいという値を見つけ、過去の数年分の同調査の値と比較しても異様な結果であることを見極めたうえで、6月15日に総務省にお伺い。具体的な値を提示して、統計上のぶれでは説明できないイレギュラー値が多数ある、他の部分もそういう問題が発生している可能性が高い、全体値が説明し難い値が出ていたり、属性別でも変な結果が生じているのは、これが問題ではというお話をした。
「平成29年通信利用動向調査の結果」の訂正(総務省) https://t.co/hGvVTnzsDz さあ大変なことになりました(°ω°)(指摘した本人が言ってみる) pic.twitter.com/f4xiAV0iex
— 不破雷蔵 (@Fuwarin) 2018年6月22日
通信利用動向調査の結果、大規模な変更が生じたので、正直全部やり直し。けれど諸般の事情で時間がしばらく取れないので、リテイクは夏休みぐらいに......できればいいなぁ、と。とりあえず第一報をば。かなり数字に大きな変更が生じています。
— 不破雷蔵 (@Fuwarin) 2018年6月22日
その問い合わせの返答が来たのが昨日。結果としてはやっぱりベースの値に問題があり、多数の部分で数字のミスが生じていたことになる。計算の上での補正値そのものにミスがあったので、多数か所での訂正が生じている。まぁ、当方のお伺いメールと、総務省情報通信経済室長の某氏から頂いたメールには、もっと詳しい話やトラブルの理由が書いてあるのだけど、それはアレがナニなのでナイショということにしておく。
まだ詳しい確認はしていないし、どうも訂正後の値でもどうなんだろう、これというものがあったりするけど、少なくとも最初の版よりは正しい値が出ているようだ。
で、当方の対応。とりあえず訂正前のデータによる記事は一度全部掲載する。その後、訂正後の値で全部ひっくり返してやり直し......だけど、色々と事情があって、手を付けるのは夏休みぐらいになりそう。申し訳ない。
まぁ、例えば全体のインターネットの利用状況が訂正前は77.8%、訂正後は80.9%と、結構な違いが出てるのだけどね。
果たして間違いの指摘をしてよかったのかどうかと考えもしたけれど、指摘しておかないと間違った情報のままで情報通信白書が作られてしまうし、その後で訂正が入ると余計にダメージが大きくなる。訂正が入らないとしても、間違ったデータで色々と政策関連の話が進むのはよろしくない。ヤン提督ならば年金を上乗せしてほしいという話もしたくなる程度の大きな結果には違いない。
他方気になるのは、結構大きなひずみがあったのに、当方以外に指摘をした人がいなかったらしいこと。いったいどういうことなのだろう。企業とかシンクタンクとか専門家とかも、このデータを使っているはずなんだけどな。
コメントする