うずまき2017 powered by Jun-Systems

耳管開放症, SAS, 統計解析, 人工知能, プログラミングそれに思考

*

横行する似非統計の話

   

知っていてもそんなに得はしないが、知らなかったら損をする

経済学にしても統計学にしてもそうなんですが、
リテラシーとして最低限の知識を持つことは、日常生活における判断を助けてくれます。

ビジネス誌とか読んでても思いますが、割ととんでもない数字やグラフを並べ立てて、
いかにもそれらしいように物事を主張しているものはたくさんあります。

そもそもこれを書いているのは、JR北海道に関するニュース記事を読んだからです。

JR北海道レール異常 9割が木製枕 コスト安くても劣化は早く-北海道新聞[道内]

この記事や事実があっているかどうかは別として、
見出しから「レール異常の9割が木製枕!」→「木製枕木は悪!」と決めつけるのはあまりにも早計なのです。

考えるべきは全体の事故発生率ではない

先に結論をいうと、この見出しの悪いところは、枕木の種類の比率が書かれていない点にあります。
そもそもJR北海道は資金面で困窮していたと聞きます。
もし枕木のコストを抑えることを目的に、実際の線路における木製枕木とそうでない枕木の
使用割合が9:1だったとしたらどうでしょうか。

このような状況下で「枕木を原因とする事故が起きた線路」において木製枕木が使われていた割合が9割だとしたら。
木製枕木とそうでない枕木において事故の発生率は「変わらない」ということになります。
(木製枕木とそうでない枕木が、どちらも同じ確率で事故を起こすと仮定した場合、
そのまま事故時の枕木の種類の比率と一致するため)

しかしながら、木製とそうでないものが1:1の割合で使用されていて、それにも関わらず事故においては
木製枕木の使用が9割だったとしたら、それは「木製枕木が悪い」という結論を出しても一応納得できるレベルにはなります。

考えてみれば当たり前のことですが、個々の枕木の種類ごとの事故発生率を見なければ、
いくら客観性の塊である「数字」でも、何の説得力も持つことはできません。

簡単に考えてみよう

「生きているうちに缶ビールを一本以上飲んだことのある成人男性は、その先150年以内に95%以上の確率で死亡する」
という命題があったとします。
これ自体は、まあ間違っているとは言えません。
20歳で缶ビールを一本飲んだことのある男性が、そのまま170歳まで生きられるとは、
2013年現在の医療レベルでは、たとえ5%の確率だとしてもなかなか考えにくいですよね。

だからといって、この命題だけを読んで「ビールは悪だ!」と決めつける人は決して多くはないはずです。
ではどうすれば「ビールは悪だ!」と言わなくても済むのかといえば、それは簡単なことで、
「そんなん、ビール飲んでなくても170歳までには死ぬじゃん」ということなんですね。

細かくやろうとするならば生存時間分析とかという手法で分析できるとは思いますが、
そんなことするまでもなく自明ですよね。

「億万長者の多くは毎日炭水化物を摂取している」とか。
「呼吸は短期的なスパンで見ると酸素の摂取などを通じて寿命をのばすことができる有用な行為のように感じるが、200年単位で見るとその死亡率はほぼ100%であることから、長期的なスパンで見ると、実は呼吸は非常に危険な行為である可能性がある」とか。
いくらでもめちゃくちゃなことは言えます。

こういうのって多くの場合、騙されても文句が言えないようにうまくやってる事が多いですから、
騙されても「よく見てなかったあなたが悪いんですよ」と言われて終わりということもありえますからね。

最近のやわぎん(某柔軟銀行)の広告のグラフとか。
それとかニュースのフリップに原発問題。
よくみるといろんなところに、「あれ?」と思うようなものが隠れていますから、よく注意してみてください。

では。


 - 学問, 社会問題, 統計学

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

  関連記事

no image
Rの状態空間モデルdlmパッケージの使い方
no image
ベイズ統計で考える世界: 感度・特異度・尤度比などなど
no image
東電が悪いとかそんなことを言っている場合ではない。
no image
データ分析の重要性とオープンデータ活用の潮流
no image
2014年IT関連まとめ
no image
MOOCが大学を潰す未来