こんにちは。ヤスヤスオンファイヤーです。
統計検定を準一級まで取得して、
役立っているな~と感じるメリット、
第三弾です。
ニュースを鵜呑みにせず、頭で考えられる
例えば、今日目についたこの記事。
若年層の2割が、接種しないという考え、とのこと。
他の年代に比べて、接種しないという考えの割合が高いという主張です。
※私はここでは、ワクチンの是非について論じるつもりはありません。
結論、私はこの記事の情報だけでは、
「記事の主張は立証できない」と考えます。
気になった点
世代間の回答割合を比べているということは、
・母比率の差の検定を行って有意差があるか確かめることが必要だろう。
とまず思う。
記事内には、こういった統計検定の実施有無など書いてありませんし、
元のアンケート結果のサマリくらいはリンクがあれば良いのに、
ありませんでした。
・そして、アンケート調査においては、母集団からバイアスが排除できているのか?
という点も注意が必要です。
例えば、「ワクチンの接種すべきかどうかのアンケートです。回答は任意です」だけだと、反対派で意見の強い人が、進んで回答するという可能性があります。
何のアンケートかは伏せて、無作為に回答者を選ぶなど、バイアスを排除することが必要です。
世の中には根拠の甘い数字的主張があふれている
今回例に挙げた件にかぎらず、
身の回りの数字って、専門家がしっかり検証した上で
出てきているものの方が、ずっと少ないと思います。
だからこそ、解釈が妥当なのか?
と自分の頭で検証すべき。
検証のための武器、その一つが「統計」リテラシ
だと思うのです。
おまけ:なんちゃっての数字に騙されないために
統計検定の公式テキストのように、学問チックではなく、
統計リテラシを付けられる、これでもう騙されない!
と自信になった書籍を2冊ご紹介します。
(アフィリエイトリンクになっています。m(__)m)
分析者のためのデータ解釈学入門 データの本質をとらえる技術
データを集めて、関係性を解釈していく。
機械学習に行く前に、どんな「目」でデータを見るべきか、
平易にかつ網羅的に説明がされています。
データにありがちなバイアスの種類についても、
体系的にひとつの章で解説がされています。
この章のおかげで、データのバイアスには気を付けよう、と
学びましたね。
相関と因果の違いといった、基本だけで最重要ではないか?
といった考え方もすっきり。
こういったデータを見る目が高まれば、
前処理をゴリゴリできる実装力だけでない、
いい感じのデータサイエンティストと言えるのでは。
新品価格 |
著者はTwitterだとゆるめの発言がキュート
統計学が最強の学問である
「ランダム化」という、これも統計の世界において基本でありつつ、
実験、アンケート調査ではかなり重要な概念を、重点的に
読者に叩き込んでくれる一冊。
世の中のデータは有象無象。
しかし、「ランダム化」を味方に実験をデザインすることによって、
意味のある主張を導くことができる。
今回例にしたアンケートも、きちんとランダム化したアンケート調査で
あるならば、根拠をもった主張になる。
だからこそ、今回私は、ランダム化できているのか?
という観点でも、疑いをもつことができたのでした。
数式は少なく、読み物として楽しめる一冊です。
新品価格 |
統計×機械学習×そしてとめどないチャレンジ精神で最強の人材に・・