Web3時代のつよつよビジネスパーソンを目指すブログ

Web3という大きな波に会社員エンジニアはどう対峙すべきか。クリプト、NFT、DeFi、メタバース…多様な情報に触れ思考したことを発信します。どこにでもいる会社員だからこその、日々の気づき、ビジネスTipsも発信します。

エクセル分析スペシャリストの受験体験/参考書/勉強方法~これから受ける方必見~

※2020年の記事ですが、リンク先をメンテしました。(2021/10/14)

受けました

ビジネス統計スペシャリスト、の中の「エクセル分析スペシャリスト」という資格ですね。資格の名前がふと分からなくなります。

stat.odyssey-com.co.jp

わたしのスペック

統計検定2級は取得済み。

大手SIerでSEをやっているが、データサイエンティスト的なスキルを身に付け古い方法論が多いSIerの業務に一石を投じたい。社内でジョブチェンジして高収入を得たい。

Pythonに走る前に、まずエクセルでいろいろできるようになっておこうというのが受験の動機。

 

MOS Excel Expertも最近取得。エクセルの操作は得意になった。

 

 

全体的な感想

時間がギリギリ!だった。というか、最後の問題は焦って解けなかった・・。
他の方の受験体験で、制限時間の1/3、20分くらいで終わったとあったので、そんなものか~と侮っていた・・。(よく読むと2015年の時の情報だし、もちろん個人差あるし・・何事も油断は禁物ですね)
 

こういう出題形式だった

選択式問題


5択問題になっており、「誤っているものを一つ選べ」形式。

5択目が、何も誤ってはいないときに選ぶ選択肢。
 
「量的変数」、「質的変数」、それら組み合わせの分析についての問題多し。
 
Excel使って計算する問題
 
  • ROUND関数使えるようにしておくべき。なぜなら、小数第○位で四捨五入して答えよ~の形式が多かった。頭の中で実施もできるけど、試験中の緊張状態だと数字の見間違えリスクが発生するなと思った。
  • Excelの関数検索は使える(Shift+F3キーでどんどん出しましょう
    つまり、関数名はうろ覚えでも大丈夫。
  • 奇をてらった問題は無い。テキストの演習を確実に。
  • 最後の問題、時間がないのもあり、曜日をダミー変数にする問題最後ごそっと落とす… 「ダミー変数」って何だったっけ??ってレベルだと難しいです。
    ダミー変数の理解もしっかり
 
その他これから受ける人に伝えられること
  • 周りはMOS受験の人多かった。先に退出していくので焦ります。しかし別試験を受けているのですから、動じない心が大事。
  • Excelの操作に長けているに越したことはない。ショートカットも駆使してサクサクさばいていくスピード間があると安心です。
    思いつく基本的なものは
    Ctrl + 矢印キーでの移動
    Ctrl + Shift + 矢印キー使った範囲選択
    Shift + F3で関数検索のダイアログ
    Ctrl + D, Ctrl + R
  • デスクトップ用のキーボード慣れていたので良かった。受験会場はたいていデスクトップPCですから。

勉強に使用したテキスト

公式テキストのみで、基本は大丈夫と思いました。

私はベーシック向けの参考書も同時に購入。ベーシック向けの方だけに解説があることもあり、(季節変動とか、ソルバーの使い方とか)、両方持っていて有用でした。

 

 


あと、Udemyのコンテンツで、
【はじめての統計学】 エクセルで学ぶマーケティング統計分析&戦略 を一通り学習しました。
カイ2乗検定のあたりは、直前にUdemy見て理解を深めておいたのが試験でも役立った設問がありました。

 

最後に

 

結果は無事875点で合格しておりました~。良かった。「ビジネス統計スペシャリスト」資格持ってます、っていうと、このAI時代、なんかはったりききそうな資格名ですよね。
基本的な統計の考え方や、エクセルですぐできる分析ツールを使えるようになるので、データサイエンティストへの入り口としてはとてもよい教材となる資格なのではないでしょうか。
さて、次はG検定に向けて切り替えていきます~。

統計検定準一級の勉強方法、参考書籍のまとめ

※2021/11/01 更新

こんにちは。

 

結論から申し上げますと、

2021年6月20日、最後のペーパーテスト方式の「統計検定準一級」に

受かっていました!

 

というわけで、主に使った参考書、サイト、勉強方法についてまとめて

おこうと思います。

今後受験する方のお役に立てば、とても幸いです。

今後はCBT方式になりますが、要求する統計の理解のレベルはきっと変わらないはずです。

 

受験直後、難化した出題に絶望。当日の受験体験、自己採点時の一喜一憂は、以下からどうぞ。

eternalbluebullet.hatenablog.com

 

 

勉強方法ざっくり

ダメもとで問題を解いては、理解不足な箇所を参考書、ネット記事等で

補完。次の問題へ、というサイクルをただ繰り返していたのみですね。

 

いわゆる、パラシュート勉強法というやつです。

過去問題に最初からぶつかることで、何が自分に足りていないかを

自覚しながら、進めるやり方ですね。

 

(パラシュート勉強法に関しては、以前書いたこちらの記事をご参考まで)

eternalbluebullet.hatenablog.com

 

コツ、というか心構えとしては、

「解けない自分に絶望しない」

「解けなかった、という挫折、失敗を試験前に数多く経験するほど、強者になるはず」

という気持ちですね。

 

絶対にやってはいけないと、強く主張できるのが、公式の教科書を、

全て理解しきってから過去問題、という順番です。

 

シンプルに、公式の教科書は難しいことを、さらに難しい言い回しで書いてあるので、

辞書的に使うにとどめます。

 

私のスペック

・2019年に統計検定2級に合格(受験1回目で突破)

・30代前半

・大学、大学院では一応、機械学習系を学んだが、社会人の初め数年間でほとんどは忘却

・2020年までは統計など全く使わない普通のSE。データサイエンティスト部門にキャリアチェンジ

 

使った参考書

公式問題集(過去問)

2018−2019の1冊と、2016−2017の1冊、合計2冊とも書いました。

4年分ともに、大きな傾向の違いはないですが、

繰り返し要求されている類題がなんなのか、把握することができます。

 

どこまで式を暗記すべきか、という迷いは常にあると思います。

 

暗記していることが前提の出題があったら、当然覚える。

式の記載が問題文中にあるならば、覚えなくてもOK、と判断する。

 

また、一度きりしか出題のないものには、見切りをつけたりとか、

4年分あると傾向を頭に入れられるのが何よりのメリットですね。

日本統計学会公式認定 統計検定 1級・準1級 公式問題集[2018~2019年]

新品価格
¥3,300から
(2021/7/12 20:05時点)

2016、2017は難易度が若干簡単。

その分、試験前に自信をつける意味で、解き直しました。

日本統計学会公式認定 統計検定 1級・準1級 公式問題集[2016~2017年]

新品価格
¥3,300から
(2021/7/12 20:10時点)

 

(2021/11/01追記)

2015年から2021年の全6回分の試験を全パックした版が出ましたね!

1級の問題は含まれませんが、まずは準一級を確実に倒すのなら、おすすめです。

日本統計学会公式認定 統計検定 準1級 公式問題集

新品価格
¥3,300から
(2021/11/1 21:26時点)

 統計検定準一級対応 統計学実践ワークブック

この本は、マストですね。

 正直、参考書としては、過去問題とこのワークブックで十分では

ないかと感じます。

 

章ごとにテーマが分かれ、必ず演習問題がついています。

この演習問題が、「過去問題と同様のレベル、類題になっている」

んですよね。

 

苦手分野を集中して克服するのにもよし。

得意分野の演習量を増やして、自分のレベル上げを効率的に行うもよし。

 

そして、公式の教科書よりも、若干平易な、

教科書的ページもたくさんあります。

辞書的にも使えるので、極端な話、悪名高い公式本

は、このワークブックがあれば不要かなと。

日本統計学会公式認定 統計検定準1級対応 統計学実践ワークブック

新品価格
¥3,080から
(2021/7/12 20:11時点)

 

大変有用なYoutuberの方々

参考書でないところでは、

YouTubeで、素晴らしくわかりやすく、統計の本質を突いた

解説をしてくださる方々がおります。

 

問題を解いてつまづいた箇所が出た。

本、WEBの情報では、とても理解が追いつかない。

 

そんな時、

動画で、概要を広く、かつ本質を掴んでから、

問題と解説に戻ると、スッと理解できていることもあります。

① ヨビノリ先生

売れっ子予備校講師のような雰囲気で、緩急もつけて

解説してくれます。数式の渦に視聴者を巻き込むことなく、

平易な例、解説で、統計の基礎の本質を掴むことができます。

youtu.be

 

アイシア・ソリッド先生

ベイズ統計関連、主成分分析の理解では、かなり助けてもらいました!

特に、ベイズ統計のシリーズは必見。

難解な数式に踊らされているばかりだった自分はなんだったのか、という位、

本質にたどり着けた気がします。

 

アイシア先生、「わからない人の気持ちを分かっている!」ということをとっても感じます。難しい式をまず書いた後に、「これだけじゃまだクエスチョンだよね〜じゃあ

説明行くよ〜」という感じで、スタート地点に一緒にたって、教えてくれる

感じが良いですね。

 

こういった、視聴者目線に寄り添って教えてくれるだけでも、学習意欲って

何倍にもなると思うのです。

youtu.be

 

 

③熊野コミチ先生

今回の勉強期間中に、見つけた方です。

分散分析ってなんなんだっけ・・というところで、この動画を発見。

 

実務経験がかなり豊富であろうことを感じる解説が、魅力です。

製造現場での分析経験等踏まえて、実験計画法であったり、実験ありきの

分野について、具体例を交えて解説してくれます。

 

分散分析は準一級で頻出(ただし、私が受けた回はなし・・)ですので、

パターン演習だけでなく、深い理解が必要と思います。

youtu.be

 

参考になったWEBのコンテンツ

 

これ、おすすめです。

説明がすごく平易で頭に入ってくる。

また、具体例を交えて進んでいくので、

数式の波に溺れることがない。

 

息抜きがてらの読み物として、さらっと流すだけでも、有用でした。

検定の理解が、深まります。

ledge.ai

 

また、こちらも読み物として、息抜きにおすすめです。

検出力、過誤のあたり、教科書だけだとふーん、で終わっちゃいがち。

しかし、この書籍では、世の中に溢れる、いけてない統計検定ついて

苦言を呈する形で進んでいきます。

 

医療統計の例が多いですかね。

検出力だったり、必要なサンプル数だったり、実務ではどう考えるべきなのか、

といった観点も、少し学べます。

id.fnshr.info

 

さいごに

ここまで、色々とご紹介してきました。

しかし、大事なのは、精神論的ですが、

「試験中に挫けない心」だと思います。

 

実際、2021年の回は過去問題とまるで傾向が変わり、難化していたのです。

 

そんな中でも、諦めず、解ける問題は確実に回答し、

記述問題もしどろもどろでも、持てる知見を記述し、

歯が立たない問題も、少しでも消去法を行なって、マークする。

 

結果、5〜6割の自己採点ですが、合格することができました。

 

過去問題演習でパターン問題は条件反射で解けるようにしておき、

未知なる問題には、Youtubeの先生方から授かった本質の理解をもとに、

悪あがきする。

 

スマートではないですが、粘る気持ちが、大事と思います。

これから受験される方、ぜひ粘り強く!

そして統計、データサイエンス界隈を盛り上げていきましょう〜

 

ご紹介した書籍のまとめ

よろしければぜひご活用下さい。

 

 

 

 

2021/8月 統計検定の関連記事を追記 !

eternalbluebullet.hatenablog.com

 

eternalbluebullet.hatenablog.com

 

eternalbluebullet.hatenablog.com

 

理論だけでなく、エクセルで手を動かせる実務力もデータサイエンティストには

基本のきで必要です。

そんな時はこの資格をサクッと勉強、取得するのがおすすめです。

 

eternalbluebullet.hatenablog.com

 

 

 

ここまで記事をお読みいただき、ありがとうございます。

他の記事もぜひ覗いてみてください。

Twitterで更新情報も発信しています。

twitter.com

 

みんなの銀行の口座開設だけで1000円GETできます。参考書代の足しになります。

eternalbluebullet.hatenablog.com

 

実務ではビジネスのベーシックスキルも大事。ビジネス書の読書習慣を付けたい人に。

eternalbluebullet.hatenablog.com

 

 

 

 

 

 

【2021 #2】E資格受験体験記~受験の心構え、役立った勉強方法、参考書~

最終更新:2021/11/28

はじめに

f:id:EternalBlueBullet:20210828135639p:plain

 

E資格を受験してきました!

実際に受験してみての所感、

今後受けられる方のため、役に立った勉強法、

参考書などコンテンツを情報共有したいと思います。

 

2021/09/17 合格発表後追記

無事に受かっていました!

f:id:EternalBlueBullet:20210917123703p:plain

 

試験から約3週間後、金曜の午前中に唐突に届いたメール。

合格率は高いだけに、順当に試験対策をすれば、
十分合格可能ではないでしょうか。

 

得点率は可もなく不可もなく・・応用数学が若干低いのが気になります。

 

以下は、試験日当日に書き留めた、試験対策と当日の様子です。

これから受験の方、ぜひお役立てていただければ幸いです。

 

 

~試験の守秘義務は遵守します~

なお、E資格は過去問題の公開はなく、具体的な

設問の内容は他言禁止です。

 

ですので、設問自体への具体的言及は避けた

記事となることを、ご了承ください。

 

 

最善の勉強方法の結論

はい、これから受ける人に伝えたいことの結論です。

もう先人たちが語り尽くしている感もありますが、

黒本+ゼロつく1,2はマストでした。

徹底攻略ディープラーニングE資格エンジニア問題集 第2版 徹底攻略シリーズ

ゼロから作るDeep Learning 1Pythonで学ぶディープラーニングの理論と実装

ゼロから作るDeep Learning 2自然言語処理編

 

 

 

そして、Youtubeから、アイシアさんのDeepLearningシリーズ。

youtu.be

 

あえて、認定講座がどうだったかは深く語りません・・

人によって受ける講座は変わりますしね。

私の場合、講座だけだとポカーンと分からないままでした。

なんとか期限までに課題は終えなければ、

と理解不足のまま課題をこなし、修了。

 

講座を修了してから受験までの1か月、

黒本で問われるレベルを確認しつつ、

ゼロつく+アイシアさん動画で、深い本質的な理解を得る、という進め方をしました。

 

(後から認定講座のコンテンツを見返すと、8割くらいはわかるようになっていた。)

 

 

その他、SIGNATEには課金しているので、
強化学習のコンテンツは実装含めた理解に役立ちました。

 

何はともあれ、

黒本+ゼロつく+アイシアさん動画 をベースに、

transfomerやGANみたいに理解が難しいものは、

WEBで解説を漁ったり、深堀って補うやり方をしました。

 

 

会場の様子~試験前の手続き

はい、ここからは会場に行ってみて、感じた点を備忘録です。

・係員によるカンペのチェックは、マスクの裏まで・・。入念です。

・申込時のピアソンVUEのID,パスワードは、一切覚えてなくてOKでした。

MOS試験みたく、入力を求められると思い込んでいた。

・服装は寒暖調整できるものがGOODですね。冷房がきいていました。

 

・・・まあ、手続きについては特殊なことはありませんので、

受験にあたっての注意をよく読んでおけば、問題ないです。

 

 

私の場合、係員の方がやや無愛想に感じ、感情的にやや乱される場面も。

ですが、心を無にして試験に集中しましょう。

テストセンターの係員に、丁寧な接客を求める方が間違いですからね・・。

 

 

 

試験開始~身の回りで注意すべきこと

・2クリックくらいで、試験がはじまってしまいました!

 

・画面上で、電卓を出せる仕様になっていたようだが、

私は存在を忘れ&当日気づかず。

特に電卓があるよ~の説明がなかったように思います。

手計算した時間がもったいなかった。

 

・手汗が出る人は、ノートにかぶらないよう注意。

書き込むようのノート(ボード?)を渡されますが、

手汗の出る人は使用時以外、手に触れないよう、お気を付けください。

私は、水性ペンが負けてしまうほどの手汗で書けない状況がたまにあり、

焦りました。

 

・周囲の雑音が気になる人のためか、ヘッドホンタイプのマフがありました。

私は、衛生面をやや気にして、使わず。

 

焦らないための考え方

コード穴埋めって、最初の1個でつまずくと、

後も全部失点するのでは、と恐怖ですよね。

ですので、コード穴埋めでもし煮詰まったら、後回しにして

精神を整えてから、戻るのが良いと思います。

 

ちょっぴりでも見たことない雰囲気がコードにあると、

焦りますからね。

 

 

また、数式における記号も、教科書の記号と違うだけで、

ちょっと焦りますよね。

そんな時でも、じっくり問題文を読み解くことで、

頭の中にある数式との対応が、見えてくるはずです。

 

暗記で突破できない問題は、「理解」が必要

丸暗記でなんとかなるサービス問題は、

どの試験でも往々にあると思います。

それは良しとして、、

 

「理解」していることを試す問題が、
多くを占めていた印象ですね。

 

何かの手法ひとつとっても、

手法の登場前は、どんな問題があって、

どういう考え方のもと、

どのように解決した手法なのか。

 

こんな感じでストーリーとして理解することが

必要と感じました。

 

このあたりは、アイシアさんの動画シリーズが大変有益でしたね~

 

あと、「統計」の理解が役立ったなという印象もありました。
統計検定で、確率分布やら、尤度やら、ベイズやらと、
機械学習とも密接な分野を学んでいたことは、
大きなアドバンテージでしたね。

 

私は、2019年に統計検定2級、
2021年に準1級に合格しました。

準1級の攻略法は以下記事にまとめています。
挑戦される方はぜひ参考にしてください。

 

eternalbluebullet.hatenablog.com

 

(2021/11/28追記)協会サイトのシラバスは要チェック

後から思い出したので追記します。

協会のサイトで公開されているシラバスは、要チェックです。
特に、前回試験と比べ、シラバスに新規追加された項目は、試験に出やすいです。
実際、2021 #2もそうでした。自分より過去に受けた方と話す機会があったのですが、
やはり傾向は同じでしたね。

シラバスにわざわざ新規追加する位ですから、受験者に学習を要求し、
かつ試験でも試す分野になるのでしょう。

認定講座の教材や黒本で一杯一杯になってきますが、
一通り勉強した後、シラバスを上から順に丁寧に眺めて、
即時頭に浮かばない項目があったら、潰しておいた方が良いですね。

 

役立った書籍の紹介

再掲となりますが、E資格突破にマストな3冊を

あらためてご紹介。

お役立てていただければと。

 

 

2周目でまだ理解不足だった箇所は徹底的に掘るべし

 

逆伝搬の本質的理解が得られる一冊

 

Attentionの概念を理解することで、BERTなど最新手法の理解も進む

 

さいごに

ざっと受験直後、記憶の新しいうちに書いてみました。

 

大きな粒度の感想としては、

E資格は取ってからが大事だろうな、ということです。

 

今のところ、E資格よりレベルの高いAI資格はないと思います。

それだけに、E資格までで満足して学習を止めてしまうという人も

いるかもしれません。

 

しかし、E資格の勉強を通して感じた点。

ここ数年で見ても、めざましく最新手法はアップデートされ続けている

ということです。

 

ひとたび勉強、情報収集を止めると、あっというまに時代が

先にいってしまう、という分野でしょう。

 

試験勉強で得た知識は、あくまで、

これからの勉強の土台となるものに過ぎない。

 

謙虚な気持ちで、永遠の「駆け出し」と思って、

今後もアンテナ高く、データサイエンスに向き合いたいですね。

 

 

 

 発掘:勉強が捗らず鬱屈していた時の記事。

eternalbluebullet.hatenablog.com

 

 

 

ここまで記事をお読みいただき、ありがとうございます。

他の記事もぜひ覗いてみてください。

Twitterで更新情報も発信しています。

twitter.com

 

 

 

 

統計検定を取得するメリット3選(その③〜接する情報に統計リテラシをもって対峙できる)

こんにちは。ヤスヤスオンファイヤーです。

 

統計検定を準一級まで取得して、

役立っているな~と感じるメリット、

第三弾です。

 

 

 

ニュースを鵜呑みにせず、頭で考えられる

 

例えば、今日目についたこの記事。

www.asahi.com

 

若年層の2割が、接種しないという考え、とのこと。

他の年代に比べて、接種しないという考えの割合が高いという主張です。

 

※私はここでは、ワクチンの是非について論じるつもりはありません。

 

結論、私はこの記事の情報だけでは、

「記事の主張は立証できない」と考えます。

 

気になった点

世代間の回答割合を比べているということは、

・母比率の差の検定を行って有意差があるか確かめることが必要だろう。

とまず思う。

記事内には、こういった統計検定の実施有無など書いてありませんし、

元のアンケート結果のサマリくらいはリンクがあれば良いのに、

ありませんでした。

 

・そして、アンケート調査においては、母集団からバイアスが排除できているのか?

という点も注意が必要です。

例えば、「ワクチンの接種すべきかどうかのアンケートです。回答は任意です」だけだと、反対派で意見の強い人が、進んで回答するという可能性があります。
何のアンケートかは伏せて、無作為に回答者を選ぶなど、バイアスを排除することが必要です。

 

世の中には根拠の甘い数字的主張があふれている

今回例に挙げた件にかぎらず、

身の回りの数字って、専門家がしっかり検証した上で

出てきているものの方が、ずっと少ないと思います。

 

だからこそ、解釈が妥当なのか?

と自分の頭で検証すべき。

検証のための武器、その一つが「統計」リテラシ

だと思うのです。

 

おまけ:なんちゃっての数字に騙されないために

統計検定の公式テキストのように、学問チックではなく、

統計リテラシを付けられる、これでもう騙されない!

と自信になった書籍を2冊ご紹介します。

アフィリエイトリンクになっています。m(__)m) 

 

分析者のためのデータ解釈学入門 データの本質をとらえる技術

データを集めて、関係性を解釈していく。

機械学習に行く前に、どんな「目」でデータを見るべきか、

平易にかつ網羅的に説明がされています。

 

データにありがちなバイアスの種類についても、

体系的にひとつの章で解説がされています。

この章のおかげで、データのバイアスには気を付けよう、と

学びましたね。

 

相関と因果の違いといった、基本だけで最重要ではないか?

といった考え方もすっきり。

 

こういったデータを見る目が高まれば、

前処理をゴリゴリできる実装力だけでない、

いい感じのデータサイエンティストと言えるのでは。

 

分析者のためのデータ解釈学入門 データの本質をとらえる技術

新品価格
¥2,600から
(2021/8/27 17:27時点)

著者はTwitterだとゆるめの発言がキュート

 

統計学が最強の学問である

「ランダム化」という、これも統計の世界において基本でありつつ、

実験、アンケート調査ではかなり重要な概念を、重点的に

読者に叩き込んでくれる一冊。

 

世の中のデータは有象無象。

しかし、「ランダム化」を味方に実験をデザインすることによって、

意味のある主張を導くことができる。

 

今回例にしたアンケートも、きちんとランダム化したアンケート調査で

あるならば、根拠をもった主張になる。

だからこそ、今回私は、ランダム化できているのか?

という観点でも、疑いをもつことができたのでした。

 

数式は少なく、読み物として楽しめる一冊です。

 

統計学が最強の学問である

新品価格
¥1,760から
(2021/8/27 17:28時点)

統計×機械学習×そしてとめどないチャレンジ精神で最強の人材に・・

統計検定を取得するメリット3選(その②〜機械学習の理解がはかどる)

こんにちは。ヤスヤスオンファイヤーです。

 

統計検定を取得して良かった!メリットの

第二弾です。

 

機械学習の基礎理論の理解がはかどる

統計と機械学習

切って離せない分野ですので、当然と言えば

当然ですが、統計の理解が先にあると、

機械学習の随所に出てくる基礎の部分の考え方を、

理解するのが早まります。

 

私はE検定を2021年夏、まさに今週末受験予定なのですが、

統計検定で先に理解しておいてよかった、と思う部分が

たくさんありました。

 

ざっと思いつくだけでも、以下のような項目がわかっている事で、

ディープラーニングはじめ各種機械学習アルゴリズム面を

理解するのに役立ちます。

正則化の考え方

ベイズの定理

・最尤法

正規分布とはそもそもなんぞやの理解

・確率分布

 

うーん、統計の立場からすると、どれも基本かもしれませんが、

機械学習の数式を読み解くのに、自然と役立っていますね。

強化学習は条件付き確率祭りだし、

最尤法は、至る所でパラメタ推定の考えに出てきますね。

 

そもそも統計と機械学習の関連

一般的には、

統計は、過去のデータを分析するもの、

機械学習は、未来のデータを予測するもの、

と区分けしたりしますね。

 

別の見方としては、

統計は、解釈、説明できる結果を提示するもの

機械学習は、精度さえ良ければ、説明性はなくても良いもの

・・と、大雑把に分ける考えもあります。

 

例えば、(やや無理矢理な例ですが)

選挙の当選確率を、出口調査の途中経過から推定せよと言う時、

統計ならば:ある候補への投票率を母比率と見做して、現在の

調査人数の結果からだと、母比率の信頼区間は50~60%、みたいに、

「解釈を全て説明できる」ことが重視される。

 

機械学習的なアプローチならば、

出口調査の結果を地域、年代別に分けて説明変数とし、

過去の選挙のデータから作ったディープラーニングモデルに

突っ込んで、結果は45%。

なぜこの数値かは、過去のデータから作ったモデルが

そう出力したから、としか言えない。

(もっとも、どの変数が効いていたかとか、結果の理由を

掘り下げようと思えばできるが、どちらかというと

結果さえ良ければOK、という立場)

 

こんな違いのイメージです。

 

ちょっと話が逸れましたが、実務家としては、

手堅く説明ができるという統計的な見方、

結果優先で最適解を導くという機械学習のアプローチ、

両方の頭をスイッチしていけるのが、つよつよ

だと思っています。

 

実務において、統計の理解が役立つ場面

さて、実務において、統計的な知見が役立っていると感じるのは、

モデルを適用したが、上手くいかなかった、その理由は?

と考える時です。

 

とりあえずモデルを作って試すだけなら簡単ですが、

往々にしてうまくいかないことはある。

なぜダメか?を突き詰めるときには、

基礎理論の理解の積み重ねが、最重要と感じます。

 

シンプルな重回帰モデル一つにしても、

正則化の手法の選択

・多重共線性の回避

・回帰係数をどう解釈するか

・正規化の有無の影響

・・・

などなど、うまくいかなかったときにチェックすべきポイントって、

たくさんあります。

これらを引き出しに持っておき、

正しく検証していけるか。

その土台には、統計の知見が必要なことは間違いありません。

 

線形回帰は、ちょうど、統計と機械学習の中間くらいの存在で、

良い勉強材料ですね。

 

ちなみに私、kaggleで人気のlightgbmなど、内部まで

深く理解をしていないため、

ハイパーパラメタのチューニングなど、考えて応用を

効かせることが全くもってできません。

Lightgbmがうまくいかなかった後に、呆然と止まってしまうとき、

内部の理解が大事だな〜、と実感します。

はよ決定木も理解せい、という感じですね。

 

 

ディープラーニング系は実務ではまだ扱ったことがないので、

適用することがあれば、どのレベルまで内部の理解が必要か、

体感してみたいですね。

 

さいごに

と言うわけで、統計検定を取ってよかったメリット2点目でした。

後日、3点目も書いていこうと思います。

 

追記)8/27 第三弾書きました!

 

eternalbluebullet.hatenablog.com

 

 

 

 

 

統計検定準一級のまとめはこちらより。 

eternalbluebullet.hatenablog.com

 

 採算度外視で、駆け出しデータサイエンティストが相談に乗ります。

eternalbluebullet.hatenablog.com

 

 

   

 

統計検定を取得するメリット3選(その①〜実戦への自信)

こんにちは。

 

今日は、データサイエンティストらしく、

「統計検定」を取得して、役立っているなぁ、と感じる

場面を3つご紹介します。

 

これから受験をする方に届けば幸いです。

少しでもモチベーションになればと。

 

私の取得歴とデータサイエンス業務

2018年に3級、

2019年に2級、

そして2021年に準一級と、級を上げて参りました。

 

そして、データサイエンティストと名乗れるよう

ジョブチェンジしたのが、2021年。

今は、AI適用業務に携わっています。

 

データサイエンティストになるまでの下積みとして、

統計検定を学習の指針にしてきた感じですね。

 

ですので、実業務に入って、この資格取得で得た

知見がどう役立ったかは、割と語れるのでは

と思っています。

 

 

では、統計検定を取得するメリット3選です。

最低限の統計リテラシはあるぞという自信を持って業務に臨める

いきなり精神論的ですね笑

 

しかし、平均、中央値、分散だったり、

標準偏差、標準誤差など・・ごく基本の基礎統計量というべき知識、

これらは、ごく普通に顧客との打ち合わせでポンポン出てきます。

そう、AIをやろうというお客様も、統計リテラシのレベルは

高い方がいるな、と感じます。

 

ですので、請け負うベンダー側の私のような立場としては、

お客様に統計、機械学習の分野で劣っている分野があると、

多少なりとも信頼を失うことにもなります。

また、共通言語として、日々の会話の中で、当たり前に

統計の基礎概念は理解した上で発言する必要があります。

 

例えば、相関と因果の違いだったり、

重回帰分析における多重共線性の問題だったり、

ツーカーで話さないといけません。

 

で、やはり統計検定2級、準一級を持っているぞとなると、

たとえ一瞬、わからない感じの雰囲気を出してしまっても、

周辺知識を一度思い出せば、話についていく事ができます。

 

・・・大分、主観的な見解を述べてしまっておりますが、

要は、外国語に例えると読み書きできる基礎スキルのようなものは

統計検定によって理解することができますから、

自信を持って現場に飛び込める、ということですね。

 

 

ここまで書いて、その①だけでも長くなってきましたので、

その②、③は、また後日書いてみようと思います!

 

 

(追記)メリット3選その②を書きました。

eternalbluebullet.hatenablog.com

 

準一級のまとめはこちら 

eternalbluebullet.hatenablog.com

   

自分の時間というリソースは有限。一つのことにコミットすべき。

こんにちは。ヤスヤスオンファイヤーです。

 

今日の結論としては、

何かに取り組んで成果を上げたいときは、

時間リソースを集中投下。あれもこれもと

やりすぎず、一つのことにコミットすべき、

ということです。

 

voicy.jp

 

イケハヤさんの放送より。

 

イケハヤさんはかなりタフそうではありますが、

確かに今はボイシーに集中しています。

YouTubeやブログは更新していない。

 

いろんなビジネスを持っている人でも、

1日の時間は同じ24時間。

成果を上げるには、誰しも集中することが

大事なのですね。

 

常に資格勉強状態から、一旦脱却をします

以前も、資格試験ばかりを受けていると、

好きな本にふっと集中したりとかできなくなる

デメリットもあるなー、と感じていました。

eternalbluebullet.hatenablog.com

 

 E資格が終わったら、いったん資格ゲッターなモードは

お休み。

代わりに、kaggleのメダル取得を目指して、コミットして

いきます!

 

あと、結婚式に向けての準備もあったり・・。

優先して、妻と協力的にやっていく必要がありますからね。

 

Kaggleは、もし成果が上がらなかったとしても

真剣に取り組めばスキルアップに繋がりますし、

受験料みたいに金銭を失うわけでもないので、

資格試験よりは気が楽になりますね

 

ちょっと甘い算段をしつつ、、本業のデータサイエンス、

余暇はkaggleと、アウトプットにブログと、

やっていきたいと思います。