読者です 読者をやめる 読者になる 読者になる

無駄と文化

実用的ブログ

統計を学んで今をときめこう! 〜 統計検定2級でこんなこと出来るよ編 〜

統計

f:id:todays_mitsui:20151130082943p:plain

去る11月29日、統計検定の2級を受験してきました。

私は資格試験を受けるとき、業務独占性やブランド感よりも、資格の学習を通じてどれだけの知識を獲得できるかを重視しています。
なので、今回の統計検定についても、統計学の体系立った基礎知識が身についたことをすごく喜んでいます。


で、せっかくなので受験したてのホヤホヤのこの熱意が冷めないうちに、実際に学習してみて分かった統計検定2級を通じて出来るようになる事をリストアップしてみようと思います。

「統計なんて勉強して何になる?」という疑問に対するひとつの解答になれば幸いです。


統計検定ってどんな試験?

まずは試験の概要を、

「統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。 データに基づいて客観的に判断し、科学的に問題を解決する能力は、仕事や研究をするための21世紀型スキルとして国際社会で広く認められています。 日本統計学会は、中高生・大学生・職業人を対象に、各レベルに応じて体系的に国際通用性のある統計活用能力評価システムを研究開発し、統計検定として資格認定します。

統計検定 公式サイトより抜粋

と、いうわけで、統計検定は日本統計学会認定の統計の統一試験です。
中学生レベルから大学の専門・応用レベルまで広くカバーしているのが特徴ですね。

2級では大学の理系学部の1年生が「数理統計」で学ぶ程度の知識が要求されます。


ではそれを踏まえて、


統計検定2級を通じて身につくこと

あ、ここから口調を変えていきますね。

ちなみに三井は、理系の大学を卒業した(統計は卒論でも使った)けど、統計についての知識は「平均をとって大きいとか小さいとか言う」とか「割合を計算して大きいとか小さいとか言う」のがせいぜいのレベルだったよー!

そんな人でも統計検定のために勉強すれば...


何かが起こったときに結果から原因を推定できるようになるよ!

ベイズ統計学という現代において重要な一分野があるらしいんだけど、その基礎になるベイズの定理について理解できるようになるよ。

ベイズの定理で扱うのは逆確率ってやつで、通常の原因があって何が起こるかという推定じゃなくて、何かが起こったときその原因は何だったのかを定量的に推定できるようになるよー。


たとえば、一定の確率でガンを見つけられるけど間違えちゃうこともある簡易的なガン検査で陽性をもらっちゃった時に、「陽性にになったとき本当にガンが在る確率」みたいなのを計算できるようになるよ。

一般的にビジネスの場では、すでに出てる結果に対して原因は何だったのかを探ることが多いから、逆確率の考え方を理解しておくと便利だね!


時系列データから周期を推定できるようになるよ!

一つのデータを毎日とか毎月とか追っていくことってあるよね!

たとえば、月ごとの電力消費量に周期性はあるのかな?なんとなく夏と冬は電力の消費が増えそうだし、6ヶ月周期とかで似たパターンを繰り返してそうだよね。


コレログラムという武器を手にすれば、毎月の数字が並んだだけのデータを分析してデータの周期性を視覚的かつ定量的に語れるようになるよ。

f:id:todays_mitsui:20151130075156p:plain

上向きの縦線がピョコンと伸びている場所が周期性が強く出ている時点だよ!
こんな便利な分析法があるとは全然知らなかった。完全にすごい。


信頼できるデータを取るために何件くらい調査すればいいのかが具体的に分かるようになるよ!

たとえば、「あなたは夏と冬、どちらが好き?」みたいなアンケート調査をするとして、50人からアンケートを集めれば、 「夏が好きな人の割合はx±14%!!!!」みたいな結果が出せるよ。

『いや、±14%って幅ありすぎでしょ? 』って思ったかな?
けど、偶然にも夏好きな人ばっかりつかまえちゃうかも知れないし、逆もあり得るし、統計的に考える以上 仕方ないね。


ランダムに声をかける以上、結果に幅が出ちゃうのは仕方ないんだけど、振れ幅をもうちょっと小さくしたいよね。
だいたい1000人を調査すれば、結果の振れ幅は±3%に収まるみたいだよ。

振れ幅を±1%まで抑えたくなったら?
区間推定を学べば、必要な人数を見積もれるよ。±1%の幅で結果を言い当てたいなら約9600人くらいを調査すればよさそうだね!

±0.5%に収めたかったら? 約39000人だよ!頑張ろう!!


男女別・年代別みたいなグループの差が結果に影響してるのか?? を調べられるようになるよ!

男女の違いによって内閣支持率に差があるのか?? とか、年代の違いによって好きなお酒に差があるのか?? とか、グループに分けて特徴を見るの重要だね。

ときには『いや、支持率の話してる時に男とか女とかは関係ないでしょ』って言いたくなる時もあるかも。
でも、関係ないという証拠を示さなければ君のボスは納得してくれないよ。


そんなときは、ちゃちゃっと分割表を作って独立性の検定をしようね。
{\chi ^2}分布についての知識があれば、関係あるとか無いとかの議論に統計的に白黒つけられるよ!つよい!


回帰式の導出と評価ができるようになるよ!

回帰式ってのは、原因のデータから結果のデータを導き出すための便利な一次関数だよ。

たとえば、賃貸住宅の家賃って、「部屋の広さ」とか「最寄り駅からの距離」とか「築年数」によって予想できるんじゃないかな?? って思うよね。
逆に、「部屋の広さ」と「最寄り駅からの距離」と「築年数」から家賃を計算する式が分かれば、各物件にふさわしい(妥当な)家賃の額が分かるかも?


はい、
最小二乗法を用いた回帰分析ってやつを使えば出来るよ!

しかも、ただ便利な計算式が分かるだけじゃなくて、その式がどの程度リアリティのある数字を導けるのかも定量的に評価できるよ。
せっかく手に入れた回帰式がへっぽこだったら使えないからね。

回帰式がイマイチだったときは部屋の階数とか窓の向きとかの情報を足してあげるといい感じの式になるのかも? とかそんな議論もできるようになるね。


または、100メートル走のタイムみたいな、男女でめっちゃ差が出るデータを推定したいのに元データが男女混合になっちゃってるみたいな、元データがイマイチなパターンにもはまらずに対処できるようになるよ。

ホント、統計検定を受けると回帰分析については鍛えられるよねー。


まとめ

今回は、何の役に立つのかわからないと勉強する気になれない畑の人のために、統計検定のために学べばこんな事に役に立つよ特集でした。

まとめるね、

  • 逆確率で結果から原因を推定できるようになる!
  • 時系列のデータから周期を調べられるようになる!
  • アンケート調査で何件集めればいいか計算できるようになる!
  • グループの差が結果に関係あるか無いか白黒つけられるようになる!
  • 超絶便利な回帰式を導出して、式の信頼度チェックまでできるようになる!

すごい!


ちなみに、試験会場行ってみて女性の割合が激少ないことを確認したので、統計検定を受けてもモテるようにはならないと思われるよ!統計的にね!


私からは以上です。