2018年度の統計検定1級を受験した話

同じような記事はいくらでもあると思うが、合否の判断材料は多い方が助かる人もいるのではと思い記事にする(統計検定1級は合否の基準が公開されていないので)。

試験結果


1級は午前の「統計数理」と午後の「統計応用」それぞれ90分の試験がある。どっちも合格することで1級合格となる。
どちらかが合格になれば来年以降にもう一方だけ受験して合格すれば1級合格となる(経過措置は9年)。

午前の統計数理は合格だったが、午後の統計応用は不合格だった。

1級「統計数理」合格
[1](1)o(2)o(3)o(4)x
[3](1)o(2)o(3)o(4)△(5)x
[5](1)o(2)o(3)ox
1級「統計応用」不合格
[1](1)o(2)x(3)o(4)△(5)x
[2](1)x(2)o(3)x(4)x(5)x
[5](1)o(2)ox(3)ox

受験した経緯


数理統計を勉強するモチベーション向上のため。そもそもなんで数理統計の勉強しようと思ったかは以下。

私と統計学

 

私がやってた統計検定の勉強方法、数理統計の勉強をしようと思った経緯を含めて、私と統計学の関わりについて時系列で述べる。これくらいの勉強をすると1級午前に受かって午後には落ちるんだなあという情報が誰かの役に立つと嬉しい。

学部2年


初めて授業で統計学なるものに触れる。「入門・演習 数理統計」という本がテキストだった。

 

入門・演習 数理統計

入門・演習 数理統計

 


以下の理由で挫折。
・テキストが全く初学者向けではない
・授業にほぼ出席しなかった
・そもそも授業が意味不明だった
・当時は他の授業に力を入れていた
・自分は暗記が苦手なのに、テストが暗記ゲーすぎる
最終的に単位ゲットには成功したものの、他の専門科目より成績が悪かったので、向いてないかもなあと思うなどして、以降統計系の科目をとったり勉強をすることをやめた。

修士2年

時は流れ修士2年。修論が早めに片付いたため、今までやってみたかったけどやれなかった勉強をやりだす。
その一環で「統計学入門」を読んだ。読むだけ読んで、すぐに全てを忘却した。

 

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

 

 

社会人2年目(2018年4月)


以下のような理由で統計の勉強を再開させた。
・配属ガチャに失敗して数理科学に関わる仕事をしないことになったため、データサイエンス的な勉強をしなければならないのではないかという漠然とした焦燥
・統計コンプレックスが消えていなかった
機械学習などの勉強をすればいいのかもしれなかったが、それより統計の理論的なことの方が興味があった。
・ガッツリと何かの理論を勉強したい気分だった。

手始めに「プログラミングのための確率統計」を読む。しかし読了後全てを忘却する。

 

プログラミングのための確率統計

プログラミングのための確率統計

 

 

2018年5月


読むだけだと全てを忘却するだけと悟り、「統計学入門」を読み直し&演習問題をやることにした(演習問題は全てやったわけではない。計算があまりにもだるそうなものは避けて、基本的な知識の定着に役に立ちそうな問題を選んでやった)。

2018年7月


本格的な数理統計の勉強をするために、読む参考書を探す。最終的に「現代数理統計学の基礎」という本に決めた。

 

現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

 


決め手は以下。
・解答と補足資料がネットにある
・新しい
・ネットで調べたところわかりやすい講義をする先生らしい
・統計検定1級を若干意識しているらしい
・経済学部の講義ノートが元
・他の本で取り扱いが別れる部分が各数理統計学の本にはある(共通部分は検定・推定まで)のだが、この本の取り扱ってる分野は僕の勉強したいことがコンパクトにまとまっていそう(ブートストラップ法、MCMC、補足資料にノンパラ)

(上記の期待はいくつか裏切られた。あとで統計検定1級の過去問を見たら「数理統計学―基礎から学ぶデータ解析」の方が統計検定1級の範囲を網羅していたので、直前期はこちらの方を参照していた。あとブートストラップ法、MCMC、ノンパラとかは行間埋めるのがきつそうだったので読むのを諦めた。他の本で勉強した方が良い気がしている)

 

数理統計学―基礎から学ぶデータ解析

数理統計学―基礎から学ぶデータ解析

 

2018年8月


「現代数理統計学の基礎」は演習問題がたくさんある。全部やろうとしたが以下の理由で諦めた。
・たくさんありすぎて、11月の統計検定までに間に合わなそう感じた。(死ぬ気で頑張ればできたのかもしれないが、しんどい。基本的に1日3時間以上の勉強は辛すぎて僕にはできない)
・統計検定対策をするなら、演習問題より本文の暗記をした方がよさそうと感じた。統計検定1級の問題はモーメント母関数の導出などの、教科書本文のコピペみたいな問題が多い

本文を読むだけでは細かい計算が頭に入らないため、写経をすることにした。2章から写経を行った。一言一句写経したわけではなく、式変形のポイントだけ書いた。よくて1日5Pくらい。

2018年10月
教科書全部写経したかったが、モチベーションが落ちてしまったのと、9章以降がかなり雑な書きっぷりに見えた(&検定対策という意味ではやらなくていい範囲に見えた)ので8章までで写経を諦める。
覚悟を決めて1級の受験申し込みを行う。
ここから過去問を解く作業を始める。よくて1日大問1つのペース。解けなかった問題は一応解答を見て納得をするのだが、解き方を忘れるので、翌日の通勤中に目で解けるかのチェックをしていた(結局解き方を忘れて凹んでいた)。

2018年11月


統計以外の勉強をやめてプライベートの勉強時間は統計検定1級対策だけに充てていた。
過去問が全然解けないので若干合格を諦めていた。大学受験より頑張っていたので、胃腸の調子がめちゃくちゃ悪かった。

2018年11月25日

検定当日。大学受験より勉強したので、大学受験より緊張してしまった。
会場は東大だった。広くて迷う。

2018年11月25日午前(統計数理)


試験スタート。統計検定1級は午前・午後共に大問5つのうち3つ選んで論述回答する形式なのだが、問題を見て1,3,5を選択。2,4は手が出せそうになかった。
大問1の(1)でいきなりつまづく。典型的な問題だが完全に緊張で解法が飛んだ。それでもなんとか解き終える。
大問1,3はかなり自信なく解答したが、大問5は過去問そのままだったのでスムーズに解答。
ちなみに解答冊子に罫線が入っているが、とても分数の分子・分母が入りきる大きさではないので、罫線を無視した解答をせざるを得なかった。

2018年11月25日昼休み


午後の試験は午前と受験集団が一応違うため、一旦教室の外に追い出される。
緊張で食欲がわかないため近くのコンビニでサンドイッチだけ取る。
大学の広場では最後の追い込み勉強をしている人がたくさんいたが、僕は「直前勉強とか意味なくね?」とスカしていたため(しかしど緊張)、東大をブラブラする。東大広い

2018年11月25日午後(統計応用 理工学)


大問1,2,5を選択。大問3,4は手が出せなそう。
大問1(2)でつまづく。過去問で類題を見ていたので解けると思ったのだが、結局解けずに終わる。それ以外の大問は全然よくわからなかった。時間が余ってしまい、「こりゃ落ちたな」などと思う。

2018年11月25日 試験終了後

「統計検定1級」でリアルタイム検索すると、午前午後共に同じ問題選択をしている人が多そうであることを知る。やはり選んだ問題以外は知識を要求するから、みんな選ばなかったのかなあ、などと思う。

2018年12月17日


検定の合否発表が出る。午前合格・午後不合格。予想通りというか、午前受かっててホッとする。

2018年12月19日

今回の統計検定の受験者数、合格率などが発表される。今年は午前午後共に約20%で、2016,2017年の約25%と比べるとちょっと厳しい年だったと言えるのかも。

統計検定1級について思うこと


・かなり覚えゲー要素が強い。高校時代で例えると、模試より定期試験に近いかも。ウンウン考えて解答できる状態ではダメで、即答できないといけない。例えば、ガンマ関数のモーメント母関数の導出するときの積分計算にテクニカルな変形が必要になるが、そこはあらかじめ抑える必要がある。
・合格するためには選んだ大問3問全てについて「7割解けそう!」という感触が持てないとダメそう
・教科書の問題を解くより、教科書に書いてある証明を覚えた後に過去問を解くのが良さそう
・分布の確率密度関数は問題文で与えられるので覚えなくて良さそう
・教科書の証明は全て覚える必要はなくて、出そうなものだけ覚えれば良さそう。出そうなものの基準として解答が長すぎたりしないことがあると思う。例えば、ガンマ分布のモーメント母関数の導出は出ても、正規分布のモーメント母関数の導出は出ない気がする
・いい試験だと思う。暗記は苦手だけど、数学やる上ではやった方が良いことだと思うので、モチベーションになってよかった。

これからどうする


とりあえず来年応用だけ受けようと思います。今過去問見たら全ての知識を忘却してて笑う。

2018年のプライベートで読んだ本振り返り

数理科学に興味があるITエンジニアが2018年にプライベートで勉強したことのまとめです。どうしてこの本読んだのかとか、どういう内容だったのかとか、気が向いたら別記事にして詳しく掘っていきます。

1~5月:暗号の代数理論4~5章、暗号技術入門、量子コンピュータ―超並列計算のからくり一部、プログラミングコンテスト攻略のためのアルゴリズムとデータ構造1~13章、プログラミングのための確率統計

暗号の代数理論
暗号の代数理論

暗号の代数理論

 

この本は2017年の6月から読み始めて、演習問題も全部解いていたが、残すところ6章のみとなったところで挫折し、5章まででやめた。

 もともとグレブナー基底の暗号系への応用についての興味から読んでいました。

暗号技術入門
暗号技術入門 第3版

暗号技術入門 第3版

 
量子コンピュータ―超並列計算のからくり
量子コンピュータ―超並列計算のからくり (ブルーバックス)

量子コンピュータ―超並列計算のからくり (ブルーバックス)

 

 「暗号の代数理論」で勉強したことを無駄にしたくなかったので、「耐量子暗号についてしゃべる」という題目で会社で発表することにした。耐量子暗号とは、量子コンピュータが実用化されても利用できる暗号系のことです(逆にいうと、今使われているRSAなどは量子コンピュータが実用化されると破られてしまうと言われています)。「暗号の代数理論」自体は耐量子暗号の文脈ではなくいくつかの暗号系と代数学の関わりについて書かれたことだったので、発表資料をまとめるために追加でちょっと勉強しました。

 プログラミングコンテスト攻略のためのアルゴリズムとデータ構造
プログラミングコンテスト攻略のためのアルゴリズムとデータ構造

プログラミングコンテスト攻略のためのアルゴリズムとデータ構造

 

こちらは上記の発表とかとは関係なく、独立で勉強した。13章までが基礎編みたいな感じで、そこまでやった。

ぶっちゃけあまりプログラミングコンテスト対策にはならないと思ったけどこれは別記事かく気になったら書きます。

アルゴリズム自体の勉強としてはとても良い本だと思います。

 プログラミングのための確率統計
プログラミングのための確率統計

プログラミングのための確率統計

 

 ふと統計のことが知りたいと思い勉強することにした。数理科学系の学科を卒業しているのだが統計は苦手で、今まであまり勉強していなかった。

あとで書く「統計学入門」は修士の時に読むだけ読んだことがあるのだが全てを忘却していた。

この本は6章まで読んで、結局全て忘却してしまった。

6~7月:統計学入門5章〜、Spring徹底入門2,14章、ふつうのLinuxプログラミング6章まで、AtCoder始めた 

統計学入門
統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

 

前述の通り読むだけ読んだことがあったのだが、手を動かさないと統計は身につきづらいのではないかという仮説を立てた僕は「統計学入門」をもう一度読んでさらに練習問題もやることにした。1〜4章は飽きそうな内容だったので触れないことにした。

練習問題は全てやったわけではない。「ある年の宝くじのデータは以下の通りで〜」みたいな、手を動かす量が多すぎる問題は避けた。

有名な本なのに誤植が多い。特に練習問題。しかしこのレベル感の本で他にいい本があるのかは知らない。 

Spring徹底入門
Spring徹底入門 Spring FrameworkによるJavaアプリケーション開発
 

 業務関係のこともちょっとは勉強しないといけないのではないかと思い2,14章を読んだ。2章はSpring Coreのことについて。結構理解度が上がるいい文章だった気がする。難しくて「あ、そういうこともあるのね」みたいに流した箇所も多い。14章はチュートリアルになっていて、ひたすら写経。thymeleafのところは業務に関係なさそうだったのでコピペで飛ばした。このチュートリアルが結構長くて、70ページくらいあったが、実践的で良かった。具体的には、僕はMVCとかのアーキテクチャのことわからないので、そこを意識したチュートリアルなのが良かった。

 ふつうのLinuxプログラミング

業務関係ではないのだが、もうちょっとITに寄った勉強したほうがいいのではないかと思い読んでみた。7章あたりからコマンドの説明を網羅的に書くような天下り的な書き方が多くて、挫折。そこまで興味がなかったということですね

AtCoder始めた

前述の「4月:プログラミングコンテスト攻略のためのアルゴリズムとデータ構造」をやってるときはつまらなかったのだが、コンテスト自体はかなり楽しいと感じた。今まで趣味らしい趣味を持つことなく生きてきたのだが、これはいい趣味になりそうと感じた。2018年はある程度継続的にコンテストに出れたので、2019年も継続的にコンテストに出たい。

 8~11月:現代数理統計学の基礎2〜8章、蟻本、統計検定1級受験

 現代数理統計学の基礎
現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

 

実践的な統計処理より、まず数理統計について興味があったので、理解を深めるために読んだ。後述の統計検定1級の参考書としても利用。練習問題は量が多くて早々に諦め、9章以降に関してもヘヴィだったため諦めた。

 プログラミングコンテストチャレンジブック
プログラミングコンテストチャレンジブック [第2版] ?問題解決のアルゴリズム活用力とコーディングテクニックを鍛える?

プログラミングコンテストチャレンジブック [第2版] ?問題解決のアルゴリズム活用力とコーディングテクニックを鍛える?

 

 通称「蟻本」。前述の「プログラミングコンテスト攻略のためのアルゴリズムとデータ構造」がアルゴリズム自体の理解を深める本だったのに対してこちらはアルゴリズムの使い方について書いてある、本当のコンテスト対策の本である。統計検定対策が本格化するまで読んでいた。

統計検定1級受験

統計検定1級は午前と午後に分かれているのだが、結論をかくと午前だけ合格・午後は不合格だった。

勉強法としては、上記の「現代数理統計学の基礎」を2〜8章まで写経してあとは過去問を解いていた。過去問を解くうちに「現代数理統計学の基礎」より「数理統計学―基礎から学ぶデータ解析」の方が統計検定1級の範囲をカバーしている上に記述も丁寧だと気付いた。 

数理統計学―基礎から学ぶデータ解析

数理統計学―基礎から学ぶデータ解析

 

 統計検定1級の受験についてはやる気が出たら別記事にまとめたい。

12月:蟻本

12月は統計検定が終わったので蟻本の勉強を復活させた。仕事が忙しくて電車内で気が向いたときに読むくらいしかできなかったが。

 

2019年どうするか

目標としては、以下3つ。

AtCoder青色

・統計検定1級午後合格

・Kaggleとかやってみる

AtCoder青色 

現在水色なので、青色を目指す。圧倒的に演習量が足りないのでここをどうにかしたい。AtCoder挑戦についても気が向いたら別記事にまとめたい。

統計検定1級午後合格

午前・午後合格することで、正式に1級合格となるようなので、不合格だった午後を今年も挑戦したい。多分過去問ちゃんとやればなんとかなるでしょ。

Kaggleとかやってみる

数理科学に関わるお仕事をしたいと言いながらデータ分析については全くやったことがないので、こういうのもやってみたい。

ところで数理科学に関わる仕事がしたい件

正直数理科学に関わる仕事がしたいと言う割に、素養も演習量も興味も足りない気がする(数理科学に関わる仕事をしている人はもっと素養も演習量も興味もあって、かつ業界的に僕が入れるようなパイの広さではない気がする)。でもやってみたい。ここら辺のコダワリどうするかも2019年考えないとね。