思索日記

本を読んで思ったことを書いてます。

二項分布によれば、俺は勉強しなくても応用情報受かる

明日10月9日は応用情報技術者試験 秋期の試験日です。 IT業界入って5年目で今更感ありますがまあ持ってないのもどうかなと思ったので明日受けてきます。

最初のころは必死こいて勉強してたのですが、途中から「あれ、これもう頑張らなくてもいけるわ」と気づいたのでぱったり勉強するのをやめました。

二項分布で合格可能性を予測する

二項分布は、YES/NOで判定できて確率で起きる出来事を何度か繰り返したとき、YESとなる回数を確率分布にしたもの(グラフにしたもの)です。

  • コインを10回投げて、表が出る回数。
  • サイコロを12回投げて、1が出る回数。
  • 1週間のうち晴れの日数。*1
  • たくさんある製品の中から100個を標本として抽出したとき、不良品の個数。

試験問題も同様に考えられます。

  • テスト80問を解いたうち、正答できる問題数。

二項分布の表記

二項分布は、2つの数値n, pを使って表記します。
n: 試行回数。つまり繰り返し回数
p: 1回の試行でYESとなる確率

このときYESとなる回数xは、記号B(二項分布のこと)を使って

 \displaystyle
x 〜 B(n, p)

と表します。

上記の例であれば

n YES事象 p
コイン投げ 10 表が出ること 1/2
サイコロ投げ 12 1の目が出ること 1/6
晴れの日数 7 その日の天気が晴れであること ?
不良品の個数 100 選んだ1つの標本が不良品であること ?
テストの正答数 80 一問解いて正答すること ?

正答数を二項分布で表す

応用情報の試験は午前と午後で構成されます。 午前は選択問題、午後は記述式問題です。 話を簡単にするため、午前問題だけで考えます。

午前問題は1問1点、80問出題で合格ラインは60%=48点です。

私のいまの実力が正答率Pだとすると、私の正答数xは

 \displaystyle
x 〜 B(80, P)

と表せ、「母数(80, P)の二項分布に従う」と言えます。

正答数を予測する

二項分布に基づく確率変数がある値になる確率は、 (言い換えると私の正答数xが10点だったり50点だったりする確率)は、Excelなどで計算できます。*2
(Numbersで、 BINOMDIST(X, 80, 0.7, 確率関数) )

二項分布表みたいなのもあるかも。

たとえば私のいまの実力が正答率70%だとすると(  x〜B(80, 0.7) )、ちょうどX点取れる確率はこんな感じです。

X xがちょうどX点になる確率 Pr(x = X)
0 0.0%
1 0.0%
2 0.0%
54 8.4%
55 9.3%
56 9.7%
57 9.5%
58 8.8%
80 0.0%

ちなみに、ExcelにはxがX点以下になる確率 Pr(x \leq X) を表す便利関数もあります。 (Numbersの BINOMDSIT(X, 80, 0.7, 累積確率) )
こっちの方がよく使うかな。

X xがX点以下になる確率 Pr(x \leq X)
0 0.0%
1 0.0%
2 0.0%
54 35.2%
55 44.5%
56 54.2%
57 63.7%
58 72.5%
80 100.0%

グラフにするとこんな感じです。

合格率を予測する

得点xが母数(総問題数80, 正答率P)の二項分布 B(80, P) に従うとき、xがX点以下になる確率 Pr(x \leq X) を求めることができたということは、不合格率が求められたということです。 なので確率1から不合格率を引けば、合格率が求まります。

応用情報の午前問題は6割が合格ラインなので、
47点以下は不合格
48点以上は合格

よって
不合格の確率は、 Pr(x \leq 47); x〜B(80, P)
合格の確率は、 1 - Pr(x \leq 47); x〜B(80, P)

あとはExcelで計算すれば具体的な合格率がわかります。

P = 0.72までくるとほぼ合格率99%になることがわかります。 このくらい安定してとれていればほぼ合格することがわかります。

P = 0.72を超えるとグラフは水平になるので、頑張りが合格率に結びつかない、合格という観点では単に勉強時間の無駄ということになります。

またP = 0.55あたりから合格率が急激に伸び始めるので、半分くらい解けるという人はここが頑張りどころです。このくらいできてる人はダメもとで受けてみても受かる可能性あります。

P ≦ 0.5くらいの人はまぐれでしか合格することはないです。

私は試験勉強やめました

私は過去問安定して8割はとれるので *3、 二項分布で考えたらほぼ合格するんだよなーと気づいて、あくまで試験対策としての勉強は早い段階でやめにしました。

8割しかできてないとなんだか不安というのは人間心理としてありますよね。なんとなく20%くらいで落ちるんじゃないかと思っちゃう。20%を少しでも埋めるために頑張りすぎてしまう。 人間は確率を直感で理解できないってファスト&スローで熱弁されてましたけど、本当身にしみてそれを感じましたね。

なんでこんなイキった記事書いたの?

落ちたら落ちたでオチがついて面白いじゃん。*4 *5

*1:あくまで確率でとらえればの話です。まあそれを言ったら、コイン投げやサイコロは確率事象なんですかね?

*2:高校数学で習う「反復試行の確率」です。少ない回数なら手計算でも可

*3:安定して8割とれるというのはどういうことか?過去問400問解いて320点くらいとれるので、わかりやすさ重視でこういう表現を使ってますが、あくまでこのやり方は標本から実力を推定しているだけなんですよね。。

*4:でもやっぱり心配なので明日までの短い時間でちょっと復習します

*5:専門家じゃないので、そもそもこういうケースで二項分布当てはめるの間違ってるよみたいな致命的な間違いが無いかビクビクしてます。間違っていたらぜひご指摘お願いします。