読者です 読者をやめる 読者になる 読者になる

はやしたりなの日々

普段の生活の中で考えたことや行ったことについて書き残しています。科学やコンピュータに関すること、アニメやゲームに関すること、創作活動に関すること、資産運用に関することなどについて書くことが多いと思います。

【スクフェス】【統計学】特待生勧誘(11回勧誘)に関するスクフェス統計学

はやしたりなです。

 

10月3日に、「スクフェスで特待生勧誘(11回勧誘)を7回行ったのに、SR以上の部員が確定7枚+期待値14枚くらい出るはずが、確定7枚+5枚しか出なかったのはなぜか」という話を書きました。

その件について、自分なりに考えたことをまとめておきたいと思います。

名付けて、スクフェス統計学

なんだか、ときめき分類学みたいですね(笑)。

 

冒頭に本日の記事の結論を書いておきます。

私が想像していた特待生勧誘(11回勧誘)の処理フローを仮説として設定すると、今回の勧誘結果によって、仮説は有意水準1%で棄却されました。

しかし、おそらく内部的に正しいと予想される別の処理フローを仮説として設定すると、今回の勧誘結果は統計的にあり得るものでした。

 

まず最初に、私が想像していた特待生勧誘(11回勧誘)の処理フローを、図1に示します。 

f:id:RinaHayashita:20161006000445p:plain

  

次に、おそらく内部的に正しいと予想される処理フローを、図2に示します。 

f:id:RinaHayashita:20161006000456p:plain

  

図1の処理フローにおいては、今回の勧誘結果は統計的にあり得ないと考えていましたが、図2の処理フローにおいては統計的にあり得る結果だったということです。

 

今回、私が不自然だと思ったのは、図1の2番目の処理ブロックにおいて合計70回行った抽選結果が、SR以上の期待値14枚であったにも関わらず、SR以上が5枚しか出なかった、ということでした。

SR以上が出る確率は20%のはずですから、いくらなんでも偏り過ぎではないのか、と感じたのです。

実際、この抽選結果は、試行回数 n=70、SR以上が出る確率 p=0.2 としたときの二項分布 Bi ( n,p ) に従います。

ここで二項分布 Bi ( n,p ) は、n が大きいとき正規分布 N ( np,np(1-p) ) で近似することができます。

正規分布によって近似計算した抽選結果の確率分布を図3に示します。

f:id:RinaHayashita:20161006005118p:plain

 

図3から、70回勧誘でSR以上の部員が5枚しか出ない場合の確率が非常に低い様子を、直観的に見てとることができます。

SR以上を引く枚数を確率変数 X とし、平均値 μ=np=14、標準偏差 σ=√np(1-p)=√11.2 によって、検定統計量 Z=( X - μ ) / σ を求めると、X=5 のとき Z=-2.689 … となります。

Z=-2.689 … における標準正規分布の両側確率は 0.00714… となりますから、有意水準α=0.01で図1の処理フローは棄却されるわけです。

 

そこで図2の処理フローが出てくるわけですが、こちらは処理フローの中に場合分けが含まれているため、状況が多少ややこしいです。

しかし、確率計算を非常に甘く見積もれば、考えるべき確率は「77回勧誘でSR以上の部員が12枚出る確率」より少し大きい程度で収まるはずです。

簡易的な計算の結果でしかありませんが、検定統計量 Z=-0.969 … 程度、両側確率は 0.33204 … 程度となるので、統計的に十分あり得る結果だと言えるでしょう。

少なくともここまでの考察では、図2の処理フローを否定する理論的根拠はないことになります。

 

こうして考えを整理してみると、特待生勧誘(11回勧誘)が図1の処理フローに基づくと考えていたのがそもそも不自然だったとさえ思えてきますね。

実際、図1の処理フローでの期待値を考えれば、50個のラブカストーンで特待生勧誘(1回勧誘)を10回行うのと比べて、明らかに有利過ぎることがすぐに分かりますから。

ということで、取り敢えず私が感じていた疑問については、これで一応の解決をみることができました。