検証スレッドログ倉庫
検証スレッド7
- 626 名前: 名も無き軍師 投稿日:2004/06/17(木) 23:08 ID:3hogn2.6
- 神のまとめページもできて、「オレも検証やってみてー」とか考えてる諸氏も
増えてきてるんではないかと思います。そこで実際に検証するときに気になるのが
「何回くらいデータ取ったらいいのか?」ではないかと思います。
事実、「そんな試行回数じゃ統計的に意味ないよ」なんて意見も結構目にしますしね。
では「何回取ったら統計的に意味があるのか?」はまだ誰も書いてないと思いますので
ちょっと計算してみました。
◇◆ 統計的に有意な試行回数の目安は? ◆◇
ある母集団からn個の標本を取り出して、そのうちに事象Aがあった標本数をrとする
(p'=r/nを標本比率という)。そのような場合、母集団における事象Aの比率pは
95%の信頼度で、p'−1.96*sqrt(p'(1−p')/n)<p<p'+1.96*sqrt(p'(1−p')/n)
の範囲内に存在することが統計学的に知られています(この範囲を95%信頼区間という)。
別の書き方をすると「p=p'±1.96*sqrt(p'(p'−1)/n)」とも書きます。
例えば、あるモンスにパライズを100回唱えてレジされた回数を数えたところ10回レジされたとします。
この場合の標本比率p'は10/100=0.1=10%ですね。
では真のレジ確率(母集団の比率)pは95%信頼区間で、
p=0.1±1.96*sqrt(0.1(1−0.1)/100)=0.1±0.059=10±5.9%となります。
この「95%信頼区間で10±5.9%」の意味するところは、
「何人もの人間が同じ条件で100回試行した場合、
4.1〜15.9%(4〜16回レジる)以外の結果になる
(つまり3回以下しかレジられなかった、もしくは17回以上レジった)
確率は5%以下しかありえない」ということを意味します。
この「100回試行で10±5.9%」という結果からは、「レジ率10%」と断言するには
ちょっと無理がありますねw では何回試行すれば「統計学的に10%」と言えるのでしょうか?