本日の内容

学んだこと

標本の大きさ(=サンプルサイズ・標本サイズ)」と「標本数(=サンプル数)」は異なる。標本の大きさは標本の中に含まれるデータの数であり、標本数は標本の数。

参考:https://sites.google.com/site/fishermultiplecomparison/samplesize

標本平均の分散(標本の平均の散らばり具合)の求め方

標本平均の分散 = 母分散 / 標本の大きさ = 不偏分散 / 標本の大きさ

標本平均の標準偏差(=標本標準誤差, SE, Standard Error)の求め方

標本標準誤差 = (不偏分散 / 標本の大きさ)の平方根

信頼区間の求め方

信頼区間 = 標本平均 ±t * 標本標準誤差

自由度…サンプルサイズ – 1

 実際に信頼区間を求めてみる

サイトに出ていた例題を元に信頼区間を求めてみました。

95%信頼区間(母平均が95%の確率でこの範囲にある、という区間)は532.7〜568.0でした。
99%信頼区間(母平均が99%の確率でこの範囲にある、という区間)は524.3〜576.5でした。

95%より99%の方が確率が高いので、範囲は若干広くなっているのはスッと理解できます。

たった8件のデータから母平均がだいたいどのあたりにあるのかを99%という高い精度で推定できてしまうことに驚きます。

明日やること

明日はカイ二乗検定を勉強します。ついに、状況を統計的に判断する「検定」のセクションに入ってきました。大学時代は苦戦して頭に全く入ってこなかった統計も、完全に自分でやりたくてやっている今だと(当時よりは)頭に入ってくる気がしています。

例題をやってみて、解答とあっているとモチベーションが高まりますね。