本日の内容

学んだこと

母集団…データの元となった集合全体

母平均…母集団の平均

母分散…母集団の分散

抽出(サンプリング)…母集団からデータを取ってくること

標本…母集団から抽出したデータのこと

標本の大きさ…標本の中のデータの個数

標本平均…標本の平均

標本分散…標本の分散

不偏分散(不偏標本分散)…以下の式で求めた値

不偏分散=((データ-平均値)の二乗)の総和 / (個数-1)

個数ではなく個数-1で割っているところが悩みどころです。なぜこのようにするのかを調べてみました。

不偏標本分散の意味とn-1で割ることの証明

こちらの記事によると、母集団の一部を抜き出した標本では、その標本の分散(=標本分散)が母集団の分散(=母分散)より小さくなってしまうから、ということでした。

全く納得できないわけではないですが、なるほど!とはならない現状です。。。

所感

他の物事との似ている点を掴む抽象力が欲しい…!

「集合」という単語は日常でも使いますが、数学では少し違った使い方になります。ものを集めたときに考えられる計算を体系化したものが集合です。高校1年の数学Aの授業で習いました。この知識を生かして「母集団」という単語をすぐに定義することができました。

また、プログラミングをやるので、配列変数やその要素についても知識があります。「標本」という単語が出てきたときに「これは集合を表す言葉なのか、要素を表す言葉なのか?」という形式知化された疑問が浮かびました。ここで配列と配列の要素の関係について、よくわからなくなる初学者が多いこととつながりました。Ruby on Railsを学んでいる人で、ActiveRecord::Relationクラスのインスタンス(レコードがたくさん入っている配列のようなもの)とActiveRecord::Baseのインスタンス(一つひとつのレコード)の違いがわかっていない人は結構いた気がします。

知識をリンクさせていく力が高い人は成長が早い気がしているので、そうなれるよう日頃から関連を意識して学びたいと思いました。

明日やること

2章はちょっと難しかったので進みが遅くなってしまいました。明日こそは信頼区間に入りたいと思います。