ハンバーガー統計学

大学の研究室時代、学生同士で研究に必要なスキルを学び合う自主ゼミで統計学を学びました。

そのときに使っていたのが、ハンバーガーショップを題材にした解説サイトです。

ハンバーガー統計学(http://kogolab.chillout.jp/elearn/hamburger/index.html)

データ分析の力を身に付けたいと思い、復習することにしました。アウトプットがてら、学んだことを簡単にまとめていきます。

本日の内容

学んだこと

度数…データをある範囲で区切ったもの。

階級…度数の範囲。

度数分布…階級に対する度数の分布。

分散…ばらつきの度合いを数値で表現したもの。

((データ - 平均値)の2乗)の総和 ÷ 個数

標準偏差(SD = Standard Deviation)…分散のルートをとったもの。ばらつきの度合いを表す。

分散と標準偏差、なぜ同じ指標が二つあるのか疑問でした。分散の単位は元データの単位の2乗になっていますが、その平方根を取ることで元データの単位に揃えることができる、ということだそうです。

1.5節の例題をGoogle Spreadsheetでやってみました。スプレッドシートはExcelのような表計算ソフトです。ブラウザで動いて、データもクラウド上に保存されるので、人と共有したりするのに便利です。PCが壊れてもデータは消えないですし最強です。Google Apps Script(GAS)という、JavaScript風の言語でマクロを書ける仕組みがあり、ルーティーンワークの自動化も期待できます。ExcelのVisual Basic for Application(VBA)は長らくやっていましたが、いまだに言語がVB6なのはきついですね。(最新版だと他の言語で書けたりするのかな?)

ワクワクバーガーのポテトの長さとモグモグバーガーのポテトの長さに違いがあるように感じて、平均や分散を計算してみるという例題です。平均はほぼ変わらないものの、モグモグバーガーのポテトの方が長さにばらつきがあるとわかりました。

(食べる側からすると、どちらが見栄えが良いのでしょう?量が多く感じた方が嬉しいけど、不揃い感があるのも微妙、、、?)

1.9章の通過テストもやってみました。あるクラスの算数の成績だそうです。

データから何を考察するかという力が問われますね。

今の日本の教育は、標準偏差を小さくするような教育といったところでしょうか。

ある科目の中でもみんな同程度にできるように、そして科目間でも全部同程度にできるようにという教育を受けてきた気がします。

今の高校生たちを見ていると、僕が高校生の頃(2010〜2013年)よりも扱う内容が広く深くなった印象です。

全員がその勉強をやる必要はないと思いますが、やると決めた子は勉強法を効率化して上手にやらないととても時間が足りませんね。

明日やること

明日は2章に入りたいと思っています。「信頼区間」という見出しですが、既に説明できない範囲に来ています。

検定が好きなので、そこまでの下地を整えておきたいですね!