統計学の基礎 A
集団の特性を知る
@ 平均値=集団を代表する数値
A 散布度=集団の散らばりの様子を示す数値
代表値 → 平均値・中央値・最頻値・最大値・最小値
散布度 → 分散・標準偏差・平均偏差・四分位範囲
統計学の関心は、個々のメンバーの性質や個性ではなく、
あくまでも「全体の傾向、全体の状況」にある。
特に平均と分散が重要である。
第2回 統計学とはなにか?
1 情報とデータ
「情報を正確に把握し、間違いなく伝達し、有効に活用する」ための手段が統計学である。
2 集団の特色や傾向を調べる記述統計学
・集団・・・・・複数の主体(人あるいは物)の集まり
・個体・・・・・集団を構成する個々の主体(人あるいは物)
3 変動の原因を調べる相関分析・多変量解析
「A」という現象は何によって生じているのか?
B?あるいはC?
4 一部分を調べ全体を知る推計統計学
@ 記述統計学
集団に属するすべての主体のデータを収集し、
集団の特徴や傾向を明らかにする手法
A 推計統計学
集団の一部のデータから集団全体の特徴や傾向を明らかにする手法
5 データの種類
@数量データ
身長、体重、年収などの数値が意味を持つもの
データ間の大小関係を比較することができる
Aカテゴリーデータ
血液型、肌や髪の色など分類するときに意味を持つもの
データ間の大小関係を比較することができない
2 代表値と散布度
(1)代表値
EXCEL関数
@算術平均 (AVERAGE)
A幾何平均 (GEOMEAN)
B調和平均 (HARMEAN)
C最頻値(モード)( MODE)
D中央値 (MEDIAN)
E比率 (RATIO)
(2)散布度
@偏差平方和 (DEVSQ)
集団に属するデータのばらつき具合を1つの値で表現したもの
この値が大きければ大きいほどばらつき具合が大きい
A分散(VARP)
B標準偏差(STDEVP)
Cレンジ レンジ=最大値 - 最小値
最大値 (MAX)
最小値 (MIN)
D変動係数 (STDEVP/AVERAGE)
Eパーセンタイルと四分位偏差
F歪度と尖度
歪度 : 「ゆがみ」 SKEW
尖度 : 「とがり」 KURT