統計学の基礎 A

   集団の特性を知る

  @ 平均値=集団を代表する数値

  A 散布度=集団の散らばりの様子を示す数値

  
 
代表値 → 平均値・中央値・最頻値・最大値・最小値
  
 
散布度 → 分散・標準偏差・平均偏差・四分位範囲

    

     統計学の関心は、個々のメンバーの性質や個性ではなく、
    あくまでも「
全体の傾向、全体の状況」にある。
            特に平均と分散が重要である。

 

第2回 統計学とはなにか?


  1 情報とデータ

     「情報を正確に把握し、間違いなく伝達し、有効に活用する」ための手段が統計学である。

  2 集団の特色や傾向を調べる記述統計学

       ・集団・・・・・複数の主体(人あるいは物)の集まり

      ・個体・・・・・集団を構成する個々の主体(人あるいは物)

  

  3 変動の原因を調べる相関分析・多変量解析

      「A」という現象は何によって生じているのか?

          B?あるいはC?


  4 一部分を調べ全体を知る推計統計学

  
 @ 記述統計学
        
      集団に属するすべての主体のデータを収集し、
     集団の特徴や傾向を明らかにする手法

  


 A 推計統計学
         
      集団の一部のデータから集団全体の特徴や傾向を明らかにする手法


  5 データの種類

    @数量データ   
     身長、体重、年収などの数値が意味を持つもの 

        データ間の大小関係を比較することができる                   

    Aカテゴリーデータ
        血液型、肌や髪の色など分類するときに意味を持つもの
         データ間の大小関係を比較することができない
        

 

  

2 代表値と散布度
 




































      (1)代表値    
                     EXCEL関数

           @算術平均  (AVERAGE)

                A幾何平均  (GEOMEAN)

                B調和平均  (HARMEAN)

                C最頻値(モード)( MODE)

                D中央値    (MEDIAN)

                E比率    (RATIO)

 

      (2)散布度

             @偏差平方和 (DEVSQ)

                    集団に属するデータのばらつき具合を1つの値で表現したもの
                    この値が大きければ大きいほどばらつき具合が大きい

            A分散(VARP)

            B標準偏差(STDEVP)

            Cレンジ        レンジ=最大値 - 最小値
                 最大値 (MAX)
                最小値 (MIN) 
  


            D変動係数 (STDEVP/AVERAGE)

            Eパーセンタイルと四分位偏差

            F歪度と尖度:「ゆがみ」と「とがり」