# 第三章 敘述性統計

# 四種測量尺度(Levels of Measurement)

  • 名目尺度(Nominal Level)
  • 順序尺度(Ordinal Level)
  • 等距尺度(Interval Level)
  • 比例尺度(Ratio Level)

# 平均數

  • 母體平均數 $

    表群體大小

  • 樣本平均數

    表樣本大小


# 中位數

  • 將數據排序,「中間」的那一個數值、或中間兩個數值之平均。
  • 群體中位數:𝛈 (讀作 eta)
  • 樣本中位數:
  • 找中位數的方法:
    • 奇數:
    • 偶數:兩者相加的平均

# 四分位數(quartiles,Q1、Q2、Q3 )

  • 至少有 的數值小於等於Q1,且最少有 的數值小於
  • 稱為第一四分位數, 稱為第三四分位數。


# 百分位數(percentiles,

  • 至少有 的數值小於等於 ,且最少有 的數值小於


# 全距(Range, R)

  • 用來衡量一組數據「分散程度」的最簡單方法。先排序,
  • 缺點:當一組數據中有「離群值」出現或資料「筆數太多」時,全距並非一個很好的衡量數據分散程度的量數,因其無法解釋最小值與最大值之間數據分布的情形,失真了,不適用全距。

# 標準差 (Standard Deviation, STD)

  • 將「變異數」開根號得之

  • 值越小,表變異越小

  • 群體標準差

  • 樣本標準差


# 變異係數(Coefficient of Variation, CV)

  • 相對變異、不帶單位

    越小表示分散程度越小

# 變異數(Variance)

  • 計算每個點的「離中(心)趨勢」,但是(中心點)左半部與右半部距離 之和為零,數學上用絕對值或是平方,來避免。

  • 樣本變異數 , 公式之所以除以 是因為除以 ,推估群體變異數 時,誤差較大。

  • 記作 $ = {(平方和 - {和平方 \over n} ) \over n-1}$


# 眾數

  • 一筆資料中出現次數最多的那筆資料,通常用符號 來代表眾數