# 第三章 敘述性統計
# 四種測量尺度(Levels of Measurement)
- 名目尺度(Nominal Level)
- 順序尺度(Ordinal Level)
- 等距尺度(Interval Level)
- 比例尺度(Ratio Level)
# 平均數
母體平均數 $
表群體大小樣本平均數
表樣本大小
# 中位數
- 將數據排序,「中間」的那一個數值、或中間兩個數值之平均。
- 群體中位數:𝛈 (讀作 eta)
- 樣本中位數:
- 找中位數的方法:
- 奇數:
- 偶數:兩者相加的平均
- 奇數:
# 四分位數(quartiles,Q1、Q2、Q3 )
- 至少有
的數值小於等於Q1,且最少有 的數值小於 稱為第一四分位數, 稱為第三四分位數。
# 百分位數(percentiles, 、 、 、 )
- 至少有
的數值小於等於 ,且最少有 的數值小於
# 全距(Range, R)
- 用來衡量一組數據「分散程度」的最簡單方法。先排序,
- 缺點:當一組數據中有「離群值」出現或資料「筆數太多」
時,全距並非一個很好的衡量數據分散程度的量數,因其無法解釋最小值與最大值之間數據分布的情形,失真了,不適用全距。
# 標準差 (Standard Deviation, STD)
將「變異數」開根號得之
值越小,表變異越小
群體標準差
樣本標準差
# 變異係數(Coefficient of Variation, CV)
- 相對變異、不帶單位
越小表示分散程度越小
# 變異數(Variance)
計算每個點的「離中(心)趨勢」,但是(中心點)左半部與右半部距離 之和為零,數學上用絕對值或是平方,來避免。
樣本變異數
, 公式之所以除以 是因為除以 ,推估群體變異數 時,誤差較大。平 方 和 和 平 方 記作
$ = {(平方和 - {和平方 \over n} ) \over n-1}$
# 眾數
- 一筆資料中出現次數最多的那筆資料,通常用符號
來代表眾數