2009年3月16日 星期一

統計 第二章 集中量數

描述資料的兩種數據:集中量數、變異量數

集中量數(資料集中的情形)
1. 平均數

  • 算數平均數:mu=資料為母體,Xbar=資料為樣本。=AVERAGE(1,2,3,4,5,) or = AVERAGE(A1:A5)
  • 幾何平均數:適用於平均改變率、平均成長率或平均比率。如近年的經濟成長率為1%,2%,3%,就要用這個公式。=GEOMEAN(5,14,40,125,350)
  • 調和平均數:也稱倒數平均數,若資料成等差數列,就使用此平均數。=HARMWAN(80,90)

只有算數平均數才會有母體跟樣本之分,其他則無。

2. 眾數
如果所有的數值都只出現一次,那就沒有眾數,眾數也可能有兩個以上。=MODE(1,1,2,3,4)

3. 中位數
先將數字由大至小排序,中間的數即是中位數。=MEDIAN(1,2,3,4)

4. 截尾平均數
過於極端的值會影響到平均數,所以才將數列排序後,以四分位去掉頭尾,將Q1以下Q3以上的數值排除後,再計算其平均數就是截尾平均數。
Q1= QUARTILE({1,2,3,4,5,6},1)
Q3= QUARTILE({1,2,3,4,5,6},3)

5. 溫賽平均數
與截尾平均數的概念相同,只是溫賽平均數是用四分位數來取代極端值。

量尺的特性
  • 名義量尺:眾數
  • 順序量尺:眾數、中位數
  • 等距量尺:眾數、中位數、平均數

集中量數的優缺點

眾數

  • 優點:真實存在、多數意見、容易猜中。
  • 缺點:未必能代表集中趨勢

中位數

  • 優點:不受極端值影響
  • 缺點:不適合四則運算

平均數

  • 優點:
  • 可以進行四則運算,是推論統計的基礎 。
  • 使用了資料所有的數值,因此具有代表性。
  • 用平均數來猜測所有數值,產生的誤差最小。
  • 樣本的平均數是母體的平均數的最佳估計式(estimator)。
  • 平均數較不會受到抽樣變動的影響
  • 缺點:
  • 容易受到極端值的影響

沒有留言: