1. 連續變項是連續的,如溫度、時間、身高、收入等,表示任兩個數值之間,會存在著第三個值。
2. 明天中午12點溫度為30度的機率為多少?這個問題是無意義的,機率為0。應該說溫度到達30度上下(+ - 5)的機率為多少,有一個區間才能表達連續變項的特性。
3. 機率密度並無多大意義,通常關心的是累積機率密度。
第二節 連續機率分佈
1. 均勻分佈
- 一連續變項x,其值介於a, b之間。假設每一點出現的機率都是均等,則此變數的機率分佈為連續均勻分佈。
- 均勻分佈的機率為圖形面積。
- 平均數 = (a+b)/2, 變異數 = (b-a)平方/12
2. 常態分佈
如果一個連續變項X,具有公式6.8的性質,就是常態分佈。
2.1 超幾何分佈、二項式分佈、波式分佈與常態分佈之間的關係
- 超幾何分佈的樣本數是母體的0.05以下的話,可用二項式分佈取代
- 在二項式中,若樣本n夠大,則可用常態分佈取代;即使樣本n不大,機率p接近0.5 也可。若樣本數大而機率小時,可用波式分佈取代。
- 當樣本到達無限大時,超幾何分佈、二項式分佈與波式分佈皆會變為常態分佈
3. 標準常態分佈(Z分佈)
- 在常態分佈的狀況下,另其平均數為0,標準差為1,就可轉換為標準常態分佈。
- Z分數 = (該變數-平均數)/變異數
4. 伽瑪分佈
- 如果一隨機連續變數擁有公式6.10的特性,就是伽瑪分佈。
- 平均數 = a*b, 變異數 = a*(b平方)
- 伽瑪分佈可用來計算等候時間。在波式歷程裡,單位時間成功次數為入,那麼等候第一個成功事件出現的時間,平均就要 b=1/入。若要等候至第n個成功(a=n),等候的時間就是伽瑪分佈。
- = GAMMADIST(時間X, 第a次成功, 第一次成功時間b, TRUE),TRUE為累積機率,FALSE為機率密度函數。
5. 指數分佈
- 為伽瑪分佈的特例,令 a=1, b=1/入 就是指數分佈。
- 平均數 = 1/入, 變異數 = 1/(入平方)
- 伽瑪分佈是在算第n次成功的等待時間,指數分佈是在算第一次成功的等待時間。
- = EXPONDIST(時間X, 第一次成功時間b, TRUE)。
6. 卡方分布
- 為伽瑪分佈的特例,令 a=v/2, b=2,就是卡方分布。其中 v(nu)為正整數的自由度
- 平均數 = ab = v, 變異數 = a(b平方) = 2v,與伽瑪分佈相同。
- 若一連續變項X為標準常態分布,則該變項的平方(X平方)是為自由度1的卡方分布。多個獨立變項 X1~Xn均是標準常態分布,則自由度可累加起來變成n。
- 自由度越大,卡方分布越接近常態分布。
- 卡方分布常用來檢定資料與模式的吻合度
- P(x>a) = CHIINV(P,v),給正無限大累積到a點的機率,計算a點是多少。
- P(x>a)= CHIDIST(點a, v),給a點,計算大於a點數值的累積機率。
7. F分布
- 兩變數U, V互相獨立,且均有卡方分布的性質,其自由度分別為V1和V2,則隨機變數X= (U/v1) / (V/v2)
- 平均數 = v2/(v2-2), 變異數 = P115頁
- F分布常用於檢驗兩變異數是否相等
- P(X>a)= FINV(P, V1, V2),給正無限大到a點的機率,計算a點是多少
- P(X>a)= FDIST(a點, V1, V2),給a點,計算大於a點的累積機率。
- 若要計算a點的累積機率1 - P(X < a)
8. t分布
- 若變數U和變數Z互相獨立,而U為自由度v的卡方分布,Z為標準常態分布,則變數X = Z/ [(U/v)根號]的分布就是t分布
- t分布平方 = F分布
- 當自由度很大時,曲線就會接近標準常態分布
- t分布和z分布常用於檢驗母體平均數
- P(a < color="#ff6600">兩尾端面積和, v),給兩尾端面積和,求a點和b點(a, b兩點為正負關係)
- P(X <> a) = TDIST(點a, v, tails),給點a,求大於a點的累積機率。若tails = 1 則可直接算出累積機率,tails = 2可算出兩尾端面積和。
※ 在Excel中關於卡方分布(CHIDIST, CHIINV)、F分布(FDIST, FINV)和t分布(TDIST, TINV)的函數,所算得的累積機率是由正無限大到該點的累積機率。而在常態分布函數的情況下(NORMDIST, NORMINV, NORMSDIST, NORMSINV)所計算出的累積機率,則是由負無限大開始累積。
沒有留言:
張貼留言