一文通俗易懂講解伯努利分布、幾何分布、超幾何分布、二項分布、泊松分布...
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
1. 兩大類分布的總體概述概率分布是指用于表述隨機變量取值的概率規律,總體包括離散概率分布和連續概率分布。 離散概率分布包括:
連續概率分布包括:
2. 什么是期望?在了解這些分布之前,需要先理解一個名詞——期望。 期望和均值類似,就連計算方法也類似,但是均值是對數據本身進行描述,但期望描述的是概率分布。 所以,變量X的期望通常寫作E(X),E(X)的計算公式為: 3. 離散概率分布3.1 伯努利分布
舉例:拋一次硬幣,正反面各自的概率。 公式: 其中,x代表隨機變量可能的結果,即正反面或者實驗的陽性陰性結果。 期望: 方差: 3.2二項分布,多項式分布3.2.1二項分布
舉例: 為了區分概率,不再以硬幣舉例,這次以答題正確概率為例,隨機答題正確性為1/4,即答對可能性為0.25,計算3道題目答對1題的概率為:3 x 0.25^1^ x 0.75^2^ 公式為: , 其中 (也就是組合的公式) p是每一次試驗的成功概率,n是試驗次數,又寫作:, 根據n與p的不同數值,二項分布的概率分布形狀會發生變化,p越接近0.5,圖形越對稱,p<0.5,圖形右偏,p>0.5,圖形左偏。圖形可見:二項分布概率直方圖 二項分布單次試驗的期望為 , 方差為 重復n次試驗的期望為 , 方差為 3.2.2多項式分布
公式, 另一種形式(emmm真優雅): 3.3幾何分布和負二項分布幾何分布和負二項分布與二項分布恰恰相反,求的是在結果發生概率和發生次數已知的情況下,達成這一條件所需的事件總數的概率。 3.3.1幾何分布
每道題目答對概率都為0.25(p),答錯概率都為0.75(q),則當第4題才答對第一道題就為:0.25 x 0.75^3^ 則,公式為:
其中,p為成功概率,q=1-p 為失敗概率,為了在第r次試驗時取得成功,首先要失敗(r-1)次。 期望為 , 公式推導見幾何分布的期望公式的推導 方差為 3.3.2負二項分布與幾何分布相比較,負二項分布多出了一個結果發生次數的參數。 繼續以答題為例,答對3道題需要做題多少? 公式: 其中, p為答對概率,k為所要成功(答對)次數,因為第r個失敗是最后發生的,所以需要k+r-1次重復實驗中有k次成功的。 期望為 3.4 超幾何分布
公式為: 3.5 泊松分布
若X符合泊松分布,且每個區間內平均發生λ次,則為 X~ P~o~(λ) 發生r次事件的概率公式為: 其中,r為給定區間發生目的事件次數,e為數學常數2.718。 舉例和公式推導,網上有個例子解釋得很好,見用一個”栗子“講清楚泊松分布 因為X~ P~o~(λ),則E(X)為給定區間內能夠期望的事件發生數目,也就是求解區間內發生的平均發生次數,則期望,即E(X)等于λ,方差也為λ(泊松分布的參數本身就是期望和方差)。 泊松分布的概率形狀為:λ小,則分布向右偏斜,隨著λ變大,分布逐漸變得對稱(為什么會這樣?參考見如何深刻理解二項式分布到泊松分布
已知,二項分布公式為: , 當n過大時,計算變得繁瑣,而又知道重復n次試驗的期望為 , 方差為 所以當λ≈np,λ≈npq ,即np≈npq時候,也就是q近似為1且n足夠大時,我們可以用泊松分布替代二項分布,則條件為
4. 連續概率分布4.1 均勻分布相等區間(時間,空間,長度等等)分布概率相等,較為簡單不予過多描述 均勻分布由兩個參數a和b定義,它們是數軸上的最小值和最大值,通常縮寫為U(a,b) 密度函數公式為: 期望, 方差為 4.2正態分布若隨機連續變量X符合期望為μ、標準差為σ的正態分布,則通常寫作X~N(μ, σ2)。其概率密度函數為正態分布的期望值μ決定了其位置,其標準差σ決定了分布的幅度。當μ = 0,σ = 1時的正態分布是標準正態分布。 其公式為 這個公式第一眼有點繁瑣,但其實當進行拆分后并不復雜,推導之前先了解一個公式標準分計算, 其中,μ表示均值,σ為標準差,Z值為某個值x偏離均數μ的標準差倍數。 公式中前半部分 只是一個系數,為固定值,而后半部分 可以簡化為,當Z為0時,最大,也最大,而當x=μ也就是均值時,整個密度函數達到最大值,而當x越偏離μ時,密度函數越小,當無限遠的時候,就趨近于0。現在看前半部分, 由于π固定,值的變化由σ標準差決定,sigma越大,值越小,整個分布越會呈低矮形狀。 期望與方差計算為: 4.3 Beta分布以下參考自,鏈接
公式為 $$f(x \mid a, b)=\frac{1}{B(a, b)} x^{a-1}(1-x)^{b-1}, 0<x<1(a, b="" data-tool="mdnice編輯器">0) $$期望與方差計算: 4.4 卡方分布
其公式為: 期望與方差計算為: 5. 補充
二項分布和幾何分布的應用條件很類似,兩者的前兩個條件(①獨立試驗;②每一次試驗的成功概率相同),差別在于實際上要求的結果。如果試驗次數固定,求成功一定次數的概率,則需要使用二項分布;使用二項分布還可以求出在n次試驗中能夠期望得到的成功次數。如果要求第一次成功之前需要試驗多少次,則需要使用幾何分布。
參考鏈接: 伯努利分布、二項分布以及多項分布 https://zhuanlan.zhihu.com/p/50462601 https://blog.csdn.net/qq_37960402/article/details/88953500 https://www.cnblogs.com/Renyi-Fan/p/13909553.html https://zhuanlan.zhihu.com/p/24711669 https://blog.csdn.net/zlbflying/article/details/47777943 https://zhidao.baidu.com/question/431881117.html 書籍:統計學的世界 書籍:深入淺出統計學 該文章在 2023/3/10 16:44:33 編輯過 |
相關文章
正在查詢... |