上一節(jié)我們梳理了概率與梳理統(tǒng)計中部分核心概念,這講繼續(xù)。 例題分析:將n只球放到N個盒子中(N>=n),試求每個盒子放一個球的概率是多少? 樣本空間:n個小球放到N個盒子中有多少種方法,每個球都有N種方法,一共有N*N*N...N,n個球; A事件:每個盒子放一個球的放法,N*N-1*N-2...N*(N-n+1) P(A)就為兩式相除。 以上是古典概型的簡單應(yīng)用,當(dāng)然可以結(jié)合概率的性質(zhì)解更為復(fù)雜的問題,比如把A變成AUB,用加法公式結(jié)合古典概型應(yīng)用。不做過多的復(fù)雜講解,回歸概率的整體脈絡(luò),我們針對問題具體分析就好,關(guān)鍵要用對模型。 今天講另外幾個重點(diǎn)的概念: 1、條件概率:故名思意,就是討論在某種條件下發(fā)生的概率。這個概念是應(yīng)用最多的、最廣的。人工智能中很多重要的算法都與條件概率的概念及性質(zhì)的應(yīng)用有密切關(guān)系。數(shù)學(xué)定義:P(B|A)=P(AB)/P(A)(用韋恩圖很容易看出來這個關(guān)系,同樣的由對稱性可知,P(B|A)=(PAB)/P(B))。同樣條件概率滿足概率定義下得出的非負(fù)、規(guī)范、可列可加性。從這里開始,概率論開始變復(fù)雜了。 2、乘法定理:乘法定理就是在定義的基礎(chǔ)上的公式變形,P(AB)=P(B|A)P(A)。別看這個簡單的變形,是后續(xù)一系列重要定理的原點(diǎn)。定義推廣到多個事件,得到形式P(ABC)=P(C|AB)P(B|A)P(A)。可以看到ABC同時發(fā)生的概率依賴關(guān)系,這個就是乘法公式。三個因素互相作用的系統(tǒng)中,某個現(xiàn)象出現(xiàn)不光要考慮單個因素發(fā)生的概率還要考慮到多個因素聯(lián)合約束下的影響。這就是條件概率蘊(yùn)含的深層次思想,它考慮到了關(guān)系之間的聯(lián)合作用。 3、全概率公式:先看定義,如果一個樣本空間為E,B1...Bn為一組事件(注意不是單個樣本點(diǎn)劃分,而是一組事件劃分),也就是將樣本空間這個集合進(jìn)行劃分,如果B1...Bn之間沒有交集,并且B1UB2..UBn=E,那么E中一個事件A的概率可以表示為P(A)=P(A|B1)P(B1)+...P(A|Bn)P(Bn)。橫向類比,B1..Bn像不像線性代數(shù)里面的向量空間的基!空間中任何一個向量(A)都可以由其基來表示。拿擲色子來舉例,E={1,2,3,4,5,6},我們將其劃分為兩個集合(基本事件)B1={1,2,3,4},B2{5,6}滿足定義,那么A={3,4,5}這個事件的概率P(A)=P(A|B1)*P(B1)+P(A|B2)P(B2)來表示。要解這個公式需要知道的信息很多,所以全概率公司的最重要的作用不在于求,而是在于推導(dǎo)出另外一個非常重要的公式,貝葉斯公式??!貝葉斯公式??!貝葉斯公式??! 4、貝葉斯公式:P(Bi|A)=P(A|Bi)P(Bi)/P(A)。貝葉斯公式可以這樣理解,以5月份醫(yī)院診斷病例為例子,A代表癥狀,Bi代表疾病。我們知道某個人咳嗽,可能是感冒了(B1)、可能是肺炎(B2)、可能禽流感(B3)等等有很多病的臨床表現(xiàn)都會咳嗽。通過醫(yī)院以往的病例我們知道,感冒情況下有咳嗽癥狀的概率P(A|B1),肺炎情況下咳嗽的概率P(A|B2),禽流感情況下咳嗽的概率P(A|B3),同時我們知道比如在夏天感冒的概率P(B1),肺炎的概率P(B2),禽流感的概率P(B3),這樣我們就可以分別計算P(A|B1),P(A|B2),P(A|B3)的概率,從而比較哪個概率比較大那么得某個疾病得可能性就最大。(哈哈哈,不知道大家看明白,醫(yī)生看病的例子是最直接的。但是要注意,應(yīng)用貝葉斯公司的時候需要注意全概率公式中的條件,B1..Bn相互獨(dú)立,并且構(gòu)成樣本空間的一組基) |
|
來自: taotao_2016 > 《概率》