則有Yn-np~N(,)np(-p)011
漸近成立.從而b-npa-npP(aYnb)Φ()-Φ().
<≤≈np(-p)np(-p)11在理解基礎上可如下記憶中心極限定理:當Xi獨立同分布且E(Xi)=μ,D(Xi)=σ2,i=,…,n,則當n時,1→∞n
Xi-nμi=∑1~N(,)nσ01漸近成立.
86當Yn~B(n,p),則當n時,→∞Yn-np~N(,)np(-p)011
漸近成立.
典型例題例設隨機變量X的概率密度為1
n-x?ìx?e,x,f(x)=ín!≥0?
?,x.
0<0n
證明:PX(n+).
(0<<21)≥n+1
證明考慮利用切比雪夫不等式,為此,先求E(X),D(X).
++∞∞n+-xE(X)=xf(x)x=1x1x-dn!ed∫∞∫0=1(n+)=n+,n!Γ21++∞∞n+-xE(X2)=x2f(x)x=1x2x-dn!ed∫∞∫0=1(n+)=(n+)(n+),n!Γ312D(X)=E(X2)-[E(X)]2=(n+).
1從而,由切比雪夫不等式可以得出P(X(n+))=P(|X-E(X)|n+)0<<21<1D(X)n-=.
≥1(n+)2n+11例用切比雪夫不等式確定當擲一枚均勻硬幣時,需投多少次才能保證使得正麵2
出現的頻率在.~.之間的概率不小於%,並用正態分布近似計算同一問題.
040690解設需要擲n次,正麵出現的次數為X,則X服從二項分布B(n,.),E(X)=05.n,D(X)=.×.×n=.n.由切比雪夫不等式050505025X
P(..)=P(.nX.n)04 .n-025.,得n. 1(.n)2≥09≥25001如果用正態分布近似計算:P(.X.)=P(|X-E(X)|.)04<<06<01|X-E(X)|=P(.n)\/n<0214=Φ(.n)-.. 2021≥09由此可得,應取n. ≥68將上述兩種結果比較,按切比雪夫不等式估計要多做次試驗. 182例(.,)一生產線生產的產品成箱包裝,每箱的重量是隨機的.假設每箱32001ⅢⅣ平均重千克,標準差為千克,若用最大載重量為噸的汽車承運,試利用中心極限定5055理說明每輛車最多可以裝多少箱,才能保障不超載的概率大於..[Φ()=.,其中097720977Φ(x)是標準正態分布函數.]解設Xi(i=,,…,n)是裝運的第i箱的重量(單位:千克),n是所求箱數.X,121X,…,Xn相互獨立且服從同一分布,記n箱的總重量2 YXX…Xn. =1+2++由條件知E(Xi)=,D(Xi)=,E(Y)=n,D(Y)=n(單位:千克),根據獨立505505同分布的中心極限定理,Y近似服從正態分布N(n,n),則有5025?Y-n-n? P(Y)=P?50500050÷≤5000èn≤n? 55-nΦ(100010).=Φ(). ≈n>09772由此可見-n100010,n>2從而n.,即最多可以裝箱. <98019998例(.)設隨機變量X和Y的數學期望分別為-和,方差分別為和,42001Ⅲ2214而相關係數為-.,則根據切比雪夫不等式P(|X+Y|). 05≥6≤解設Z=X+Y,則E(Z)=E(X+Y)=E(X)+E(Y)=-+=. 220由 (,)XY,ρXY=CovD(X)D(Y)88知 (X,Y)-.=Cov,05×14從而(X,Y)=-. Cov1又因為D(Z)=D(X+Y)=D(X)+D(Y)+(X,Y)2Cov=+-=,1423故由切比雪夫不等式知D(Z)P(|Z-E(Z)|ε),≥≤ε2即 P(|X+Y|)3=1. ≥6≤2612例設X,X,…,Xn,…為獨立同分布的隨機變量序列,且Xi(i=,,…)服從51212參數為λ的指數分布,則下列不等式正確. n?? λXi-n?i=÷()P1=Φ(x)Alimn?∑x÷→∞èn≤? n?? Xi-n?i=÷()P1=Φ(x)Blimn?∑x÷→∞èn≤? n?? Xi-λ?i=÷()P1=Φ(x)Climn?∑x÷→∞èλn≤? n?? Xi-λ?i=÷()P1=Φ(x)Dlimn?∑x÷→∞ènλ≤? 解因為Xi(i=,,…)服從指數分布,故有12E(Xi)=1,D(Xi)=1,i=,,…,λλ212令 nnnnn XI-E(Xi)Xi-λXi-ni=i=i=λi=1111Yn=∑∑=∑=∑,nnD(Xi)n12 i=λ∑189由獨立同分布的中心極限定理有n ?? λXi-n?i=÷P(Ynx)=P1limn≤limn?∑x÷→∞→∞èn≤? xt-2=12t=Φ(x). -∞ed2π故應選().∫A 例根據以往經驗,某種電器元件的壽命服從均值為小時的指數分布.現隨機6100地取隻,設它們的壽命是相互獨立的.求這隻元件的壽命的總和大於小時的概16161920率. 解設元件的壽命為Xi(i=,,…,),E(Xi)=,D(Xi)=.又設X=12161001000016X-×X-Xi,則16100=1600近似服從標準正態分布. i=×∑11000016400故所求概率為X--P{X}=P{160019201600}>1920>400400X-=P{1600.}>08400-Φ(.)=-.=.. ≈10810788102119例(.)某保險公司多年的統計資料表明,在索賠戶中被盜索賠戶占%,71998Ⅳ20以X表示在隨意抽查的個索賠戶中因被盜向保險公司索賠的戶數. 100()寫出X的概率分布;1 ()利用德莫佛-拉普拉斯中心極限定理,求被盜索賠戶不少於戶且不多於戶21430的概率的近似值. 附表:設Φ(x)是標準正態分布函數x...... 0051015202530Φ(x)....... 0500069208410933097709940999解()根據題意,索賠戶數X服從二項分布B(n,p),其中參數n=,p=..故110002X的概率分布為kk-kP(X=k)=..100,k=,,,…,. C1000208012100()因E(X)=np=,D(X)=np(-p)=,220116根據德莫佛-拉普拉斯中心極限定理?-X--? P(X)=P?1420203020÷14≤≤30è≤≤? 444?X-? =P?-.20.÷è15≤≤25? 490Φ(.)-Φ(-.)≈2515=Φ(.)-[-Φ(.)]25115=Φ(.)+Φ(.)-25151=.+.-=.. 0994093310927k 例假設隨機變量X,X,…Xn獨立同分布,已知E(Xi)=αk(i=,,…,n;k=81212n ,,,).證明:當n充分大時,隨機變量Zn=1Xi2近似服從正態分布,並指出其分1234ni=∑1布參數. 證由X,X,…Xn獨立同分布,可知X2,X2,X2,…Xn2也獨立同分布,且有12123E(Xi2)α,=2D(Xi2)=E(Xi4)-[E(Xi2)]2=α-α2,i=,,…,n. 4212由獨立同分布中心極限定理知nnXi2nαXi2α-21-2i=ni=Znα11-2Vn=∑=∑=n(αα2)(αα2)\/n(αα2)\/n4-24-24-2的極限分布是標準正態分布,所以當n充分大時,Vn近似服從標準正態分布,從而Zn=αα2αα24-24-2Vn+α近似服從參數為μ=α,σ2=的正態分布. n22n例(.)將重為a的物品,在天平上重複稱量n次,若各次稱量的結果X,91999Ⅳ1X,…,Xn相互獨立且Xi~N(a,.2),i=,,…,n,則n的最小值不小於多少,可使20212P(|X-a|.).. <01≥095解由題意可知n .2X-aX=1Xi~N(a,02),~N(,). ni=n.\/n01∑102X-an故P(|X-a|.)=P().. <01.\/n<≥095022由此可得n.,即n的最小值不小於. ≥15366416例(大數定律)證明:如果隨機變量序列X,X,…,Xn,…滿足10Markov12Markovn 條件1(D(Xi))=,則對ε,有n limn2i=0?>0→∞1∑nnP(1Xi-1E(Xi)ε)=. nlimni=ni=<1→∞11n∑∑證明記X=1Xi,則ni=1 ∑nnE(X)=1E(Xi),D(X)=1D(Xi),ni=n2i=∑1∑191由切比雪夫不等式,對ε,有?>0D(X)P(|X-E(X)|ε)-,<≥1ε2n 由題設,D(X)=1((DXi))=,故nnlimlimn2i=0→∞→∞∑1P(|X-E(X)|ε),n lim→∞<≥1從而P(|X-E(X)|ε)=,即n lim→∞<1nnP(1Xi-1E(Xi)ε)=. nlimni=ni=<1→∞∑1∑1目標測試題.填空題. 1()設隨機變量X的數學期望與方差分別為μ與σ2,則根據切比雪夫不等式,有1 P(|X-μ|σ). ≥3≤設是來自總體的簡單隨機樣本()X,X,…,XnX,E(X)=μ,D(X)=,X=2128n 則由切比雪夫不等式得到1Xi,P(|X-μ|). ni=<4≥∑1.隨機地擲顆骰子,試利用切比雪夫不等式估計:顆骰子出現的點數總和不小於266點且不超過點的概率. 933.隨機變量X表示做n次獨立重複實驗時,概率為p的事件A出現的次數.試分別用3 切比雪夫不等式及中心極限定理估計滿足下式的n:XD(X)P-p.. (n0992 .某藥廠斷言,該廠生產的某種藥品對於醫治一種疑難的血液病的治愈率為.,醫408院檢驗員任意抽查個服用此藥品的病人,如果其中多於人治愈,就接受這一斷言,10075否則就拒絕這一斷言.()若實際上此藥品對這種疾病的治愈率是.,問接受這一斷言108的概率是多少?()若實際上此藥品對這種疾病的治愈率為.,問接受這一斷言的概率207是多少? .以某種儀器測量已知量A時,設n次獨立測量得到的測量數據為x,x,…,xn.如512n 果儀器無係統誤差,試問當n充分大時,是否可以取1(xi-A)2作為儀器測量誤差的ni=∑1方差的近似值? 92第六章樣本及抽樣分布基本要求.理解總體、簡單隨機樣本、統計量、樣本均值、樣本方差的概念. 1.掌握根據數據計算樣本平均值與樣本方差的方法. 2.了解χ2分布、t分布、F分布的定義和性質,了解分位數的概念並能查表計算. 3.了解正態總體樣本均值與樣本方差等常用的幾個統計量的分布. 4.重點:總體、個體、樣本和統計量的概念,樣本均值、方差及標準差,樣本分布函數和5 樣本矩,正態總體的抽樣分布. 難點:求統計量的分布及獨立性的判定. 內容提要數理統計的基本概念總體:研究對象的全體稱為總體,總體中的每個元素稱為個體.總體常用一個隨機變量X表示. 樣本:相互獨立的n個隨機變量X,X,…,Xn,具有與總體X相同的分布,則X,121X,…,Xn稱為從總體X得到的容量為n的隨機樣本(簡稱樣本).X,X,…,Xn的觀察212值x,x,…,xn稱為總體X的n個獨立觀察值. 12統計量:設X,X,…,Xn是來自總體X的容量為n的樣本,則稱不含未知參數的連1293續的樣本函數(X,X,…,Xn)為總體的一個統計量. f12常用統計量:n 樣本均值:X=1Xi;ni=∑1nn樣本方差:S2=1(Xi-X)2=1(Xi2-nX2);n-i=n-i=1∑11∑1n 樣本標準差:S=S2=1(Xi-X)2;n-i=1∑1n k樣本k階原點矩:Ak=1Xi,k=,,…;ni=121 ∑nk 樣本k階中心矩:Bk=1(Xi-X),k=,,…. ni=12∑1經驗分布函數:設x,x,…,xn為總體X的容量為n的樣本的一組觀察值,將它們12按由小到大的順序排列,得到x*x*…xn*,1≤2≤≤ì,當xx*,?1?01,當x*xx*,?n1≤<2? ?? Fn*(x)=í?k?,當xk*xxk*+,k=,,…,n-,n1?≤<231?? ? ?,當xxn*. 1≥則稱Fn*(x)為總體X的經驗分布函數. 數理統計中常用的分布χ2分布:設X,X,…,Xn相互獨立,且都服從標準正態分布N(,),則稱隨機變1201量 χ2X2X2…Xn2=1+2++服從自由度為n的χ2分布,記作χ2~χ2(n),其概率密度為ny?ì--1y212,y,?nne>0f(y)=í2·()?2Γ?2?,其他. 0其中(s)是函數,以下同. ΓΓt分布:設X~N(,),Y~χ2(n),且X,Y相互獨立,則稱隨機變量0194X t=Y n服從自由度為n的t分布,記作t~t(n),其概率密度為n+(1)2n+Γt-1f(t)=2(+)2,-t+. n1n∞<<∞n()πΓ2 F分布:設隨機變量U~χ2(m),V~χ2(n),且U,V相互獨立,則稱隨機變量U\/mF=V\/n服從自由度為(m,n)的F分布,記作F~F(m,n),其概率密度為ìm+n?m()-mn?Γz21?2m2n2m+n,z,()ímn>0fz=()()(mz+n)2?ΓΓ? ?22?,z. 0≤0隨機變量分布的上α分位點:設隨機變量X的概率密度為f(x),對於給定的正數α,α,稱滿足條件0<<1+ ∞P(Xxα)=f(y)y=α>xαd的點xα稱為隨機變量X分布的上α分位點∫. 正態分布、χ2分布、t分布、F分布的上α分位點分別記為zα,χα2(n),tα(n)和Fα(m,n). 正態總體的抽樣分布單個正態總體的抽樣分布:設總體XN(,σ2),X,X,…,Xn是X的一個樣本,~μ12則 X-μ樣本均值X:X~N(μ,σ2\/n)或~N(,). σ2\/n01(n-)S2樣本方差S2:1~χ2(n-).且X與S2相互獨立,從而有σ21X-μ~t(n-). S\/n1兩個正態總體的抽樣分布:設總體XN(,σ2),YN(,σ2),X,X,…,Xn~μ11~μ22121是X的一個樣本,Y,Y,…,Yn是Y的一個樣本,兩者相互獨立,則統計量12295(X-Y)-(μ-μ)U=12~N(,). σ2σ2011+2nn12當σσ時,統計量1=2(X-Y)-(μ-μ)T=12~t(n+n-),122Sω1+1nn12其中(n)S2(n)S21-1+2-2S2ω=11. n+n-122統計量S2\/σ2F=11~F(n-,n-). S2\/σ2112122答疑輔導問.數理統計的研究對象和目的是什麼? ?61答“數理統計學”的主要任務是研究如何用有效的方法去收集和分析隨機性數據,它的具體含義包括以下幾方麵:()隨機性數據是區別數理統計方法與其他數據處理方法的根本點. 1數據的隨機性來源主要有兩種:問題中涉及的數據很多,隻能抽取部分加以研究,例如,測定支燈管的壽①10000命,隻能抽取其中支進行測試(測試結束,這支燈管就失去了使用價值,這類試驗100100帶有破壞性),而這支燈管的抽取是隨機的. 100數據的隨機性來源於測量誤差或者試驗的隨機誤差,如多次測量機器零件的長② 度,其長度是一固定數值,但測量結果因大量其他隨機因素的影響,如由於測量儀器的不同和操作人員的經驗差異等因素,從而有一定的波動,測量數據仍包含有隨機誤差. ()所謂“有效的方法收集數據”可歸結為:2 建立一個數學上易於處理的模型去描述隨機數據. ①要使數據盡可能包含較多的與研究問題有關的信息. ②例如,對某地區居民收入的狀況進行研究,我們應調查多少戶家庭比較合適,太少了沒有代表性,太多了成本高,時效性差,究竟確定多少戶就要用統計方法.另外假設選取戶,如何選取?如果用純隨機化方法抽取,則數據就有一定的代表性,各種教材討論1000的正是這種類型.是否有更有效的方法,例如,高收入人群占%,低收入人群占%,那3070麼我們從高收入人群中隨機抽戶,而從低收入人群中隨機抽戶,這樣的數據確實30070096更有效,等等.由此產生了數理統計學的兩個分支“抽樣理論”和“試驗設計”.我們目前僅討論用純隨機化方法抽取數據,即“簡單隨機樣本”. ()“有效地分析隨機數據”是指將抽得的隨機數據用有效的方式去集中,提取與研3 究問題有關的信息,並利用它對提出問題做出一定的結論,這種結論稱為“統計推斷”.但統計推斷並不是絕對可靠的,這正是數據隨機化帶來的影響,然而推斷應盡可能的“可靠”.各種教材中討論的“參數估計和參數假設檢驗”是統計推斷中的重要內容.顯著性水平、置信水平反映了這些統計推斷方法的“可靠性”的大小. 問.經驗分布函數與它的觀測值之間的關係? ?62答假設(X,…,Xn)是從總體X中抽取的容量為n的簡單樣本.設x,…,xn為樣11本觀測值,我們有理由認為得到xi的概率是相同的,從而得到一個離散型均勻分布x…xi…xn1 1…1…1nnnm 它相應的分布函數稱為經驗分布函數的觀測值.即Fn(x)=,其中m為x,…,xnn1中不超過x的個數. m如果回到觀測前xi應改為Xi,稱Fn(x)=(m為X,…,Xn中不超過x的個數)n1為經驗分布函數.由Xi的隨機性知Fn(x)是一個隨機變量,而Fn(x)是它的觀測值,它nnkk的k階原點矩為Ak=1xi,回到Xi,我們稱Ak=1Xi為樣本k階原點矩.從直觀ni=ni=∑1∑1上看,如果n取得充分大,則經驗分布函數應當與總體X的分布函數十分接近(因為n越p 大,信息越多,兩者接近程度越高).事實上當n時,Fn(x)F(x),而且相應的樣→∞→本k階原點矩Ak依概率收斂於總體k階原點矩,這一結論正是第七章矩估計的理論基礎. 問.如何理解自由度? ?63答自由度通常是指不受任何約束可以自由變動的變量的個數.在數理統計中,自由度是對隨機變量的二次型(可稱為二次統計量)而言.由線性代數知識,一個含有n個變量nn的二次型aijXiXj(aij=aji,i,j=,…,n)的秩是指對稱矩陣A=(aij)n×n的秩.秩i=i=1∑1∑1的大小反映了n個變量可自由變動、無約束的變量個數.這裏的自由度就是指二次型的秩.所以要判定一個二次統計量的自由度是多少,可以通過求A=(aij)n×n的秩而得到. 問.χ2分布、t分布、F分布和正態分布之間的關係? ?64答()χ2分布與正態分布. 1若X,X,…,Xn相互獨立且都服從標準正態分布N(,),則1201n Xi2~χ2(n). i=∑197χn2-n若隨機變量序列χn2~χ2(n),n=,,…,則當n時,漸近服從標準正態12→∞n2 分布N(,). 01()χ2分布與F分布. 2若Xχ2(n),Yχ2(n),X,Y相互獨立,則~1~2X\/n1~F(n,n). Y\/n122 χn21 若X~F(n,n),則當n時,X漸近服從於的分布,其中χn2~χ2(n). 122∞n11→1()t分布與正態分布. 3若隨機變量序列Tn~t(n),n=,,…,則當n時,Tn漸近服從標準正態分布12→∞N(,). 01典型例題例(.)設總體X的概率密度為f(x)=1-|x|(-x+),X,X,12006Ⅳe∞<<∞122 …,Xn為總體的簡單隨機樣本,其樣本方差為S2,則E(S2)=. 解記樣本均值為X,由於+ ∞E(X)=x·1-|x|x=,-ed0∞2+ ∫∞-|x|E(X2)=x2·1x=,-ed2∞2∫D(X)=,2 則E(Xi2)=,i=,,…,n,2122 E(X2)=E(X)+D(X)=+2=2,()0nn從而n E(S2)=E(1(Xi2-nX2))n-i=11n∑=1(E(Xi2)-nE(X2))=1(n-)=. n-i=n-2221∑11例設總體X服從參數為λ的指數分布,即X的概率密度為2 λ-λx,x,f(x)=e>0(λ){,x.>00≤098(X,X,…,Xn)是總體X的一個樣本,試求:12()(X,X,…,Xn)的概率密度;112()E(X),D(X)和E(S2),其中X和S2分別是樣本均值和樣本方差. 2解()(X,X,…,Xn)的概率密度為112n (x,x,…,xn)(xi)g12=fi=∏1n n-λxiλi∑=,xi,i=,,…,n,=e1>012{,其他. 0++∞∞()E(X)=xf(x)x=λx-λxx=1,- 2∞d0edλ+ ∫∞∫-λxE(X2)=λx2x=2,edλ2∫0D(X)=E(X2)-[E(X)]2=1. λ2因為X,X,…,Xn,相互獨立且與X同分布,所以12n E(X)=1E(Xi)=1nE(X)=1,ni=nλ1 n∑nD(X)=D(1xi)=1D(Xi)=1nD(X)=1. ni=n2i=n2nλ2∑1∑1又因為E(X2)=D(X)+[E(X)]2=1+1,nλ2λ2所以n E(S2)=1E(Xi2-nX2)n-i=11n∑=1[E(Xi2)-nE(X2)]n-i=1∑1éù=1ênE(X2)-n(1+1)ún-?nλ2λ2? 1nn=1(2-1-)=1. n-λ2λ2λ2λ21 例設總體X~N(μ,σ2),X,X,…,Xn是它的一個簡單隨機樣本,令Y=312n 1|Xi-μ|,試求E(Y),D(Y). ni=1 ∑n解E(Y)=1E|Xi-μ|=1nE(|X-μ|)ni=n∑199+(x-)∞μ2-σ=1|x-μ|22x- σ∞ed2π∫+t σ∞-2x-μ=|t|2t(令=t)- ∞edσ2π∫++tt∞σ∞-2σ-2=2t2t=-22=2σ. 0ede2π∫2π0π由於X,X,…,Xn相互獨立且與X同分布,所以12nnD(Y)=1D(|Xi-μ|)=1D(|Xi-μ|)n2i=n2i=∑1∑1=1nD(|X-μ|)=1D(|X-μ|)n2n=1E(|X-|2)-(E(|X-|))2n(μμ)=1[D(X)-(2σ)2]n πσ2=1(σ2-2σ2)=(-2). n1nππ例設總體X~N(μ,2),X,X,…,Xn是取自總體X的樣本,試問n應取多4212大,才能使:()E(|X-μ|2).;1≤01()E(|X-μ|).. 2≤01解X~N(μ,4). n()E(|X-μ|2)=D(X)=4,1n要使E(|X-μ|2)=4.,n≤01n 隻需1,即n. ≥.≥40401()由例知23E(|X-|)=24=8,μnnππ由8.,得n. n≤01≥255π 例設總體X~N(μ,2),X,X,…,X是總體X的樣本,試求:521216100σ216()P(1(Xi-μ)2σ2);1≤i=≤2216∑116()P(1(Xi-X)225σ2). 2i=≤16∑116Xi-μ解()因為~N(,),i=,,…,,且它們是相互獨立的,所以1σ01121616Xi-μ()2~χ2(). i=σ16∑1因此有σ216P(1(Xi-μ)2σ2)≤i=≤2216∑116Xi-μ=P(()2)8≤i=σ≤32∑116Xi-μ16Xi-μ=P(()2)-P(()2)i=σ≥8i=σ>32∑1∑116Xi-μ16Xi-μ=P(()2)-P(()2),i=σ>8i=σ>32∑1∑1查表得χ2.()=,χ2.()=,0951680011632故 σ216Xi-μP(1()2σ2)=.-.=.. ≤i=σ≤2095001094216∑116()P(1(Xi-X)225σ2)2i=≤16∑11616=P(1(Xi-X)2)σ2i=≤25∑116=-P(1(Xi-X)2),1σ2i=>25∑116-由於(XiX)2S2χ2()且χ2.(),1-=161~005=σ2i=σ2151525∑1所以16P(1(Xi-X)225σ2)=-.=.. i=≤100509516∑116例設X,X,…,Xn和X,X,…,Xn是取自正態總體N(μ,σ2)的兩個獨61112121222立樣本,X,X分別是這兩個樣本的平均值,試確定n,使得P(|X-X|σ).. 1212>≤001解因為兩個樣本是取自同一正態總體,且它們是相互獨立的,所以X和X相互獨12立且XX服從正態分布,由於1-2101E(X-X)=E(X)-E(X)=μ-μ=,12120σ2σ2σ2D(X-X)=D(X)+D(X)=+=2,1212nnn故 σ2X-X~N(,2). 120n由 ?|X-X|n? ?12÷P(|X-X|σ)=P?>÷12>?2σ2÷èn? ?X-Xn? ?12÷=P?>÷.,2?2σ2÷≤001èn? 即?X-Xn? ?12÷P?>÷.,?2σ2÷≤0005èn? 得n z.=.,即n. ≥00052575≥142 (X+X)2例設總體X~N(,σ2),(X,X)為取自總體的樣本,試求Y=12的7012(XX)21-2概率密度f(y). 解XX,XX都服從正態分布,1+21-2E(X+X)=E(X)+E(X)=,12120D(X+X)=D(X)+D(X)=σ2,12122E(X-X)=E(X)-E(X)=,12120D(X-X)=D(X)-D(X)=σ2,12122所以X+X~N(,σ2),X-X~N(,σ2). 12021202由於X,X獨立,它們的協方差應為,因此120(X+X,X-X)Cov1212=(X,X)-(X,X)+(X,X)-(X,X)Cov11Cov12Cov21Cov22=D(X)-+-D(X)=σ2-σ2=,10020即XX與XX不相關. 1+21-2對於正態隨機變量,獨立性與不相關性等價,所以XX與XX獨立.注意到1+21-2102X+XX-X(12)2~χ2(),(12)2~χ2(),σ1σ122由F分布的定義X+X(12)2X+Xσ(12)2=2~F(,),X-XX-X1112(12)2σ 2X+X故Y=(12)2的概率密度為XX1-2?ì?11,y,()()>0fy=íπy+y?1?,y. 0≤0例設總體X服從區間(,θ)上的均勻分布,X,X,…,Xn是總體的一個樣本,8012令Y=(X,X,…,Xn),求Y的概率密度g(y)和E(Y),D(Y). max12解X的概率密度為ì ?1,xθ,f(x)=íθ0< ?,其他. 0先求Y的分布函數G(y),由於G(y)=P(Yy)=P(Xy,…,Xny)≤1≤≤n n=P(Xiy)=[FX(y)],i=≤∏1其中FX(x)是X的分布函數,即?ì,x,0<0?xF(x)=í,xθ,?θ0≤ ?,xθ. 1≥所以?ì,y,0<0?yG(y)=í()n,yθ,?θ0≤ ?,yθ. 1≥故Y的概率密度為ìnn-?1?ny,yθ,g(y)=íθ0< ?,其他. 0103θnnE(Y)=yny=θ,θndn+01∫θnn+nE(Y2)=y1y=θ2,θndn+02D(Y)=E(Y2)-[E(Y)]∫2n?n?2nθ2=θ2-?÷θ2=. n+èn+?(n+)(n+)22121例有N件產品,其中M件不合格,其餘為合格品,現進行n次不返回抽樣(n9 1212M 解記p=,則N n-MN-11MP(Xi=)=An==p. 1NNA E(Xi)=p,D(Xi)=E(Xi2)-[E(Xi)]2=p-p2,i=,,…,n. 12?n?n?÷E(X)=E1Xi=1E(Xi)=p. èni=?ni=∑1∑1當ij(i,j=,,…,n)時,XiXj可能的取值為,,且≠1201n-M(M)N-2-2M-P(XiXj=)=n1A=1p,1NN-A1所以M-E(XiXj)=1p,N-1 (Xi,Xj)=E(XiXj)-E(Xi)E(Xj)CovM-=1p-p2=1p(p-). N-N-111從而有nnD(X)=(X,X)=1(Xi,Xj)Covn2Covi=j=11nn∑∑=1(Xi,Xj)n2i=j=Cov11∑n∑=1[(Xi,Xi)+(Xi,Xj)]n2i=CovijCov∑1∑≠éù=1ênp(-p)+(n2-n)·1p(p-)ún2?1N-1? 1(N-n)p(-p)=1. n(N-)1 104nn注:本題可先求出Xi的分布律.由概率論知識容易知道Xi服從超幾何分布,i=i=11即它的分布律是∑∑nkn-kMN-MP()Xi=k=CCn,k=,,…,r. i=N01∑1C其中r=(M,n). minnn然後按數學期望和方差的定義,求出E(Xi),D(Xi),再計算E(X)和D(X). i=i=∑1∑1例設總體X在區間(,)上服從均勻分布,X,X,…,X為總體X的樣本,1001125X*,X*,…,X*是X,X,…,X一組順序統計量,試求概率125125?? ?÷PXi*1,i=,,…,. è>?1252 分析X*,X*,…,Xn*為樣本X,X,…,Xn順序統計量,是指每個Xi*都是X,12121X,…,Xn的函數,Xi*的觀察值為xi*,xi*是樣本X,X,…,Xn的觀察值x,x,…,21212xn中按大小次序排列成x*x*…xi*…xn*1≤2≤≤≤≤後的第i個數值.易見X*={Xi},Xn*={Xi}. 1inin1min≤≤1max≤≤???? ?÷?÷解PXi*1=-PXi*1,事件Xi*1發生,當且僅當事件è>?1è≤?{}≤222X1,X1,…,X1中至少有i個事件發生,而這個事件是相互獨{}1≤{}2≤{}5≤5222立的,且發生的概率都是PX1=1,所以{}≤22??55?÷kk-kkPXi*()()5()5. 1=51-1=15è≤?k=iC1k=iC2∑222∑??5?÷kPXi*()51=-15è>?1k=iC22i-∑1 k()5,i,,,,. =15=k=C123452∑0例(.)設X,X,…,X是來自正態總體X的樣本,111999Ⅲ129Y=1(X+X+…+X),Y=1(X+X+X),11262789639(YY)1-2S2(XiY)2,Z2. =1-2=i=S2∑7證明統計量Z服從自由度為的t分布. 2證記D(X)=σ2(未知),易見σ2σ2E(Y)=E(Y),D(Y)=,D(Y)=,121263105由於Y與Y相互獨立,可知12E(Y-Y)=E(Y)-E(Y)=,12120σ2σ2σ2D(YY)D(Y)D(Y),1-2=1+2=+=632從而Y-YU=12~N(,). σ\/012 S2由正態總體樣本方差的性質,知χ2=2服從自由度為的χ2分布. σ22由於Y與Y,Y與S2獨立,以及Y與S2獨立,可見YY與S2獨立.於是,由服12121-2從t分布的隨機變量的結構,知(Y-Y)UZ=212=Sχ2\/2 服從自由度為的t分布. 2例(.)設總體X服從正態分布N(μ,σ2),從該總體中抽取簡單隨機樣本122001Ⅰnn2 X,X,…,Xn(n),其樣本均值為XXi,求統計量Y(XiXn+i122=1=+-≥2ni=i=2∑1∑1X)2的數學期望E(Y). 2解方法一考慮X+Xn+,X+Xn+,…,Xn+Xn,將其視為取自總體N(μ,112222σ2)的簡單隨機樣本,則其樣本均值為2nn2 1(Xi+Xn+i)=1Xi=X,ni=ni=2∑1∑1樣本方差為1Y,n-1 由於E(1Y)=σ2,n-21 所以E(Y)=(n-)(σ2)=(n-)σ2. n12n21方法二記X''''=1Xi,X″=1Xn+i,ni=ni=∑1∑1顯然X=X''''+X″. 2因此n ()()2EY=E(Xi+Xn+i-X)i=2∑1106n [()()]2=E(Xi-X''''+Xn+i-X″)i=1 ∑n[()2()()()2]=E(Xi-X''''+Xi-X''''Xn+i-X″+Xn+i-X″)i=21 ∑nn()2()2=E(Xi-X'''')++E(Xn+i-X″)i=0i=∑1∑1=(n-)σ2+(n-)σ2=(n-)σ2. 1121例(.)設隨機變量X~t(n)(n),Y=1,則(). 132003Ⅰ>1X2()Y~χ2(n)()Y~χ2(n-)AB1()Y~F(n,)()Y~F(,n)C1D1解本題綜合考查t分布、χ2分布、F分布的概念. U由題設知,X=,其中U~N(,),V~χ2(n).從而U2~χ2(),於是Y=1V\/n011X2V\/nV\/n==~F(n,).故選(). U2U2\/1C1 例()設X,X,…,Xn(n)為來自總體N(μ,)的簡單隨機樣本,記X14201712≥21n =1Xi,則下列結論中不正確的是()ni=∑1n ()(Xi)2服從χ2分布()(XnX)2服從χ2分布-μ-1Ai=B21 ∑n()(Xi-X)2服從χ2分布()n(X-μ)2服從χ2分布Ci=D1 解∑選()B nXi~N(μ,),Xi-μ~N(,),所以(Xi-μ)2~χ2(n),()正確,101i=A1 n∑(n-)S2=(Xi-X)2~χ2(n-),()正確,1i=1C∑1X~N(μ,1),n(X-μ)~N(,),n(X-μ)2~χ2(),()正確,n011D(XnX)2-1Xn-X~N(,),~χ2(),()錯誤. 1021B2 目標測試題.填空題. 1設總體在區間上服從均勻分布是總體的樣本2()X(α,β),X,X,…,XnX,X,S112107分別是樣本均值和樣本方差,則E(X)=,E(S2)=. ()設總體X和Y相互獨立,X~N(,),Y~N(,),X,X,…,X與Y,Y,20901612612…,Y分別是總體X和Y的樣本,其均值分別為X,Y,則統計量XY服從分布. 8-()設隨機變量X和Y相互獨立都服從正態分布N(,2),而X,…,X和Y,…,303191X+…+XY分別是來自總體X和Y的簡單隨機樣本,則統計量U19服從9=Y2…Y21++9分布,參數為. .選擇題. 2()樣本X,X,…,Xn取自正態總體N(,),X,S2分別是樣本平均值和方差,則11201(). ()X~N(,)()nX~N(,)An01B01nX()Xi2~χ2(n)()~F(,n-)Ci=DS211∑1n ()樣本X,X,…,Xn取自正態總體N(,σ2),Y(Xi)2,則E(Y)(). 12==20i=∑1()σ2()nσ2()(nσ)2()ABCD0()設X,X,…,Xn(n)是來自正態總體N(,)的簡單隨機樣本,X是樣本均312≥201值,S2為樣本方差,則(). ()nX~N(,)()nS2~χ2(n)A01B(n-)X(n-)X2()1~t(n-)()11~F(,n-)CS1Dn11Xi2i=∑2.設X,X,…,X是取自總體N(,.2)的樣本,試求:312100216100100()P{Xi};()E(Xi2). 1180≤i=≤2102i=∑1∑1.設X,X,X,X是取自總體N(μ,σ2)的樣本,試確定常數a,使41234?(X-X)2? P?12a÷=.. è(XX)2?0953-4≤.設X~N(,σ2),X,X,…,X是取自總體X的容量為的樣本,X,S2分別是501299樣本均值和方差,試求PX(2.S2). 012隨機樣本,求:()樣本X,X,…,Xn的聯合分布律;112n ()X=1Xi的分布律. 2ni=∑1.假設某種電子元件的壽命X(單位:千小時)服從參數為.的指數分布,即X的705108概率密度為-.x.05,x,f(x)=05e>0{,x. 0≤0今測試個元件,它們的壽命分別為X,X,…,X,試求樣本的平均值X不小於. 101210155的概率. 設2為取自總體的樣本是樣本平均值確定.X~N(μ,σ),(X,X,…,Xn)X,X,812?n? ?÷常數k,使E1Xi-X=σ. èki=? ∑1109第七章參數估計基本要求.理解參數的點估計概念. 1.掌握用矩估計法和極大似然估計方法計算參數的估計量. 2.了解估計量的評選標準,包括無偏性、有效性和相合性(一致性)的概念,並會驗證3 估計的無偏性. .理解區間估計的概念. 4.掌握單個正態總體的均值和方差的置信區間的求法. 5.掌握兩個正態總體均值差和方差比的置信區間的求法. 6.重點:矩估計法、極大似然估計法、評價估計量優良性的三個基本標準、置信區間及7 單側置信區間. 難點:求極大似然估計量及估計量一致性的討論. 內容提要參數的點估計設總體X的分布函數的形式已知,它的一個或多個參數未知,通過樣本觀察值來估計總體未知參數的真值,稱為參數的點估計. 估計量:建立統計量T(X,X,…,Xn),對於總體X樣本X,X,…,Xn的一個觀1212110察值x,x,…,xn,若將T(x,x,…,xn)作為參數θ的估計值,則稱統計量T(X,X,121212…,Xn)為參數θ的估計量,記作^θT(X,X,…,Xn),稱T(x,x,…,xn)為參數θ的=1212估計值. 矩估計法:設總體X的分布函數中含有k個未知參數θ,θ,…,θk,且前k階矩l12μ=l E(X)(l=,,…,k)都存在,它們是θ,θ,…,θk的函數μl(θ,θ,…,θk),l=,,…,12121212k;假設X,X,…,Xn是總體的一個樣本,建立統計量———樣本l階矩Al,l=,,…,k,1212由下列方程組:ì(θ,θ,…,θk)A,?μ112=1? ?μ(θ,θ,…,θk)=A,í2122?…………………………? ?k(θ,θ,…,θk)Ak. μ12=^^^^解得θl=θl(A,A,…,Ak),l=,,…,k,並以θl作為參數θl的估計量,則稱θl為參數1212θl的矩估計量.矩估計量的觀察值就是矩估計值,這種估計方法稱為矩估計法. 極大似然估計法:用總體X的樣本的似然函數來估計參數真值的方法.設總體X的樣本的似然函數為L(x,x,…,xn;θ),如果存在^θ,使得函數L達到最大值,L(x,x,1212^^^…,xn;θ)=L,則稱θ是參數θ極大似然估計值.顯然θ是x,x,…,xn的函數,當用max12^^Xi代替xi(i=,,…,n)時,稱θ=θ(X,X,…,Xn)為θ的極大似然估計量. 1212具體做法是:當X是離散型隨機變量,P(X=x)=P(x;θ),則似然函數為n L(θ)=P(xi;θ). i=1 解方程∏LLd=或dln=,θ0θ0dd即可得^θ^θ(X,X,…,Xn). =12當X是連續型隨機變量,概率密度為f(x;θ),則似然函數n L(θ)=f(xi;θ). i=1 解方程∏LLd=或dln=,θ0θ0dd即可得^θ^θ(X,X,…,Xn). =12當總體分布函數中含有k個未知參數時,似然函數L(θ,θ,…,θk)為多元函數,解12111L(θ,θ,…,θk)或L(θ,θ,…,θk)的偏導數方程組12ln12?ì?L(θ,…,θk)?ì?L(θ,…,θk)1=,ln1=,??θ0??θ0?1?1í……………………或í………………………?? ??L(θ,…,θk)??L(θ,…,θk)?1=?ln1=. ??θk0??θk0即可得^^θi=θi(X,X,…,Xn),i=,,…,k. 1212估計量的評選標準一致性(相合性):設^θ(X,X,…,Xn)為總體X的未知參數θ的估計量,若^θ依概率12收斂於θ,即對任意給定正數ε,有P{|^θ-θ|ε}=. n>0lim→∞<1無偏性:設^θ^θ(X,X,…,Xn)為θ的估計量,若E(^θ)存在,且有E(^θ)θ,則稱=12=^θ為參數θ的無偏估計量,否則稱有偏估計量. 有效性:設^θ(X,X,…,Xn)和^θ(X,X,…,Xn)都是參數θ的無偏估計量,若112212有D(^θ)D(^θ),則稱^θ較^θ有效. 1<212在某些給定的條件下,無偏估計量^θ的方差D(^θ)永遠不會小於一個正數,這就是羅-克拉美()不等式Rao-CramerD(^θ)1,≥?f(X,θ)nE[ln]2?θ它說明參數θ的所有無偏估計量^θ的方差,有一個下界1,?f(X,θ)nE[ln]2?θ這個下界稱為無偏估計量的方差界.達到方差界的無偏估計量^θ比θ的其他無偏估計量較有效. 參數的區間估計設總體X的分布函數F(x;θ)含有一個未知參數θ,若由樣本X,X,…,Xn確定的12兩個統計量θ=θ(X,X,…,Xn)及θ=θ(X,X,…,Xn),對於給定的α(α),12120<<1有P{θθθ}=-α,則稱隨機區間(θ,θ)為θ的置信度為-α的置信區間,θ和θ<<11分別稱為置信下限和置信上限. 確定未知參數θ的置信區間的一般步驟是:步驟一:先求出待估參數θ的點估計量^θ:^θ^θ(X,X,…,Xn). =12112步驟二:建立一個樣本的適當的函數:UU(X,X,…,Xn;θ),它包含未知參數θ,=12而不含其他未知參數,並且U的分布已知. 步驟三:根據給定的置信度-α,求出兩個常數a,b,使之滿足P(aUb)=-1<<1α. 步驟四:從不等式aUb,解出θθθ.其中θ和θ都是統計量,則(θ,θ)就是<<<<參數θ的一個置信度為-α的置信區間. 1單個正態總體均值μ的置信區間:當σ已知時,μ的置信度為-α的置信區間為1 ?σσ? ?X-zα,X+zα÷. è2n2n? 當σ未知時,μ的置信度-α的置信區間為1 SS(X-tα(n-),X+tα(n-)). 21n21n單個正態總體方差σ2的置信區間:當μ未知時,σ2的置信度-α的置信區間為1 (n-)S2(n-)S2,. (α1α1)χ2(n-)χ2-(n-)21121兩個正態總體均值差的置信區間:當σ2與σ2均為已知,的置信度μ1-μ212μ1-μ2-α的置信區間為1 σ2σ2σ2σ2(X-Y-zα1+2,X-Y+zα1+2). 2nn2nn1212當σ2與σ2均為未知,隻要n,n較大(一般大於),則用S2,S2代替σ2與σ2,得到1212501212μ-μ的近似-α的置信區間為121S2S2S2S2(X-Y-zα1+2,X-Y+zα1+2). 2nn2nn1212當σ2=σ2,但值未知,μ-μ的置信度-α的置信區間為12121α (X-Y-t(n+n-)Sw1+1,2122nn12α X-Y+t(n+n-)Sw1+1). 2122nn12(n)S2(n)S21-1+2-2其中S2w=11. n+n-122σ2σ2兩個正態總體方差比1的置信區間:當μ,μ未知,1的置信度-α的置信區間為σ212σ2122S2S2(1,1)αα. S2F(n-,n-)S2F-(n-,n-)2211212121121單側置信區間:對於給定的α(α),若由樣本X,X,…,Xn確定的統計量θ01(<113=-α,則稱隨機區間(θ,+)(或(-,θ))為θ的置信度為-α的單側置信區間,1)∞∞1θ稱為單側置信下限(或將θ稱為單側置信上限). 答疑輔導問.似然方程的解都是極大似然估計嗎? ?71答不盡然.例如,若樣本X,X,…,Xn來自總體X,其概率密度為12f(x;θ)=1,-x. [+(x-θ)2]∞<<∞π1當n=,則似然函數為1 L(x;θ)=1,1[+(x-θ)2]π11L(x;θ)=--[+(x-θ)2]. ln1lnπln11此時對數似然方程為L(x-θ)dln=21=,θ+(x-θ)20d11故^θX是極大似然估計. =1當n=,則似然函數為2 L(x,x;θ)=1. 122[+(x-θ)2][+(x-θ)2]π1112要使似然函數達到最大,隻要似然函數的分母達到最小即可.於是令f(θ)=2[+(x-θ)2][+(x-θ)2],π1112f''''(θ)=-(x+x-θ)[θ2-(x+x)θ+xx+]=. 2122121210解得θ(xx)=11+22 (x+x)±(x-x)2-和θ=12124. 2而 f″(θ)=[θ2-(x+x)θ+xx+]412121-(x+x-θ)[θ-(x+x)],2122212x+xf″(12)=-(x-x)2+. 1242 若上式大於,即(x-x)2,則f(θ)達到最小值,而此時012<4(x+x)±(x-x)2-θ=121242 114為複根,故^θ(XX)為極大似然估計,而=11+22 (X+X)±(X-X)2-^θ=121242 不是. 而當(x-x)2時,同樣討論可得,^θ=1(X+X)不是極大似然估計,而^θ=12>4122 (X+X)±(X-X)2-12124是θ的兩個極大似然估計. 2問.若^θ是θ的無偏估計,則u(^θ)是否為u(θ)的無偏估計? ?72答未必是.例如,設^θ是參數θ的一個無偏估計,且有D(θ),則>0E(^θ2)=D(^θ)+(E(^θ))2=D(^θ)+θ2θ2. >所以,^θ2不是θ2的無偏估計. 問.如何理解參數的點估計和區間估計? ?73答參數θ的點估計,是利用樣本X,X,…,Xn中的信息構造一個統計量^θ(X,121X,…,Xn)作為θ的估計量,即利用樣本求未知參數θ的一個近似值^θ,而衡量其近似程2 度好壞的標準有無偏性、有效性、一致性等. 任何一種“近似”若不附加“誤差範圍”,這種近似是沒有價值的.因而用^θ去估計θ必須按一定的置信度-α(即概率)要求構造某個隨機區間(θ,θ),其中θ=θ(X,X,…,112Xn)及θ=θ(X,X,…,Xn)使該隨機區間包含θ的概率達到-α,即121P(θθθ)=-α,<<1隨機區間(θ,θ)稱為θ的置信度為-α的置信區間. 1由於考慮到隨機性,一般一個有限的隨機區間不可能以置信度包含θ,通常我們取1 置信水平α足夠小(如%,%等),使隨機區間(θ,θ)包含θ的概率足夠大.值得注意的51是,從統計學中頻率學派的觀點看,被估計的參數θ雖然未知,但它是一個常數,沒有隨機性,而區間(θ,θ)則是隨機的,因此P(θθθ)=-α可解釋為隨機區間(θ,θ)以概<<1率-α包含參數θ的真值,而不能說參數θ以-α的概率落入隨機區間(θ,θ).衡量一11個置信區間(θ,θ)優劣的標準,則是在給定置信度-α之下,置信區間的長度要盡可能1 的小. 在實際應用中,通常我們所具有的資料是樣本X,X,…,Xn的一組觀測值x,x,1212…,xn,由此代入θθ(X,X,…,Xn)及θθ(X,X,…,Xn)可得到一個確定的區間=12=12(a,b),該區間已非隨機區間,它要麼包含θ,要麼不包含θ,二者必居其一.因此我們此時也不能說區間(a,b)以概率-α包含θ的真值,更不能說θ落在(a,b)的概率為-α,11那麼此時應如何解釋區間(a,b)呢? 從頻率的角度我們可給區間(a,b)以如下解釋:從給定的總體x中重複抽樣多次,且115各次抽得的樣本的容量均為n,對每次抽得的樣本觀測值,都對應於一個確定的區間(a,b).由貝努裏大數定律,當抽樣次數充分大時,在這些區間中包含θ真值的頻率接近於置信度-α,即在這些區間中大約有(-α)%的區間包含θ真值,α%區間不11001100包含θ真值. 典型例題例設總體X服從均勻分布U[,θ],它的密度函數為10ì ?1,xθ,f(x;θ)=íθ0≤≤? ?,其他. 0()求未知參數θ的矩法估計量;1 ()當樣本觀察值為:.,.,.,.,.,.時,求θ的矩法估計值. 20308027035062055θ-θθ解()因為E(X)=0=,令E(X)=A,得=A=X,所以θ=X,因1112222此θ的矩法估計量為^θ=X. 2()因為2 x=1(.+.+.+.+.+.)=.,0308027035062055048176 所以^θ=x=×.=.,220481709634即θ的矩法估計值為.. 09634x 例(.)總體X的概率密度為f(x;σ)=1-σ,σ(,+),-22018Ⅰσe∈0∞∞<2 x+,X,X,…Xn為來自總體X的簡單隨機樣本. <∞12()求σ的極大似然估計. 1^^()求E(σ),D(σ). 2解()由條件可知,似然函數為1nxi-σL(x,x,…xn;σ),12=1i=σe12n∏nxixi取對數:L(x,x,…xn;σ)[σ][σ],12=--=---lni=ln2σi=ln2lnσ11∑∑nnxiL(x,x,…xn;σ)xini=求導:dln12=[-1+]=-+∑1=,σi=σσ2σσ20d∑1解得σ的極大似然估計116n Xii=σ=∑1. ^nn Xi+xi=∞-()E(σ^)=E(∑1)=E(X)=x1σx=σ,2n-σed∞2n∫Xii=D(σ)=D(∑1)=1D(X)=1{E(X2)-E2(X)}^nnn+x+x∞-∞-=1{x21σx-σ2}=1{x21σx-σ2}n-σednσed∞20σ2∫∫=. n例設X,X,…,Xn是來自對數級數分布312pkP(X=k)=-1,p,k=,,…(-p)k0<<112ln1的一個樣本,用矩法估計參數p. 解這是離散型隨機變量,隻有一個未知參數,先求. μ1∞pkE(X)k()μ1==-1k=(-p)k∑1ln1∞p=-1pk=-1. (-p)k=(-p)-pln1∑1ln11p 令μ=A=X,得-1=X. 11(-p)-pln11但上式無法求出來.我們進一步求. pμ2∞pkE(X2)k2()μ2==-1k=(-p)k∑1ln1∞∞kpk-=-1kp=-kp1(-p)k=(-p)k=ln1∑1ln1∑1ppp=-()''''=-1. (-p)-p(-p)(-p)2ln11ln11X 令μ=A,得μ=X·1=A,於是p=-. 222(-p)21A12X 因此p的矩法估計量為^p=-,其中1A2 nnXXi,AXi2. =12=1ni=ni=∑1∑1例(.)設總體X的概率分布為42002Ⅰ117X 0123Pθ2θ(-θ)θ2-θ2112其中θ(θ1)是未知參數,利用總體X的如下樣本值0<<2 ,,,,,,,,31303123求θ的矩估計值和最大似然估計值. 解E(X)=×θ2+×θ(-θ)+×θ2+×(-θ)01212312=-θ,34x=1×(+++++++)=. 3130312328 令E(X)=x,即-θ=,解得θ的矩估計值為^θ=1. 3424 對於給定的樣本值,似然函數為n L(x,x,…,xn;θ)P(xi,θ),12=i=∏1L(θ)=θ6(-θ)2(-θ)4,4112L(θ)=+θ+(-θ)+(-θ),lnln46ln2ln14ln12L(θ)-θ+θ2dln=6-2-8=62824. θθ-θ-θθ(-θ)(-θ)d112112L(θ)±令dln=,解得θ,=713. θ012d12+ 因7131不合題意,所以θ的最大似然估計值為> 122- ^θ=713. 12例設總體X的概率密度為5 (α+)xα,x,f(x;α)=10<<1{,其他. 0α-,其中α未知,又X,X,…,Xn是總體X的一個樣本,求α的矩法估計量和極大>112似然估計量. 解()求矩法估計量.因為1 +∞ μ=E(X)=xf(x;α)x1-∞d1∫αα+=x(α+)xx=1,1dα+02α+∫-X令μ=A,得1=A=X,即α=12. 11α+1X-21118-X所以α的矩估計量為^α=12. X-1 ()求極大似然估計量.似然函數為2 nα L(x,x,…,xn;α)(α)xi,xi. 12=+i=10<<11 n∏nL=((α+)+αxi)=n(α+)+αxi,lni=ln1lnln1i=ln11∑n∑Lndln=+xi,αα+i=lnd1∑1令 nn +xi=,α+i=ln01∑1得 nα=--. n1xii=ln∑1n 所以α的極大似然估計量為^α=--. n1Xii=ln∑1例(.)設總體X的分布函數為62004Ⅰì ?,,?-1βxf(x;β)=í1x>1? ?,x,0≤1其中未知參數β,X,X,…,Xn為來自總體X的簡單隨機樣本,求:>112()β的矩估計量;1 ()β的極大似然估計量. 2解()由於總體X的概率密度為1 ì?β,x,F(x,β)β+F(x;β)=d=íx1>1x? d?,x. 0≤1故 ++()∞(,)∞ββEX=xfxβx=βx=. -∞d1xdβ-1 ∫^β∫因此由矩估計法得β的矩估計量^β滿足X=,即^β-1 X^β=,X-1 其中119n X=1Xi. ni=∑1()設樣本X,X,…,Xn的觀測值為x,x,…,xn(xi,i=,,…,n),則似然21212>112函數為n βββL(x,x,…,xn;)(xi;)·…12β=fβ=β+β+β+i=x1x1xn1112∏nβ,=β+(xx…xn)112則對數似然函數為L=nβ-(β+)(xx…xn),lnln1ln12令 Lndln=-(xx…xn)=,ββln120d 得n,β=nxii=ln∑1所以的極大似然估計量為^nββ=n. Xii=ln∑1例設X,X,…,Xn為總體的一個樣本,總體X的概率密度為712x-μ?ì-?1θ,xμ,f(x;θ,μ)=íθe≥? ?,其他. 0其中θ,求未知參數θ和μ的極大似然估計量. >0解這裏有兩個未知參數,似然函數為n xi-μ-θL(x,x,…,xn;,θ),xi,i,,…,n. 12μ=1μ=i=θe≥121 ∏nnxi-nμxi-μi=L=(--θ)=-∑1-nθ,lni=θlnθln1 ∑nxi-nμ?Ln?Li=nln=,ln=∑1-. ?μθ?θθ2θ因為?Lnln=,?μθ>0所以μ越大L越大,但每個xi要大於等於μ,否則似然函數為,ln0120?L所以μ={x,x,…,xn},再由ln=,得min12?θ0θ=x-{x,x,…,xn},min12於是μ和θ的極大似然估計量為^ μ={X,X,…,Xn},min12^ θ=X-{X,X,…,Xn}. min12例(.)設總體X的概率密度為82006Ⅰ?ìθ,x,?0<<1f(x;θ)=í-θ,x,?11≤<2?,其他,0 其中θ是未知參數(θ),X,X,…,Xn是來自總體X的簡單隨機樣本,記N為0<<112樣本值x,x,…,xn中小於的個數. 121()求θ的矩估計量;1 ()求θ的極大似然估計量. 2+ ∞解()因為E(X)=xf(x;θ)x- 1∞d∫12=xθx+x(-θ)x=3-θ,d1d∫0∫12所以由矩估計法,令E(X)=X,即3-θ=X,得到θ的矩估計量^θ=3-X. 22()設樣本X,X,…,Xn的觀測值為x,x,…,xn,則似然函數為21212Nn-NL(x,x,…,xn;θ)=θ…θ(-θ)…(-θ)=θ(-θ),12111︸N?????????n?-N? L=Nθ+(n-N)(-θ),lnlnln1令 LNn-Ndln=-=,θθ-θ0d1得 Nθ=. nN 所以θ的極大似然估計量為^θ=. n例()設X,X,…,Xn是來自總體X的一個樣本,且服從泊鬆分布(λ),求9112πP(X=)的極大似然估計量. 0()某鐵路局證實一個扳道員在年內所引起的嚴重事故的次數服從泊鬆分布,求25一個扳道員在年內未引起嚴重事故的概率p的極大似然估計.使用下麵個觀察值,5122下表中,r表示一扳道員某年中引起嚴重事故的次數,S表示觀察到的扳道員人數. 5121r 012345S 444221942解()泊鬆分布的分布律是1 λkP(X=k)=-λ(λ)k=,,,…,k!e>0012n λxi因而似然函數為L=-λ. i=xi!e∏1n L=[xiλ-λ-(xi!)]lni=lnln1 ∑nn=λxi-nλ-(xi!),lni=i=ln11∑n∑xiLi=dln=∑1-n=,λλ0d 得n λ=1xi=x,ni=∑1因此λ的極大似然估計量為^λ=X,又因為P{X=}=-λ,所以p=P{X=}的極大似0e0然估計量為^p=-X. e()因為p=P{X=},由(),p的極大似然估計量為^p=-X,而201ex=1(×+×+×+×+×+×)440421212934452122=137.,≈112122-. 所以p的極大似然估計值為^p=112.. e≈03253例設X,X,…,Xn是來自總體X~N(μ,σ2)的一個樣本,μ,σ2是未知參1012數,試求P{Xt}的極大似然估計. <解Xi~N(μ,σ2),則σ2X-μX~N(μ,),~N(,),nσ01n ?nn?nP(Xt)=P?(X-μ)(t-μ)÷=Φ[(t-μ)]. <èσ<σ?σ122由於其中μ的極大似然估計量為X,σ的極大似然估計量為n ^σ=1(Xi-X)2,ni=∑1n 則P(Xt)的極大似然估計量為Φ[(t-X)]. <^σ例設總體X服從-分布,它的分布律為1101P(X=)=p,P{X=}=-p=q,101驗證^p2=X2-1S2是p2的無偏估計. n證因為E(X)=p,D(X)=pq,所以pqE(X)=p,D(X)=,n pqE(X2)=[E(X)]2+D(X)=p2+. n而 nnE(S2)=E(1(Xi-X)2)=1E((Xi-X)2)n-i=n-i=1∑11∑1n =1[E(Xi2)-E(XiX)+E(X2)]n-i=21∑1n =1[E(Xi2)-nE(X2)]n-i=1∑1n pq=1[(pq+p2)-n(+p2)]n-i=n1∑1=1[npq+np2-pq-np2]=pq,n-1 於是pqE(^p2)=E(X2)-1E(S2)=+p2-1pq=p2,nnn所以^p2=X2-1S2是p2的無偏估計. n例設^θ是參數θ的無偏估計量,且D(^θ),證明:^θ2不是θ2的無偏估計量. 12>0證由公式E(X2)=D(X)+[E(X)]2,有E(^θ2)=D(^θ)+[E(^θ)]2=D(^θ)+θ2θ2,> 因此^θ2不是θ2的無偏估計量. 123例設隨機變量X,X,…,Xn是來自正態分布N(μ,σ2)的一個樣本,適當選擇1312n-1 常數c,使c(Xi+Xi)2為σ2的無偏估計. 1-i=∑1解方法一由於n-n-11σ2Ec(Xi+Xi)2cE(Xi2+Xi+XiXi2)=[1-]=1-1+i=i=211n-∑∑1 c[E(Xi2+)E(Xi+Xi)E(Xi2)]=1-1+i=21 ∑n-1 =c[E(X2)-(E(X))2]=c(n-)σ2,i=221∑1因此c=1. (n-)21方法二令Y=Xi+-Xi,則Y~N(,σ2),由102n-n-11E()cY2=cE(Y2)i=i=∑1∑1=c(n-)(D(Y)+(E(Y))2)1 =c(n-)σ2=σ2,12因此c=1. (n-)21n 例設X,X,…,Xn是取自總體XN(,σ2)的樣本,試證S2(Xi12~μ=114n-i=1∑1-X)2是σ2的一致估計量. (n-)S2證由於1~χ(n-),並且有σ21σ4σ4E(S2)=σ2,D(S2)=(n-)=2. (n-)221n-11根據切比雪夫不等式有D(S2)σ4P(|S2-σ2|ε)-=-2,<≥1ε21(n-)ε21 即得P(|S2-σ2|ε)=. nlim→∞<1所以S2是σ2的一致估計量. 124例(.)設n個隨機變量X,X,…,Xn獨立同分布,D(X)=σ2,X=151992Ⅲ121nn1Xi,S2=1(Xi-X)2,則(). ni=n-i=∑11∑1()S是σ的無偏估計量()S是σ的最大似然估計量AB()S是σ的一致估計量()S與X相互獨立CD解答案是(). C本題考查以下重要結論:n n個隨機變量X,X,…,Xn獨立同分布,且D(X)σ2,則S2(Xi121==1-①n-i=1∑1X)2是σ2的無偏估計,但S不是σ的無偏估計. n-若X,X,…,Xn是正態總體N(μ,σ2)的一個樣本,則1S2是σ2的最大似然②12nn-估計,且1S是σ的最大似然估計. n若X,X,…,Xn獨立同分布,且各隨機變量服從正態分布,則X與S2相互獨立. ③12根據以上這些重要結論易知,()、()、()均為幹擾項,()為正確選項. ABDC事實上,對於任何總體,隻要E(X),D(X)存在,一切樣本矩和樣本矩的連續函數都是相應總體參數的一致估計量.因此,S2和S是σ2和σ的一致估計量. 例設^θ,^θ是參數θ的兩個相互獨立的無偏估計量,且設D(^θ)=D(^θ).找出1612122常數k,k,使k^θk^θ也是θ的無偏估計量,並且使它在所有這些形狀的估計量中方1211+22差最小. 解因為E(^θ)E(^θ)θ,所以1=2=E(k^θk^θ)(kk)θ. 11+22=1+2要使E(k^θ+k^θ)=θ,隻需k+k=. 1122121又因為^θ與^θ相互獨立,D(^θ)=D(^θ).故12122D(k^θ+k^θ)=k2D(^θ)+k2D(^θ)=(k2+k2)D(^θ). 112211222122要使D(k^θ+k^θ)為最小,隻需S=k2+k2=k2+(-k)2為最小.令11222122111S d=k-(-k)=,k-=,k4121106120d1得 k=1,k=2. 1233125例(.)設總體的概率密度為172003Ⅰ-(x-θ)2,xθ,f(x)=2e>{θ,xθ. ≤^ 其中θ是未知參數,X,X,…,Xn是來自總體X的樣本,記θ=(X,X,…,>012min12Xn). ()求總體X的分布函數F(x);1 ()求統計量^θ的分布函數F^θ(x);2 ()若用^θ作為θ的估計量,討論它是否具有無偏性. 3解()總體X的分布函數是1 xF(x)=P(Xx)=f(t)t- ≤∞dx ì()∫()-t-θ-x-θ?2t,xθ,-2,xθ,=íθ2ed≥=1e≥?{,xθ. ∫?,xθ0<0<()統計量^θ的分布函數是2 ^F^θ(x)=P(θx)=P(X,X,…,Xn)x≤(min12≤)=-P(X,X,…,Xn)x1(min12>)=-P(Xx)P(Xx)…P(Xnx)11>2>>=-[-F(x)]n11-n(x-θ)-2,xθ,=1e≥{,xθ. 0<()由於^θ的概率密度為3 -n(x-θ)2,,F^θ(x)nxθf^θ(x)=d=2e≥x{,xθ,d0<所以+ ^∞E(θ)=xf^θ(x)x- ∞d+ ∫∞-n(x-θ)=x·n2xθ2ed+ ∫∞-n(x-θ)=-x(2)θde++∫-n(x-θ)∞∞-n(x-θ)=-[x2-2x]eθθed∫ 126+ -n(x-θ)∞=θ-12=θ+1θ. neθn≠22於是^θ不是θ的無偏估計量. 例(.)某工程師為了解一台天平的精度,用該天平對一物體的質量做n182017Ⅰ次測量,該物體的質量是已知的,設n次測量結果X,X,…,Xn相互獨立且均服從正μ12態分布N(μ,σ2),該工程師記錄的是n次測量的絕對誤差Zi=Xi-μ(i=,,…,12n),利用Z,Z,…,Zn估計σ. 12()求Zi的概率密度;1 ()利用一階矩求σ的矩估計量;2 ()求σ的最大似然估計量. 3解()設Zi的分布函數FZ(z)=P(Ziz)=P(Xi-μz),對應的概率密1≤≤度fZ(z);當z時,則FZ(z)=;<00當z時,Xi~N(μ,σ2),Yi=Xi-μ~N(,σ2),≥00zy2 -σFZ(z)=P(Ziz)=P(Yiz)=P(-zYiz)=122y,≤≤≤≤-zσed∫2π則Zi的概率密度為z ì2?-σ?222,z,e>0Z(z)F''''Z(z)íσf==2π? ?,z. 0≤0+z+z∞2-σ2∞2z2-σ-σ()因為E(Zi)=z222z=222(-)=2σ,2 20σedσ0edσ∫2π2π∫2π令E(Zi)AZ則Zσ,由此可得σ的矩估計量σZ. =1==2^=ππ2n zi2 -σ()樣本的Z,Z,…,Zn似然函數為L(z,z,…,zn,σ)22,1212=23i=σe∏12πn 取對數得L=n2-nσ-1zi2,lnlnlnσ2i=2π2∑1n Ln令dln=-+1zi2=,解得σσσ3i=0d∑1n σ=1zi2. ni=∑1127n 所以σ的最大似然估計量σ^=1Zi2ni=∑1例(.)設總體X的方差為,根據來自X的容量為的簡單隨機樣本,191993Ⅲ1100測得樣本均值為,則X的數學期望的置信度近似等於.的置信區間為. 5095解答案是(.,.).這是因為48045196X-μZ=~N(,),011 100P(-.Z.)=.. 196<<196095故μ的置信度為.的置信區間為095?? ?X-1×.,X+1×.÷,è196196? 1010將x=代入上式得置信區間為(.,.). 548045196例從一批釘子中抽取枚,測得其長度為(單位:):.,.,.,.,. 2016cm2142102132152,.,.,.,.,.,.,.,.,.,.,.,設釘子長度服從正態分13212213210215212214210213211214211布,試在下列情況下,求總體μ的置信度為%的置信區間. 90()已知σ=.();()σ2為未知. 1001cm2解這是求單個正態總體的均值μ的置信區間. σσ()σ2為已知,所以置信區間為(X-zα,X+zα). 12n2nα 這裏α=.,z=z.=.,x=.,σ=.,0120051652125001所以σ. x-zα=.-.×001=.,2n21251652120916σ. x+zα=.+.×001=.. 2n21251652129116因此μ的置信度為%的置信區間為(.,.). 902120921291()這時σ2為未知,所以μ的置信區間為2 SS(X-tα(n-),X+tα(n-)),21n21nα t(n-)=t.()=.,s=.,21005152131500171s. x-tα(n-)=.-.×00171=.,21n2125213152115916128s. x+tα(n-)=.+.×00171=.. 21n2125213152134116所以μ的置信度為%的置信區間為(.,.). 902115921341例對於方差σ2為已知的正態總體來說,問需要抽取容量為多大的子樣,才能使21總體均值μ的置信度為-α的置信區間長度不大於L? 1解設需要抽取容量為n,由假設X-μ~N(,),σ01n 對給定的α,有X-μP(-zαzα)=-α,2<σ<21n 故對於σ2已知的正態總體的均值μ的置信度為-α的置信區間為1 σσσσ(X-zα,X+zα),所以區間的長度為zα,要它不大於L,即zαL,解得2n2n2n22n2≤σ n(zα)2. ≥2L2例設超大牽伸紡機所紡紗的斷裂強度X服從N(μ,.2),普通紡機所紡紗的221218斷裂強度Y服從N(μ,.2).現對X抽得容量為的樣本觀察值,並算得x=.,對2176200532Y抽得容量為的樣本觀察值,算得y=.,試求μ-μ的置信度為.的置信區間. 10057612095解這是求兩個正態總體均值差的置信區間,σ2和σ2均為已知,故置信區間為12σ2σ2σ2σ2(X-Y-zα1+2,X-Y+zα1+2),2nn2nn1212這裏n=,σ2=.2,n=,σ2=.2,-α=.,12001218210021761095α α=.,z=z.=.,x=.,y=.,00520025196532576於是σ2σ2.2.2x-y-zα1+2=.-.-.×218+1762nn53257619612200100=-.,0899σ2σ2.2.2x-y+zα1+2=.-.+.×218+1762nn53257619612200100129=.,0019所以μ-μ的置信度為.的一個置信區間為(-.,.). 1209508990019例某農場為了試驗磷肥與氮肥能否提高水稻收獲量,任選試驗田塊,每塊麵2318積為1畝,進行試驗.試驗結果:不施肥的塊試驗田的收獲量分別為.,.,.,.,1086799310720.,.,.,.,.,.(單位:市斤),而另塊試驗田在播種以前施加磷肥,播種後1121149895101858又追施三次氮肥,其收獲量分別是.,.,.,.,.,.,.,.(單位:市126102117123111105106122斤),假定施肥和不施肥的收獲量都服從正態分布,且方差相等,試在置信度為.下,求095每1畝水稻的平均收獲量施肥比不施肥增產的幅度. 20解設X為施肥的收獲量,Y為不施肥的收獲量,這是求兩個正態總體均值差的置信區間,且σ2σ2σ2,σ2未知,故置信區間為1=2=α (X-Y-t(n+n-)Sw1+1,2122nn12α X-Y+t(n+n-)Sw1+1). 2122nn12其中(n)S2(n)S21-1+2-2S2w=11,n+n-122這裏n=,n=,計算得18210x=.,S=.,y=.,S=.,-α=.,α=.,11410923970211741095005α t()=t.()=.. 21600251621199×.2+×.2Sw=7092391174=.. 10716所以α x-y-t(n+n-)Sw1+12122nn12=.-.-.×.×1+1=.,1149721199107063810α x-y+t(n+n-)Sw1+12122nn12=.-.+.×.×1+1=.. 1149721199107277810130所以在置信度為.下,每1畝水稻平均收獲量的施肥比不施肥增產.到.市斤. 09506327720例一商店銷售的某種商品來自甲、乙兩個廠家,為考察商品性能的差異,現從24甲、乙兩廠產品中分別抽取了件和件產品,測其性能指標X,得到兩組數據,經對其做89相應運算,得S2=.,S2=.,假設測定結果服從正態分布N(μi,σi2)(i=,),求100062000812σ21的%置信區間. σ2902 解這是求兩個正態總體方差比的置信區間,它應為S2S2(1,1),ααS2F(n-,n-)S2F-(n-,n-)2211212121121這裏S2=.,S2=.,n=,n=,-α=.,10006200081829109α F(n-,n-)=F.(,)=.,2112100578350α F-(n,n)F.(,),11-2-=095=1=121178F.(,). 00587373於是S2. 1=0006=.,S2Fα(n-,n-).×.02142211210008350S2. 1,α=0006×.=. S2F-(n-,n-).373279821211210008σ2所以1的%的置信區間為(.,.). σ290021427982 例設某種型號的電子管的壽命服從正態分布,現從中抽出隻,計算得樣本均2510值X=小時,標準差S=小時,求:120045()這批電子管壽命平均值的置信度為.的單側置信下限;1095()求方差σ2的置信度為.的單側置信上限. 2095解()單個正態總體μ的單側下限為1 Sμ=X-tα(n-),1n這裏X=,S=,n=,α=.,12004510005tα(n-)=t.()=.. 1005918331於是μ=-.×45=.,1200183311173910131即為所求單側置信下限. (n-)S2()σ2的單側置信上限為σ2=1,2χ2-α(n-)11χ2-α(n-)=χ2.()=.,1109593325×2於是σ2=945=.,即為所求單側置信上限. .548123325例(.)假設.,.,.,.是來自總體X的簡單隨機樣本值.已知Y262000Ⅲ050125080200=X服從正態分布N(μ,). ln1()求X的數學期望E(X)[記E(X)為b];1 ()求μ的置信度為.的置信區間;2095()利用上述結果,求b的置信度為.的置信區間. 3095解()由題設Y的概率密度為1 (y-μ)-2f(y)=12,-y+,e∞<<∞2π又X=y,於是由函數型的數學期望公式,有e +(y-μ)y∞-y-2b=E(X)=E()=12y- e∞eed2π∫++(t-)t12∞t+μ-2μ+1∞-μ+1=12t=212t=2. --∞eede∞ede2π∫∫2π()當置信度-α=.時,α=.,標準正態分布的水平為α=.的分位數等21095005005於.,故由Y~N(μ,1),可得1964 ?? P?y-.×1μy+.×1÷=.,è196<<196?09544其中y=1(.+.+.+)=1=. ln05ln08ln125ln2ln1044於是有P(-.μ.)=.,098<<098095從而(-.,.)就是μ的置信度為.的置信區間. 098098095()由x的嚴格遞增性,可見3e?? .=P?-.μ+1.÷095è048<<148? 2132-.μ+1. =P0482148,(e 因此b的置信度為.的置信區間為(048,148). 095ee目標測試題.填空題. 1設總體2是來自的一個樣本則時^2()X~N(μ,σ),X,…,XnX,k=,σ11n =k(Xi-X)2是σ2的無偏估計. i=∑1()設總體X的方差為(.)2,根據來自X的容量為的簡單隨機樣本,測得樣本均2035值為.,則X的數學期望的置信度為.的置信區間為. 218095()設由來自正態總體X~N(μ,σ2)容量的簡單隨機樣本得樣本均值為X=316.,樣本標準差S=.,則總體標準差σ2的置信度.的置信區間為. 27050029095.選擇題. 2若是總體的樣本2並且和2是未知參數()X,…,XnX,E(X)=μ,D(X)=σ,μσ,11下麵結論中()是錯誤的. ()^μ=X是μ的無偏估計()^μ=X是μ的無偏估計A1B21()^μ比^μ有效C12n 2是2的極大似然估計量()1(Xi-μ)σDni=∑1()設總體X的分布函數為F(x,θ),其中θ是未知參數,X,…,Xn是總體X的樣21本,x,…,xn是得到的樣本觀察值.如果存在統計量^θ(X,…,Xn),^θ(X,…,Xn),使11121^^得θ(X,…,Xn),θ(X,…,Xn)是θ的置信度為-α的置信區間,則必有(). (1121)1()區間(^θ(x,…,xn),^θ(x,…,xn))一定包含θA1121()區間(^θ(x,…,xn),^θ(x,…,xn))一定不包含θB1121()區間(^θ(x,…,xn),^θ(x,…,xn))可能包含θ,也可能不包含θC1121()P^θ(X,…,Xn)θαD(11≥)>.設X,X,…,Xn是來自參數為λ的泊鬆分布總體的一個樣本,求λ的矩法估計312量. 133.設總體X服從二項分布,它的分布律為4 kkn-kP(X=k)=npq,k=,,,…,n,p,q=-p,C0120<<11試求未知參數p的極大似然估計量. .設X,X,…,Xn為總體X的一個樣本,X的密度函數為512θ-(θ+)θcx1,xc,f(x)=>{,其他. 0其中c為已知,θ,θ為未知,求θ的矩法估計量和極大似然估計量. >0>0.分別用矩法和極大似然法估計幾何分布6 k-P(X=k)=p(-p)1,k=,,…112中的未知參數p. ì?1,xθ,.試證明均勻分布f(x)=íθ0<≤中未知參數的極大似然估計不是無偏7? ?,其他0 的. 設總體服從正態分布是的樣本試驗證.XN(μ,),X,X,…,XnX,:8112^XXX,μ1=11+32+135102^XXX,μ2=11+12+533412^XXXμ3=11+32-133412都是μ的無偏估計量,並問哪個估計量最有效? .設總體X為(,θ]上均勻分布,X,X,…,Xn是來自該總體的一個樣本,證明:^θ9012=X是θ的相合估計. 2.某電子產品的某一參數服從正態分布,從某天生產的產品中抽取隻產品,測得1015該參數為.,.,.,.,.,.,.,.,.,.,.,.,422241724256420342584231418742824383434041234315.,.,.,試求該參數的期望值和方差的置信度為%的置信區間. 41354413423095.某食品的處理前取樣分析,得含脂率為.,.,.,.;處理後取樣分110143014201430137析,得含脂率.,.,.,.,.,假定處理前後的含脂率均服從正態分布,01400142013601380140且方差不變,試求處理前後含脂率的數學期望之差的置信度為.的置信區間. 095.某自動機床加工同類型套筒,假定套筒直徑服從正態分布,現從兩個不同的班次12的產品中,各抽得套筒,測量它們的直徑,得如下數據:134A班:抽得套,算出X=.,S2=.,12106124B班:抽得套,算出Y=.,S2=.,1795247σ2A試求兩班所生產的套筒直徑的方差之比的置信度為.的置信區間. σ2B095135第八章假設檢驗基本要求.理解顯著性檢驗的基本思想及有關名詞的含義,掌握假設檢驗的基本步驟. 1.了解假設檢驗中產生的兩類錯誤的概念. 2.掌握單個正態總體有關均值和方差的假設檢驗的基本步驟. 3.掌握兩個正態總體有關均值和方差的假設檢驗基本步驟. 4.掌握單個正態總體的均值和方差的置信區間的求法. 5.了解χ2一擬合優度檢驗的基本步驟. 6.重點:假設檢驗的基本思想,單個正態總體的均值和方差的假設檢驗. 7難點:檢驗統計量與顯著性水平的選取,以及單邊檢驗臨界值確定的基本方法. 內容提要總體參數的假設檢驗假設檢驗:對總體的分布形式或分布中的未知參數做某種假設,然後抽取子樣,構造合適的統計量,對假設的正確性進行判斷的問題,稱為假設檢驗問題. 136假設檢驗的基本思想:依據概率很小的事件在一次實驗中是幾乎不可能發生的,即小概率原理.若在假設的條件下,小概率事件發生了,則“拒絕接受假設”;否則,可以認為“假設”合理. 兩類錯誤:當原假設H正確時,由於樣本的隨機性,做出了拒絕“接受假設”的決策,0 因而犯了錯誤,稱犯了第一類錯誤或“棄真”的錯誤. 當原假設H不正確時,由於樣本的隨機性,做出了“接受假設”的決策,因而犯了錯0 誤,稱犯了第二類錯誤或“取偽”的錯誤. 雙側檢驗與單側檢驗:原假設是H:θ=θ,備擇假設為H:θθ,稱這類假設檢驗為雙側檢驗. 001≠0原假設是H:θ=θ,對應的備擇假設為H:θθ或H:θθ,稱這類假設檢驗001>01<0為單側檢驗. 假設檢驗的一般步驟如下:第一步:根據實際問題的要求提出原假設H和備擇假設H;01第二步:選取合適的檢驗統計量;第三步:求出在原假設H成立的條件下檢驗統計量服從的概率分布;0 第四步:給出顯著性水平α,確定拒絕域;第五步:做出決策,當檢驗統計量的觀察值落在拒絕域內,則拒絕原假設H,否則接0 受原假設H. 0單個正態總體的假設檢驗:設總體X~N(μ,σ2),關於它的假設檢驗問題主要有問題已知方差σ2,檢驗μ的假設;1 問題未知方差σ2,檢驗μ的假設;2 問題已知均值μ,檢驗σ2的假設;3 問題未知均值μ,檢驗σ2的假設. 4單個正態總體的均值μ、方差σ2的檢驗表原假設H為真時統備擇假設檢驗統計量0拒絕域H計量的分布H01μμUzα>0>X U檢驗-μ0U=U-zαN(,)μμ0μ=μ0σ2137續表原假設H為真時統備擇假設檢驗統計量0拒絕域H計量的分布H01μμTtα(n-)>0>1X t檢驗-μ0T=T-tα(n-)t(n)μμ0μ=μ0S-21σ2σ2χ2χα2(n)>0>n σ2σ2χ2χ2-α(n)χ2檢驗01(Xi-μ)2<<σ2=σ2i=χ2(n)0122α()已知χ2=∑χχnμσ2≥20σ2σ20 ≠α或χ2χ2-(n)1 ≤2σ2σ2χ2χα2(n-)>0>1σ2σ2χ2χ2-α(n-)χ2檢驗01(n-)S221σ2σ20 ≠αχ2χ2-(n-)1 <21兩個正態總體的假設檢驗:設正態總體XN(,σ2),樣本容量為n;YN(,~μ111~μ2σ2)樣本容量為n.關於它的假設檢驗問題主要有22問題已知σ2與σ2,檢驗μ-μ的假設;11212問題未知σ2與σ2,檢驗μ-μ的假設;21212問題未知μ與μ,檢驗σ2與σ2比的假設. 31212兩個正態總體均值差、方差比的檢驗表原假設H為真時統備擇假設檢驗統計量0拒絕域H計量的分布H01μ-μUzαU檢驗12>0>X-YU=-U-zασ2,σ2N(,)μ1μ2μ1-μ2=σ2σ2<02μ-μTtα(n+n-)t檢驗12>0>122X-YT=μ-μT-tα(n+n-)σ2σ2-=t(n+n-)12121=2μ1μ212<022138續表原假設H為真時統備擇假設檢驗統計量0拒絕域H計量的分布H01t檢驗μdTtα(n-)>0>1d=X-Yd-T=0μdT-tα(n-)配對數據μd=Sdt(n-)<021σ2σ2FFα(n-,n-)1>2>1121F檢驗σ2σ2FF-α(n,n)1211-2-S2211未知σ2σ212α