Tiểu sử Đặc điểm Phân tích

Phân phối nhị thức các tính chất và đặc điểm số của nó. Tính chất của phân phối nhị thức

Xin chào! Chúng ta đã biết phân phối xác suất là gì. Nó có thể rời rạc hoặc liên tục, và chúng ta đã biết rằng nó được gọi là phân bố mật độ xác suất. Bây giờ chúng ta hãy khám phá một vài bản phân phối phổ biến hơn. Giả sử tôi có một đồng xu, và đồng xu chính xác, và tôi sẽ lật nó 5 lần. Tôi cũng sẽ xác định một biến ngẫu nhiên X, biểu thị nó chữ viết hoa X, nó sẽ bằng số "đại bàng" trong 5 lần tung. Có lẽ tôi có 5 đồng xu, tôi sẽ tung tất cả chúng cùng một lúc và đếm xem tôi nhận được bao nhiêu cái đầu. Hoặc tôi có thể có một đồng xu, tôi có thể lật nó 5 lần và đếm xem tôi có bao nhiêu lần đầu. Nó không thực sự quan trọng. Nhưng giả sử tôi có một đồng xu và tôi lật nó 5 lần. Sau đó, chúng tôi sẽ không có bất trắc. Vì vậy, đây là định nghĩa của tôi biến ngẫu nhiên. Như chúng ta đã biết, một biến ngẫu nhiên hơi khác một chút so với một biến thông thường, nó giống một hàm hơn. Nó chỉ định một số giá trị cho thử nghiệm. Và biến ngẫu nhiên này khá đơn giản. Chúng tôi chỉ đơn giản đếm xem con “đại bàng” rơi ra bao nhiêu lần sau 5 lần tung - đây là biến ngẫu nhiên của chúng tôi X. Hãy nghĩ xem xác suất có thể là bao nhiêu các giá trị khác nhau trong trường hợp của chúng ta? Vì vậy, xác suất để X (vốn X) là 0 là bao nhiêu? Những thứ kia. Xác suất để sau 5 lần tung, nó sẽ không bao giờ quay đầu? Chà, trên thực tế, đây cũng giống như xác suất nhận được một số "đuôi" (đúng vậy, một cái nhìn tổng quan nhỏ về lý thuyết xác suất). Bạn sẽ nhận được một số "đuôi". Xác suất của mỗi "đuôi" này là bao nhiêu? Đây là 1/2. Những thứ kia. nó phải là 1/2 lần 1/2, 1/2, 1/2 và 1/2 một lần nữa. Những thứ kia. (1/2) ⁵. 1⁵ = 1, chia cho 2⁵, tức là tại 32. Khá logic. Vì vậy, ... tôi sẽ nhắc lại một chút những gì chúng ta đã trải qua về lý thuyết xác suất. Điều này rất quan trọng để hiểu chúng ta hiện đang di chuyển đến đâu và trên thực tế, phân phối rời rạc xác suất. Vì vậy, xác suất mà chúng tôi nhận được chính xác một lần là bao nhiêu? Chà, những cái đầu có thể xuất hiện trong lần tung đầu tiên. Những thứ kia. nó có thể là như thế này: "Eagle", "tails", "tails", "tails", "tails". Hoặc đầu có thể xuất hiện trong lần tung thứ hai. Những thứ kia. có thể có một sự kết hợp như vậy: "đuôi", "đầu", "đuôi", "đuôi", "đuôi", v.v. Một "con đại bàng" có thể rơi ra sau bất kỳ lần tung nào trong số 5 lần tung. Xác suất của mỗi tình huống này là bao nhiêu? Xác suất nhận được đầu là 1/2. Sau đó, xác suất nhận được "đuôi", bằng 1/2, được nhân với 1/2, 1/2, 1/2. Những thứ kia. xác suất của mỗi tình huống này là 1/32. Cũng như xác suất xảy ra tình huống X = 0. Trên thực tế, xác suất của bất kỳ thứ tự đầu và đuôi đặc biệt nào sẽ là 1/32. Vì vậy, xác suất của điều này là 1/32. Và xác suất của điều này là 1/32. Và những tình huống như vậy xảy ra bởi vì "con đại bàng" có thể rơi vào bất kỳ cú ném nào trong số 5 lần tung. Do đó, xác suất để chính xác một “con đại bàng” rơi ra là bằng 5 * 1/32, tức là 5/32. Khá hợp lý. Bây giờ thú vị bắt đầu. Xác suất là gì… (Tôi sẽ viết mỗi ví dụ bằng một màu khác nhau)… xác suất để biến ngẫu nhiên của tôi là 2 là bao nhiêu? Những thứ kia. Tôi sẽ tung một đồng xu 5 lần, và xác suất để nó rơi trúng đầu chính xác 2 lần là bao nhiêu? Điều này là thú vị hơn, phải không? Những kết hợp nào có thể? Nó có thể là đầu, đầu, đuôi, đuôi, đuôi. Nó cũng có thể là đầu, đuôi, đầu, đuôi, đuôi. Và nếu bạn nghĩ rằng hai con “đại bàng” này có thể đứng ở những vị trí khác nhau của sự kết hợp, thì bạn có thể hơi bối rối. Bạn không còn có thể nghĩ về các vị trí như cách chúng tôi đã làm ở đây ở trên. Mặc dù ... bạn có thể, bạn chỉ có nguy cơ bị nhầm lẫn. Bạn phải hiểu một điều. Đối với mỗi kết hợp này, xác suất là 1/32. ½ * ½ * ½ * ½ * ½. Những thứ kia. xác suất của mỗi kết hợp này là 1/32. Và chúng ta nên nghĩ xem có bao nhiêu tổ hợp như vậy tồn tại thỏa mãn điều kiện của chúng ta (2 "đại bàng")? Những thứ kia. Trong thực tế, bạn cần tưởng tượng rằng có 5 lần tung đồng xu và bạn cần chọn 2 trong số chúng, trong đó “con đại bàng” rơi ra. Hãy giả sử 5 lần tung của chúng ta nằm trong một vòng tròn, cũng hãy tưởng tượng chúng ta chỉ có hai chiếc ghế. Và chúng tôi nói: “Được rồi, ai trong các bạn sẽ ngồi trên những chiếc ghế này cho Đại bàng? Những thứ kia. Ai trong số các bạn sẽ là "đại bàng"? Và chúng tôi không quan tâm đến thứ tự mà họ ngồi xuống. Tôi đưa ra một ví dụ như vậy, hy vọng rằng nó sẽ được rõ ràng hơn cho bạn. Và bạn có thể muốn xem một số hướng dẫn về lý thuyết xác suất về chủ đề này khi tôi nói về nhị thức Newton. Bởi vì ở đó tôi sẽ đi sâu vào tất cả những điều này một cách chi tiết hơn. Nhưng nếu bạn lập luận theo cách này, bạn sẽ hiểu những gì hệ số nhị thức. Bởi vì nếu bạn nghĩ như thế này: OK, tôi có 5 lần tung, lần tung nào sẽ hạ được các đầu đầu tiên? Đây là 5 cái đó , khi tung liên tiếp, "con đại bàng" đầu tiên sẽ rơi ra. Và còn bao nhiêu cơ hội cho "đại bàng" thứ hai? Chà, cú ném đầu tiên mà chúng ta đã sử dụng đã lấy đi một cơ hội về đầu. Những thứ kia. một vị trí đầu trong combo đã bị chiếm bởi một trong các lần tung. Bây giờ còn lại 4 lần tung, có nghĩa là "con đại bàng" thứ hai có thể rơi vào một trong 4 lần tung. Và bạn đã thấy nó, ngay tại đây. Tôi đã chọn có đầu trong lần tung đầu tiên và giả định rằng ở 1 trong 4 lần tung còn lại, đầu cũng sẽ xuất hiện. Vì vậy, chỉ có 4 khả năng ở đây. Tất cả những gì tôi đang nói là đối với cái đầu đầu tiên, bạn có 5 vị trí khác nhau mà nó có thể đáp xuống. Và đối với chiếc thứ hai, chỉ còn lại 4 vị trí. Hãy suy nghĩ về nó. Khi chúng tôi tính toán như thế này, thứ tự được tính đến. Nhưng đối với chúng tôi bây giờ, việc “đầu” và “đuôi” rơi ra theo thứ tự nào không quan trọng. Chúng tôi không nói đó là "đại bàng 1" hay "đại bàng 2". Trong cả hai trường hợp, nó chỉ là "đại bàng". Chúng ta có thể giả định rằng đây là đầu 1 và đây là đầu 2. Hoặc nó có thể là ngược lại: nó có thể là "con đại bàng" thứ hai, và đây là "đầu tiên". Và tôi nói điều này bởi vì điều quan trọng là phải hiểu vị trí sử dụng và nơi sử dụng kết hợp. Chúng tôi không quan tâm đến trình tự. Vì vậy, trên thực tế, chỉ có 2 cách xuất phát của sự kiện của chúng ta. Vì vậy, hãy chia nó cho 2. Và như bạn sẽ thấy sau, nó là 2! cách xuất xứ của sự kiện của chúng tôi. Nếu có 3 đầu, thì sẽ có 3! Và tôi sẽ chỉ cho bạn lý do tại sao. Vì vậy, đó sẽ là ... 5 * 4 = 20 chia cho 2 được 10. Vì vậy, có 10 kết hợp khác nhau trong số 32 nơi bạn chắc chắn sẽ có 2 đầu. Vậy 10 * (1/32) bằng 10/32, điều đó bằng bao nhiêu? 16/5. Tôi sẽ viết qua hệ số nhị thức. Đây là giá trị ngay tại đây ở trên cùng. Nếu bạn nghĩ về nó, điều này giống như 5! Chia cho ... Điều này có nghĩa là gì 5 * 4? 5! là 5 * 4 * 3 * 2 * 1. Những thứ kia. nếu tôi chỉ cần 5 * 4 ở đây, thì tôi có thể chia 5! cho 3! Điều này bằng 5 * 4 * 3 * 2 * 1 chia cho 3 * 2 * 1. Và chỉ còn lại 5 * 4. Vì vậy, nó giống như tử số này. Và sau đó, bởi vì chúng tôi không quan tâm đến trình tự, chúng tôi cần 2 ở đây. Trên thực tế, 2 !. Nhân với 1/32. Đây sẽ là xác suất để chúng ta đánh chính xác 2 đầu. Xác suất mà chúng ta sẽ nhận được đầu chính xác 3 lần là bao nhiêu? Những thứ kia. xác suất x = 3. Vì vậy, theo cùng một logic, lần xuất hiện đầu tiên có thể xảy ra ở 1 trong 5 lần lật. Lần xuất hiện đầu thứ hai có thể xảy ra trên 1 trong 4 lần tung còn lại. Và lần đầu xuất hiện thứ ba có thể xảy ra trên 1 trong 3 lần tung còn lại. Có bao nhiêu tồn tại nhiều cách khác nhau sắp xếp 3 lần tung? Nói chung, có bao nhiêu cách sắp xếp 3 đồ vật vào vị trí của chúng? Đó là 3! Và bạn có thể tìm ra nó, hoặc bạn có thể muốn xem lại các hướng dẫn mà tôi đã giải thích chi tiết hơn. Nhưng nếu bạn lấy các chữ cái A, B và C làm ví dụ, thì có 6 cách bạn có thể sắp xếp chúng. Bạn có thể coi đây là những tiêu đề. Ở đây có thể là ACB, CAB. Có thể là BAC, BCA và… Cái gì lựa chọn cuối cùng mà tôi không đặt tên? TƯDVCĐ. Có 6 cách sắp xếp 3 đồ vật khác nhau. Chúng tôi chia cho 6 vì chúng tôi không muốn đếm lại 6 những cách khác bởi vì chúng tôi coi chúng là tương đương. Ở đây chúng tôi không quan tâm đến số lần tung sẽ dẫn đến đầu. 5 * 4 * 3… Điều này có thể được viết lại thành 5! / 2 !. Và chia nó cho 3 nữa !. Đây là những gì anh ấy đang có. 3! bằng 3 * 2 * 1. Ba người đang co lại. Điều này trở thành 2. Điều này trở thành 1. Một lần nữa, 5 * 2, tức là là 10. Mỗi tình huống có xác suất là 1/32, vì vậy đây lại là 5/16. Và nó thật thú vị. Xác suất để bạn lấy được 3 cái đầu là khả năng xảy ra rằng bạn có 2 con đại bàng. Và lý do cho điều đó ... Chà, có rất nhiều lý do tại sao nó lại xảy ra. Nhưng nếu bạn nghĩ về nó, xác suất nhận được 3 đầu cũng giống như xác suất nhận được 2 đầu. Và xác suất nhận được 3 đầu phải bằng xác suất nhận được 2 đầu. Và thật tốt khi các giá trị hoạt động như thế này. Tốt. Xác suất để X = 4 là bao nhiêu? Chúng ta có thể sử dụng cùng một công thức mà chúng ta đã sử dụng trước đây. Nó có thể là 5 * 4 * 3 * 2. Vì vậy, ở đây chúng ta viết 5 * 4 * 3 * 2 ... Có bao nhiêu cách khác nhau để sắp xếp 4 đối tượng? Đó là 4 !. bốn! - thực ra đây là phần này, ngay tại đây. Đây là 4 * 3 * 2 * 1. Vì vậy, điều này bị hủy bỏ, còn lại 5. Khi đó, mỗi kết hợp có xác suất là 1/32. Những thứ kia. điều này bằng 5/32. Một lần nữa, lưu ý rằng xác suất xuất hiện đầu 4 lần bằng xác suất xuất hiện đầu 1 lần. Và điều này có ý nghĩa, bởi vì. 4 đầu giống nhau 1 đuôi. Bạn sẽ nói: à, và cái “đuôi” này sẽ rơi ra ở kiểu tung nào? Đúng, có 5 cách kết hợp khác nhau cho điều đó. Và mỗi người trong số họ có xác suất là 1/32. Và cuối cùng, xác suất X = 5 là bao nhiêu? Những thứ kia. ngẩng đầu lên 5 lần liên tiếp. Nó phải là như thế này: "Eagle", "Eagle", "Eagle", "Eagle", "Eagle". Mỗi đầu có xác suất là 1/2. Bạn nhân chúng và nhận được 1/32. Bạn có thể đi theo hướng khác. Nếu có 32 cách mà bạn có thể nhận được đầu và đuôi trong các thí nghiệm này, thì đây chỉ là một trong số đó. Ở đây có 5 trong số 32 cách như vậy Đây - 10 trên 32. Tuy nhiên, chúng tôi đã thực hiện các phép tính và bây giờ chúng tôi đã sẵn sàng để vẽ phân phối xác suất. Nhưng thời gian của tôi đã hết. Để tôi tiếp tục trong bài học tiếp theo. Và nếu bạn đang có tâm trạng, thì có thể rút ra trước khi xem bài tiếp theo? Hẹn sớm gặp lại!

Chương 7

Các quy luật cụ thể về phân phối của các biến ngẫu nhiên

Các dạng luật phân phối biến ngẫu nhiên rời rạc

Để một biến ngẫu nhiên rời rạc nhận các giá trị X 1 , X 2 , …, x n,…. Xác suất của các giá trị này có thể được tính bằng nhiều công thức khác nhau, ví dụ, sử dụng các định lý cơ bản của lý thuyết xác suất, công thức Bernoulli hoặc một số công thức khác. Đối với một số công thức này, luật phân phối có tên riêng.

Các luật phân phối phổ biến nhất của một biến ngẫu nhiên rời rạc là luật phân phối nhị thức, hình học, siêu phương, Poisson.

Luật phân phối nhị thức

Hãy để nó được sản xuất N các thử nghiệm độc lập, trong mỗi thử nghiệm một sự kiện có thể xảy ra hoặc không NHƯNG. Xác suất xảy ra sự kiện này trong mỗi lần thử là không đổi, không phụ thuộc vào số lần thử và bằng R=R(NHƯNG). Do đó xác suất sự kiện sẽ không xảy ra NHƯNG trong mỗi bài kiểm tra cũng không đổi và bằng q=1–R. Xem xét một biến ngẫu nhiên X bằng số lần xuất hiện của sự kiện NHƯNG Trong N các bài kiểm tra. Rõ ràng là các giá trị của đại lượng này bằng

X 1 = 0 - sự kiện NHƯNG Trong N các bài kiểm tra không xuất hiện;

X 2 = 1 - sự kiện NHƯNG Trong N các thử nghiệm đã xuất hiện một lần;

X 3 = 2 - sự kiện NHƯNG Trong N các thử nghiệm xuất hiện hai lần;

…………………………………………………………..

x n +1 = N- Sự kiện NHƯNG Trong N kiểm tra xuất hiện tất cả mọi thứ N Một lần.

Xác suất của các giá trị này có thể được tính bằng công thức Bernoulli (4.1):

ở đâu đến=0, 1, 2, …,N .

Luật phân phối nhị thức X, bằng số thành công trong N Thử nghiệm Bernoulli, với xác suất thành công R.

Vì vậy, một biến ngẫu nhiên rời rạc có phân phối nhị thức (hoặc được phân phối theo luật nhị thức) nếu các giá trị có thể có của nó là 0, 1, 2,…, N, và các xác suất tương ứng được tính theo công thức (7.1).

Phân phối nhị thức phụ thuộc vào hai thông số RN.

Dãy số phân phối của một biến ngẫu nhiên có phân phối theo luật nhị thức có dạng:

X k N
R

Thí dụ 7.1 . Ba phát độc lập được bắn vào mục tiêu. Xác suất bắn trúng mỗi lần bắn là 0,4. Giá trị ngẫu nhiên X- số lần bắn trúng mục tiêu. Xây dựng chuỗi phân phối của nó.

Dung dịch. Các giá trị có thể có của một biến ngẫu nhiên XX 1 =0; X 2 =1; X 3 =2; X 4 = 3. Tìm xác suất tương ứng bằng công thức Bernoulli. Dễ dàng cho thấy rằng việc áp dụng công thức này ở đây là hoàn toàn chính đáng. Lưu ý rằng xác suất bắn không trúng mục tiêu của một lần bắn sẽ bằng 1-0,4 = 0,6. Lấy

Chuỗi phân phối có lần xem tiếp theo:

X
R 0,216 0,432 0,288 0,064

Dễ dàng kiểm tra rằng tổng tất cả các xác suất đều bằng 1. Bản thân biến ngẫu nhiên X phân phối theo luật nhị thức. ■

Hãy tìm gia trị được ki vọng và phương sai của một biến ngẫu nhiên có phân phối theo luật nhị thức.

Khi giải ví dụ 6.5, người ta chỉ ra rằng kỳ vọng toán học về số lần xuất hiện của một sự kiện NHƯNG Trong N kiểm tra độc lập nếu xác suất xảy ra NHƯNG trong mỗi bài kiểm tra là không đổi và bằng nhau R, bằng N· R

Trong ví dụ này, một biến ngẫu nhiên đã được sử dụng, được phân phối theo luật nhị thức. Do đó, lời giải của Ví dụ 6.5 trên thực tế là một bằng chứng của định lý sau.

Định lý 7.1. Kỳ vọng toán học của một biến ngẫu nhiên rời rạc được phân phối theo luật nhị thức bằng tích của số lần thử và xác suất "thành công", tức là M(X)=N· R.

Định lý 7.2. Phương sai của một biến ngẫu nhiên rời rạc được phân phối theo luật nhị thức bằng tích của số lần thử theo xác suất "thành công" và xác suất "thất bại", tức là D(X)=npq.

Độ xiên và độ lệch của một biến ngẫu nhiên được phân phối theo luật nhị thức được xác định bởi các công thức

Các công thức này có thể thu được bằng cách sử dụng khái niệm mômen đầu và mômen trung tâm.

Luật phân phối nhị thức làm cơ sở cho nhiều tình huống thực tế. Tại giá trị lớn N phân phối nhị thức có thể được xấp xỉ bởi các phân phối khác, đặc biệt là phân phối Poisson.

Phân phối Poisson

Để đó đi N Thử nghiệm Bernoulli, với số lượng thử nghiệm Nđủ lớn. Trước đây, người ta đã chỉ ra rằng trong trường hợp này (nếu, ngoài ra, xác suất R sự phát triển NHƯNG rất nhỏ) để tìm xác suất mà một sự kiện NHƯNG xuất hiện t một lần trong các bài kiểm tra, bạn có thể sử dụng công thức Poisson (4.9). Nếu biến ngẫu nhiên X có nghĩa là số lần xuất hiện của sự kiện NHƯNG Trong N Thử nghiệm Bernoulli, sau đó xác suất X sẽ mang ý nghĩa k có thể được tính bằng công thức

, (7.2)

ở đâu λ = nr.

Luật phân phối Poissonđược gọi là phân phối của một biến ngẫu nhiên rời rạc X, trong đó các giá trị có thể là số nguyên không âm và xác suất p t các giá trị này được tìm thấy bằng công thức (7.2).

Giá trị λ = nr gọi là tham số Phân phối Poisson.

Một biến ngẫu nhiên được phân phối theo luật Poisson có thể nhận tập hợp vô hạn các giá trị. Vì đối với phân phối này, xác suất R sự xuất hiện của một sự kiện trong mỗi thử nghiệm là nhỏ, khi đó sự phân bố này đôi khi được gọi là quy luật của hiện tượng hiếm.

Dãy số phân phối của một biến ngẫu nhiên có phân phối theo định luật Poisson có dạng

X t
R

Dễ dàng xác minh rằng tổng xác suất của hàng thứ hai bằng 1. Để làm được điều này, chúng ta cần nhớ rằng hàm có thể được mở rộng trong một chuỗi Maclaurin, chuỗi này hội tụ cho bất kỳ X. TẠI trường hợp này chúng ta có

. (7.3)

Như đã lưu ý, luật Poisson trong một số trường hợp giới hạn nhất định sẽ thay thế luật nhị thức. Một ví dụ là một biến ngẫu nhiên X, các giá trị này bằng số lần hỏng hóc trong một thời gian nhất định khi sử dụng nhiều lần thiết bị kỹ thuật. Người ta cho rằng thiết bị này có độ tin cậy cao, tức là xác suất thất bại trong một ứng dụng là rất nhỏ.

Ngoài những trường hợp giới hạn như vậy, trong thực tế có những biến ngẫu nhiên được phân phối theo định luật Poisson, không liên quan đến phân phối nhị thức. Ví dụ, phân phối Poisson thường được sử dụng khi xử lý số lượng sự kiện xảy ra trong một khoảng thời gian (số lượng cuộc gọi đến tổng đài điện thoại trong giờ, số lượng xe đến rửa xe trong ngày, số lần dừng máy mỗi tuần, v.v.). Tất cả những sự kiện này phải tạo thành cái gọi là dòng sự kiện, là một trong những khái niệm cơ bản của lý thuyết xếp hàng. Tham số λ đặc trưng cho cường độ trung bình của dòng sự kiện.


Tất nhiên, khi tính toán hàm phân phối tích lũy, người ta nên sử dụng mối quan hệ đã đề cập giữa phân phối nhị thức và beta. Phương pháp này chắc chắn tốt hơn tính tổng trực tiếp khi n> 10.

Trong các sách giáo khoa cổ điển về thống kê, để có được các giá trị của phân phối nhị thức, người ta thường sử dụng các công thức dựa trên các định lý giới hạn (chẳng hạn như công thức Moivre-Laplace). Cần lưu ý rằng từ quan điểm tính toán thuần túy giá trị của các định lý này gần bằng 0, đặc biệt là bây giờ, khi hầu hết các bảng đều có một máy tính mạnh. Nhược điểm chính của các phép gần đúng trên là độ chính xác hoàn toàn không đủ của chúng đối với các giá trị của n điển hình cho hầu hết các ứng dụng. Một nhược điểm không kém là không có bất kỳ khuyến nghị rõ ràng nào về khả năng áp dụng của một hoặc một cách gần đúng khác (chỉ các công thức tiệm cận được đưa ra trong các văn bản tiêu chuẩn, chúng không đi kèm với các ước lượng chính xác và do đó, ít được sử dụng). Tôi sẽ nói rằng cả hai công thức chỉ hợp lệ cho n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Ở đây tôi không xem xét vấn đề tìm các lượng tử: đối với các phân bố rời rạc, điều đó là nhỏ nhặt, và trong những vấn đề mà các phân bố đó phát sinh, thì nó, như một quy luật, không có liên quan. Nếu vẫn cần các lượng tử, tôi khuyên bạn nên định dạng lại vấn đề theo cách làm việc với các giá trị p (ý nghĩa quan sát được). Đây là một ví dụ: khi thực hiện một số thuật toán liệt kê, ở mỗi bước, nó được yêu cầu kiểm tra giả thuyết thống kê về một biến ngẫu nhiên nhị thức. Dựa theo cách tiếp cận cổ điểnở mỗi bước, cần tính toán thống kê tiêu chí và so sánh giá trị của nó với ranh giới của tập hợp tới hạn. Tuy nhiên, vì thuật toán là kiểu liệt kê, nên cần phải xác định ranh giới của tập tới hạn mỗi lần một lần (xét cho cùng, kích thước mẫu thay đổi từ bước này sang bước khác), điều này làm tăng chi phí thời gian một cách không hiệu quả. Cách tiếp cận hiện đại khuyến nghị tính toán ý nghĩa quan sát được và so sánh nó với mức độ tự tin, tiết kiệm cho việc tìm kiếm lượng tử.

Do đó, các mã sau đây không tính hàm nghịch đảo, thay vào đó, hàm rev_binomialDF được cung cấp, tính xác suất thành công p trong một thử nghiệm đơn lẻ với số lần thử n, số m thành công trong đó và giá trị y xác suất nhận được m thành công này. Điều này sử dụng mối quan hệ đã nói ở trên giữa phân phối nhị thức và beta.

Trên thực tế, chức năng này cho phép bạn nhận được ranh giới của các khoảng tin cậy. Thật vậy, giả sử chúng ta nhận được m thành công trong n phép thử nhị thức. Như bạn đã biết, đường viền bên trái của hai mặt khoảng tin cậyđối với tham số p với mức độ tin cậy là 0 nếu m = 0 và for là nghiệm của phương trình . Tương tự, giới hạn bên phải là 1 nếu m = n, và for là một nghiệm của phương trình . Điều này ngụ ý rằng để tìm ranh giới bên trái, chúng ta phải giải phương trình và để tìm kiếm đúng - phương trình . Chúng được giải quyết trong các hàm binom_leftCI và binom_rightCI, trả về giới hạn trên và giới hạn dưới của khoảng tin cậy hai phía, tương ứng.

Tôi muốn lưu ý rằng nếu không cần độ chính xác tuyệt đối đáng kinh ngạc, thì đối với n đủ lớn, bạn có thể sử dụng ước lượng gần đúng sau [B.L. van der Waerden, Thống kê toán học. M: IL, 1960, Ch. 2 giây. 7]: , trong đó g là lượng tử phân phối bình thường. Giá trị của phép gần đúng này là có những phép gần đúng rất đơn giản cho phép bạn tính các lượng tử của phân phối chuẩn (xem văn bản về cách tính phân phối chuẩn và phần tương ứng của tài liệu tham khảo này). Trong thực tế của tôi (chủ yếu cho n> 100), xấp xỉ này cho khoảng 3-4 chữ số, theo quy luật, là khá đủ.

Các phép tính với các mã sau đây yêu cầu các tệp betaDF.h, betaDF.cpp (xem phần về phân phối beta), cũng như logGamma.h, logGamma.cpp (xem phụ lục A). Bạn cũng có thể xem một ví dụ về việc sử dụng các hàm.

tệp binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF (thử nghiệm kép, thành công kép, p kép); / * * Hãy để có "thử nghiệm" của các quan sát độc lập * với xác suất "p" thành công trong mỗi lần. * Tính xác suất B (thành công | thử nghiệm, p) mà số * thành công nằm trong khoảng từ 0 đến "thành công" (bao gồm cả). * / double rev_binomialDF (thử nghiệm kép, thành công kép, y kép); / * * Hãy biết xác suất y của ít nhất m thành công * trong các thử nghiệm của sơ đồ Bernoulli. Hàm tìm xác suất thành công p * trong một lần thử duy nhất. * * Quan hệ sau được sử dụng trong các phép tính * * 1 - p = rev_Beta (lần thử-thành công | thành công + 1, y). * / double binom_leftCI (thử nghiệm kép, thành công kép, cấp độ kép); / * Giả sử có "thử nghiệm" các quan sát độc lập * với xác suất thành công là "p" trong mỗi * và số lần thành công là "thành công". * Giới hạn bên trái của khoảng tin cậy hai phía * được tính với mức ý nghĩa. * / double binom_rightCI (gấp đôi n, gấp đôi thành công, mức gấp đôi); / * Giả sử có "thử nghiệm" các quan sát độc lập * với xác suất thành công là "p" trong mỗi * và số lần thành công là "thành công". * Giới hạn bên phải của khoảng tin cậy hai phía * được tính với mức ý nghĩa. * / #endif / * Kết thúc #ifndef __BINOMIAL_H__ * /

tệp binomialDF.cpp

/ ************************************************* **** ********** / / * Phân phối nhị thức * / / **************************** **** *************************** / #include #bao gồm #include "betaDF.h" NHẬP nhị thức képDF (double n, double m, double p) / * * Để có "n" quan sát độc lập * với xác suất "p" thành công trong mỗi quan sát. * Tính xác suất B (m | n, p) để số lần thành công là * trong khoảng từ 0 đến "m" (bao gồm cả), tức là * tổng các xác suất của nhị thức từ 0 đến m: * * m * - (n) j n-j *> () p (1-p) * - (j) * j = 0 * * Các phép tính không ngụ ý tính tổng câm - * được sử dụng theo mối quan hệ sau với phân phối beta trung tâm: * * B (m | n, p) = Beta (1-p | n-m, m + 1). * * Các đối số phải là số dương, bằng 0<= p <= 1. */ { assert((n >0) && (p> = 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) trả về 1; khác trả về BetaDF (n-m, m + 1) .value (1-p); ) / * binomialDF * / ENTRY double rev_binomialDF (double n, double m, double y) / * * Cho xác suất y của ít nhất m thành công * được biết trong n phép thử của lược đồ Bernoulli. Hàm tìm xác suất thành công p * trong một lần thử duy nhất. * * Quan hệ sau được sử dụng trong các phép tính * * 1 - p = rev_Beta (y | n-m, m + 1). * / (khẳng định ((n> 0) && (m> = 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m> = 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m> = 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Các phân phối xác suất của các biến ngẫu nhiên rời rạc. Phân phối nhị thức. Phân phối Poisson. Phân bố hình học. ham sinh.

6. Phân phối xác suất của các biến ngẫu nhiên rời rạc

6.1. Phân phối nhị thức

Hãy để nó được sản xuất N các thử nghiệm độc lập, trong mỗi thử nghiệm có một sự kiện Một có thể xuất hiện hoặc không. Xác suất P sự kiện xảy ra Một trong tất cả các bài kiểm tra là không đổi và không thay đổi từ bài kiểm tra này sang bài kiểm tra khác. Coi như một biến ngẫu nhiên X số lần xuất hiện của sự kiện Một trong các thử nghiệm này. Công thức tìm xác suất của một sự kiện xảy ra Một trơn tru k một lần N các thử nghiệm, như đã biết, được mô tả Công thức Bernoulli

Phân phối xác suất được xác định bởi công thức Bernoulli được gọi là nhị thức .

Định luật này được gọi là "nhị thức" bởi vì vế phải có thể được coi là một thuật ngữ phổ biến trong khai triển của nhị thức Newton

Ta viết luật nhị thức dưới dạng bảng

P N

np N –1 q

q N

Hãy để chúng tôi tìm các đặc điểm số của phân phối này.

Theo định nghĩa của kỳ vọng toán học đối với DSW, chúng ta có

.

Hãy để chúng tôi viết ra bằng nhau, đó là thùng Newton

.

và phân biệt nó đối với p. Kết quả là, chúng tôi nhận được

.

Nhân bên trái và bên phải trên P:

.

Cho rằng P+ q= 1, chúng tôi có

(6.2)

Vì thế, kỳ vọng toán học về số lần xuất hiện của các sự kiện trongNcác thử nghiệm độc lập bằng tích số của số thử nghiệmNvề xác suấtPsự xuất hiện của một sự kiện trong mỗi thử nghiệm.

Chúng tôi tính toán độ phân tán theo công thức

.

Đối với điều này, chúng tôi tìm thấy

.

Đầu tiên, chúng tôi phân biệt công thức nhị thức Newton hai lần đối với P:

và nhân cả hai vế của phương trình với P 2:

Do đó,

Vì vậy, phương sai của phân phối nhị thức là

. (6.3)

Những kết quả này cũng có thể thu được từ lý luận định tính thuần túy. Tổng số X lần xuất hiện của sự kiện A trong tất cả các thử nghiệm được cộng vào số lần xuất hiện của sự kiện trong các thử nghiệm riêng lẻ. Do đó, nếu X 1 là số lần xuất hiện của sự kiện trong thử nghiệm đầu tiên, X 2 trong thử nghiệm thứ hai, v.v., thì Tổng số sự xuất hiện của sự kiện A trong tất cả các thử nghiệm bằng X = X 1 + X 2 +… + X N. Theo tính chất của kỳ vọng toán học:

Mỗi số hạng ở phía bên phải của đẳng thức là kỳ vọng toán học của số lượng sự kiện trong một phép thử, bằng với xác suất của sự kiện đó. Bằng cách này,

Theo tính chất phân tán:

Kể từ, và kỳ vọng toán học của một biến ngẫu nhiên , chỉ có thể nhận hai giá trị, cụ thể là 1 2 với xác suất P và 0 2 với xác suất q, sau đó
. Bằng cách này,
Kết quả là, chúng tôi nhận được

Sử dụng khái niệm về thời điểm ban đầu và thời điểm trung tâm, người ta có thể thu được các công thức về độ lệch và độ lệch:

. (6.4)

Cơm. 6.1

Đa giác của phân phối nhị thức có dạng sau (xem Hình 6.1). Xác suất P N (k) đầu tiên tăng khi tăng k, đạt giá trị lớn nhất và sau đó bắt đầu giảm. Phân phối nhị thức bị lệch ngoại trừ trường hợp P= 0,5. Lưu ý rằng khi số lượng lớn bài kiểm tra N phân phối nhị thức là rất gần với bình thường. (Sự biện minh cho mệnh đề này có liên quan đến định lý Moivre-Laplace cục bộ.)

Con sốm 0 sự xuất hiện của một sự kiện được gọi làrất có thể , nếu xác suất của sự kiện xảy ra một số lần nhất định trong chuỗi thử nghiệm này là lớn nhất (tối đa trong đa giác phân phối). Đối với phân phối nhị thức

Bình luận. Sự bất bình đẳng này có thể được chứng minh bằng cách sử dụng công thức lặp lạiđối với xác suất nhị thức:

(6.6)

Ví dụ 6.1. Tỷ trọng sản phẩm cao cấp tại doanh nghiệp này là 31%. Giá trị trung bình và phương sai, cũng là số lượng mặt hàng cao cấp có khả năng xảy ra nhất trong một lô 75 mặt hàng được chọn ngẫu nhiên là bao nhiêu?

Dung dịch. P=0,31, q=0,69, N= 75 thì

M [ X] = np= 750,31 = 23,25; D [ X] = npq = 750,310,69 = 16,04.

Để tìm con số có khả năng xảy ra nhất m 0, chúng tôi tạo ra một bất đẳng thức kép

Do đó nó theo sau đó m 0 = 23.