Tiểu sử Đặc điểm Phân tích

Nhị thức phân phối. Phân phối xác suất của các biến ngẫu nhiên rời rạc

Lý thuyết xác suất hiện hữu một cách vô hình trong cuộc sống của chúng ta. Chúng ta không chú ý đến nó, nhưng mọi sự kiện trong cuộc sống của chúng ta đều có xác suất này hoặc xác suất khác. Chú ý đến số lượng lớn các tình huống, chúng tôi trở nên cần thiết để xác định khả năng xảy ra cao nhất và ít khả năng xảy ra nhất trong số đó. Nó là thuận tiện nhất để phân tích dữ liệu xác suất như vậy bằng đồ thị. Phân phối có thể giúp chúng tôi với điều này. Nhị thức là một trong những cách dễ nhất và chính xác nhất.

Trước khi chuyển thẳng sang toán học và lý thuyết xác suất, hãy tìm hiểu xem ai là người đầu tiên đưa ra loại phân phối này và lịch sử phát triển là gì bộ máy toán học cho khái niệm này.

Câu chuyện

Khái niệm xác suất đã được biết đến từ thời cổ đại. Tuy nhiên, các nhà toán học cổ đại không coi trọng nó và chỉ có khả năng đặt nền móng cho một lý thuyết mà sau này trở thành lý thuyết xác suất. Họ đã tạo ra một số phương pháp tổ hợp, điều này đã giúp ích rất nhiều cho những người sau này đã tạo ra và phát triển chính lý thuyết này.

Vào nửa sau của thế kỷ XVII, bắt đầu hình thành các khái niệm và phương pháp cơ bản của lý thuyết xác suất. Các định nghĩa về biến ngẫu nhiên đã được giới thiệu, các phương pháp tính xác suất của một số biến đơn giản và phức tạp độc lập và sự kiện phụ thuộc. Mối quan tâm như vậy đối với các biến ngẫu nhiên và xác suất được quyết định bởi bài bạc: Mỗi người đều muốn biết cơ hội thắng trò chơi của mình là bao nhiêu.

Bước tiếp theo là việc áp dụng các phương pháp phân tích toán học trong lý thuyết xác suất. Các nhà toán học lỗi lạc như Laplace, Gauss, Poisson và Bernoulli đã nhận nhiệm vụ này. Chính họ là người đã nâng cao lĩnh vực toán học này lên cấp độ mới. Chính James Bernoulli là người đã khám phá ra luật phân phối nhị thức. Nhân tiện, như sau này chúng ta sẽ tìm hiểu, trên cơ sở của khám phá này, một số điều khác đã được thực hiện, giúp tạo ra luật phân phối chuẩn và nhiều luật khác.

Bây giờ, trước khi bắt đầu mô tả phân phối nhị thức, chúng ta sẽ làm mới một chút trong trí nhớ về các khái niệm của lý thuyết xác suất, có lẽ đã bị lãng quên từ khi còn ngồi trên ghế nhà trường.

Các nguyên tắc cơ bản của lý thuyết xác suất

Chúng tôi sẽ xem xét các hệ thống như vậy, vì chỉ có hai kết quả có thể xảy ra: "thành công" và "thất bại". Điều này rất dễ hiểu với một ví dụ: chúng ta tung một đồng xu, đoán rằng các mặt sấp sẽ rơi ra. Xác suất của mỗi sự kiện có thể xảy ra (sấp sấp - "thành công", ngã ngửa - "không thành công") bằng 50 phần trăm nếu đồng xu cân bằng hoàn hảo và không có yếu tố nào khác có thể ảnh hưởng đến thử nghiệm.

Đó là sự kiện đơn giản nhất. Nhưng cũng có hệ thống phức tạp, trong đó các hành động tuần tự được thực hiện và xác suất của kết quả của các hành động này sẽ khác nhau. Ví dụ, hãy xem xét hệ thống sau: trong một hộp mà chúng ta không thể nhìn thấy bên trong, có sáu quả bóng hoàn toàn giống nhau, ba cặp màu xanh lam, đỏ và những bông hoa trắng. Chúng ta phải lấy ngẫu nhiên một vài quả bóng. Theo đó, bằng cách rút ra một trong các quả bóng màu trắng trước, chúng ta sẽ giảm được vài lần xác suất để người tiếp theo chúng ta cũng nhận được một quả bóng màu trắng. Điều này xảy ra do số lượng đối tượng trong hệ thống thay đổi.

TẠI phần tiếp theo xem xét phức tạp hơn khái niệm toán học, đưa chúng ta đến gần với những gì các từ " phân phối bình thường"," phân phối nhị thức "và tương tự.

Các yếu tố của thống kê toán học

Trong thống kê, một trong những lĩnh vực ứng dụng của lý thuyết xác suất, có rất nhiều ví dụ mà dữ liệu để phân tích không được đưa ra một cách rõ ràng. Có nghĩa là, không phải ở số lượng, mà ở dạng phân chia theo đặc điểm, ví dụ, theo giới tính. Để áp dụng công cụ toán học vào dữ liệu đó và rút ra một số kết luận từ kết quả thu được, cần phải chuyển đổi dữ liệu ban đầu thành định dạng số. Theo quy tắc, để thực hiện điều này, kết quả dương tính được gán giá trị 1 và kết quả tiêu cực được gán giá trị 0. Do đó, chúng tôi thu được dữ liệu thống kê có thể được phân tích bằng phương pháp toán học.

Bước tiếp theo để hiểu phân phối nhị thức của một biến ngẫu nhiên là gì là xác định phương sai của biến ngẫu nhiên và kỳ vọng toán học. Chúng ta sẽ nói về điều này trong phần tiếp theo.

Gia trị được ki vọng

Trên thực tế, hiểu kỳ vọng toán học là gì không khó. Hãy xem xét một hệ thống trong đó có nhiều các sự kiện khác nhau với họ xác suất khác nhau. Kỳ vọng toán học sẽ được gọi là giá trị, bằng tổng sản phẩm của các giá trị của những sự kiện này (và dạng toán học, mà chúng ta đã thảo luận trong phần trước) về xác suất thực hiện của chúng.

Kỳ vọng toán học của phân phối nhị thức được tính theo cùng một sơ đồ: chúng tôi lấy giá trị của một biến ngẫu nhiên, nhân nó với xác suất của một kết quả dương, rồi tổng hợp dữ liệu thu được cho tất cả các biến. Rất thuận tiện để trình bày các dữ liệu này bằng đồ thị - theo cách này, sự khác biệt giữa các kỳ vọng toán học của các giá trị khác nhau được nhận biết tốt hơn.

Trong phần tiếp theo, chúng tôi sẽ cho bạn biết một chút về một khái niệm khác - phương sai của một biến ngẫu nhiên. Nó cũng liên quan chặt chẽ đến một khái niệm như phân phối xác suất nhị thức, và là đặc trưng của nó.

Phương sai phân phối nhị thức

Giá trị này có liên quan chặt chẽ với giá trị trước đó và cũng đặc trưng cho sự phân bố của dữ liệu thống kê. Cô ấy đại diện hình vuông ở giữađộ lệch của các giá trị so với kỳ vọng toán học của họ. Có nghĩa là, phương sai của một biến ngẫu nhiên là tổng bình phương chênh lệch giữa giá trị của một biến ngẫu nhiên và kỳ vọng toán học của nó, nhân với xác suất của sự kiện này.

Nói chung, đây là tất cả những gì chúng ta cần biết về phương sai để hiểu phân phối xác suất nhị thức là gì. Bây giờ chúng ta hãy chuyển sang chủ đề chính của chúng ta. Cụ thể, những gì ẩn sau điều này dường như đủ cụm từ phức tạp"luật phân phối nhị thức".

Phân phối nhị thức

Đầu tiên chúng ta hãy hiểu tại sao phân phối này là nhị thức. Nó bắt nguồn từ từ "binom". Bạn có thể đã nghe nói về nhị thức Newton - một công thức có thể được sử dụng để mở rộng tổng của bất kỳ hai số a và b thành bất kỳ lũy thừa không âm nào của n.

Như bạn có thể đã đoán, công thức nhị thức Newton và công thức phân phối nhị thức gần như là công thức giống nhau. Với ngoại lệ duy nhất mà thứ hai có giá trị áp dụngsố lượng cụ thể, và công cụ đầu tiên chỉ là một công cụ toán học chung, các ứng dụng của chúng trong thực tế có thể khác nhau.

Công thức phân phối

Hàm phân phối nhị thức có thể được viết dưới dạng tổng của các số hạng sau:

(n! / (n-k)! k!) * p k * q n-k

Ở đây n là số thử nghiệm ngẫu nhiên độc lập, p là số kết quả thành công, q là số kết quả không thành công, k là số thử nghiệm (nó có thể nhận các giá trị từ 0 đến n),! - chỉ định của một giai thừa, một hàm của một số, giá trị của nó bằng tích của tất cả các số đi lên nó (ví dụ: đối với số 4: 4! = 1 * 2 * 3 * 4 = 24).

Ngoài ra, hàm phân phối nhị thức có thể được viết dưới dạng một hàm beta không đầy đủ. Tuy nhiên, đây đã là một định nghĩa phức tạp hơn, chỉ được sử dụng khi giải các bài toán thống kê phức tạp.

Phân phối nhị thức, các ví dụ mà chúng tôi đã kiểm tra ở trên, là một trong những ví dụ loài đơn giản các phân phối trong lý thuyết xác suất. Ngoài ra còn có một phân phối chuẩn, là một loại phân phối nhị thức. Nó được sử dụng phổ biến nhất và dễ tính toán nhất. Ngoài ra còn có phân phối Bernoulli, phân phối Poisson, phân phối có điều kiện. Tất cả chúng đều mô tả bằng đồ thị các vùng xác suất của một quá trình cụ thể trong các điều kiện khác nhau.

Trong phần tiếp theo, chúng ta sẽ xem xét các khía cạnh liên quan đến ứng dụng của bộ máy toán học này trong đời thực. Thoạt nhìn, tất nhiên, có vẻ như đây là một thứ toán học khác, như thường lệ, không tìm thấy ứng dụng trong cuộc sống thực, và nói chung là không cần thiết cho bất kỳ ai ngoại trừ chính các nhà toán học. Tuy nhiên, đây không phải là trường hợp. Rốt cuộc, tất cả các loại phân phối và biểu diễn đồ họađược tạo ra dành riêng cho mục tiêu thiết thực, và không phải là ý thích của các nhà khoa học.

Đăng kí

Cho đến nay, ứng dụng quan trọng nhất của phân phối được tìm thấy trong thống kê, bởi vì nó yêu cầu phân tích phức tạp nhiều dữ liệu. Như thực tế cho thấy, rất nhiều mảng dữ liệu có các phân phối giá trị xấp xỉ giống nhau: các vùng quan trọng của các giá trị rất thấp và rất cao, theo quy luật, chứa ít phần tử hơn các giá trị trung bình.

Phân tích các mảng dữ liệu lớn không chỉ được yêu cầu trong thống kê. Nó không thể thiếu, ví dụ, trong hóa lý. Trong khoa học này, nó được sử dụng để xác định nhiều đại lượng có liên quan đến các dao động và chuyển động ngẫu nhiên của các nguyên tử và phân tử.

Trong phần tiếp theo, chúng ta sẽ thảo luận về tầm quan trọng của việc sử dụng khái niệm thống kê, như một nhị thức phân phối của một biến ngẫu nhiên trong Cuộc sống hàng ngày cho bạn và tôi.

Tại sao tôi cần nó?

Nhiều người tự hỏi mình câu hỏi này khi nói đến toán học. Và nhân tiện, toán học không được gọi là nữ hoàng của các ngành khoa học một cách vô ích. Nó là cơ sở của vật lý, hóa học, sinh học, kinh tế học, và trong mỗi ngành khoa học này, một số loại phân phối cũng được sử dụng: cho dù đó là phân phối nhị thức rời rạc hay bình thường, nó không quan trọng. Và nếu chúng ta quan sát kỹ hơn thế giới xung quanh, chúng ta sẽ thấy rằng toán học được ứng dụng ở khắp mọi nơi: trong cuộc sống hàng ngày, trong công việc và thậm chí quan hệ con người có thể được trình bày dưới dạng dữ liệu thống kê và được phân tích (nhân tiện, điều này được thực hiện bởi những người làm việc trong tổ chức đặc biệt thu thập thông tin).

Bây giờ chúng ta hãy nói một chút về những việc cần làm nếu bạn cần biết nhiều hơn về chủ đề này ngoài những gì chúng tôi đã nêu trong bài viết này.

Thông tin mà chúng tôi đưa ra trong bài viết này còn lâu mới đầy đủ. Có nhiều sắc thái về hình thức phân phối có thể diễn ra. Phân phối nhị thức, như chúng ta đã tìm hiểu, là một trong những kiểu chính mà toàn bộ thống kê toán học và lý thuyết xác suất.

Nếu bạn trở nên quan tâm, hoặc liên quan đến công việc của bạn, bạn cần biết nhiều hơn về chủ đề này, bạn sẽ cần phải nghiên cứu văn học chuyên ngành. Bắt đầu với một khóa học đại học phân tích toán học và đến phần lý thuyết xác suất. Ngoài ra, kiến ​​thức trong lĩnh vực chuỗi số cũng sẽ hữu ích, bởi vì phân phối xác suất nhị thức không hơn gì một chuỗi các số hạng liên tiếp.

Sự kết luận

Trước khi kết thúc bài viết, chúng tôi xin bật mí thêm với các bạn một điều thú vị. Nó liên quan trực tiếp đến chủ đề của bài báo của chúng tôi và tất cả toán học nói chung.

Nhiều người nói rằng toán học là một môn khoa học vô dụng, và không có gì họ học được ở trường là hữu ích cho họ. Nhưng kiến ​​thức không bao giờ là thừa, và nếu điều gì đó không hữu ích đối với bạn trong cuộc sống, điều đó có nghĩa là bạn chỉ đơn giản là không nhớ nó. Nếu bạn có kiến ​​thức, họ có thể giúp bạn, nhưng nếu bạn không có họ, thì bạn không thể mong đợi sự giúp đỡ từ họ.

Vì vậy, chúng tôi đã xem xét khái niệm phân phối nhị thức và tất cả các định nghĩa liên quan đến nó và nói về cách nó được áp dụng trong cuộc sống của chúng ta.

Xem xét phân phối Nhị thức, tính kỳ vọng toán học, phương sai, chế độ của nó. Sử dụng hàm MS EXCEL BINOM.DIST (), chúng ta sẽ vẽ đồ thị hàm phân phối và đồ thị mật độ xác suất. Hãy để chúng tôi ước tính tham số phân phối p, kỳ vọng toán học của phân phối và độ lệch chuẩn. Cũng xem xét phân phối Bernoulli.

Sự định nghĩa. Hãy để chúng được giữ N thử nghiệm, trong mỗi thử nghiệm chỉ có 2 sự kiện có thể xảy ra: sự kiện "thành công" với một xác suất P hoặc sự kiện "thất bại" với xác suất q = 1-p (cái gọi là Đề án Bernoulli,Bernoullithử nghiệm).

Xác suất nhận được chính xác x thành công trong những N các bài kiểm tra tương đương với:

Số lần thành công trong mẫu x là một biến ngẫu nhiên có Phân phối nhị thức(Tiếng Anh) Nhị thứcphân bổ) PN là các tham số của phân phối này.

Nhớ lại điều đó để áp dụng Đề án Bernoulli và tương ứng phân phối nhị thức, các điều kiện sau phải được đáp ứng:

  • mỗi thử nghiệm phải có đúng hai kết quả, có điều kiện gọi là "thành công" và "thất bại".
  • kết quả của mỗi thử nghiệm không được phụ thuộc vào kết quả của các thử nghiệm trước đó (tính độc lập của thử nghiệm).
  • tỉ lệ thành công P nên không đổi cho tất cả các thử nghiệm.

Phân phối nhị thức trong MS EXCEL

Trong MS EXCEL, bắt đầu từ phiên bản 2010, cho Phân phối nhị thức có một hàm BINOM.DIST (), tên tiêng Anh- BINOM.DIST (), cho phép bạn tính xác suất mẫu sẽ chính xác X"thành công" (tức là hàm mật độ xác suất p (x), xem công thức ở trên), và hàm phân phối tích phân(xác suất rằng mẫu sẽ có x hoặc ít hơn "thành công", bao gồm cả 0).

Trước MS EXCEL 2010, EXCEL có hàm BINOMDIST (), cũng cho phép bạn tính toán Chức năng phân phốimật độ xác suất p (x). BINOMDIST () được để lại trong MS EXCEL 2010 để tương thích.

Tệp ví dụ chứa đồ thị mật độ phân phối xác suất.

Phân phối nhị thức có chỉ định B(N; P) .

Ghi chú: Đối với tòa nhà hàm phân phối tích phân loại biểu đồ phù hợp hoàn hảo Lịch trình, vì mật độ phân phốiBiểu đồ có phân nhóm. Để biết thêm thông tin về cách xây dựng biểu đồ, hãy đọc bài viết Các loại biểu đồ chính.

Ghi chú: Để thuận tiện cho việc viết công thức trong tệp ví dụ, Tên cho các tham số đã được tạo Phân phối nhị thức: n và p.

Tệp ví dụ hiển thị các phép tính xác suất khác nhau bằng cách sử dụng các hàm MS EXCEL:

Như đã thấy trong hình trên, người ta giả định rằng:

  • Tập hợp vô hạn mà từ đó mẫu được tạo ra chứa 10% (hoặc 0,1) phần tử tốt (tham số P, đối số hàm thứ ba = BINOM.DIST ())
  • Để tính xác suất trong một mẫu có 10 phần tử (tham số N, đối số thứ hai của hàm) sẽ có đúng 5 phần tử hợp lệ (đối số thứ nhất), bạn cần viết công thức: = BINOM.DIST (5, 10, 0,1, FALSE)
  • Phần tử cuối cùng, thứ tư được đặt = FALSE, tức là giá trị hàm được trả về mật độ phân phối.

Nếu giá trị của đối số thứ tư = TRUE, thì hàm BINOM.DIST () trả về giá trị hàm phân phối tích phân hoặc đơn giản Chức năng phân phối. Trong trường hợp này, chúng ta có thể tính xác suất để số phần tử tốt trong mẫu sẽ là phạm vi nhất định, ví dụ: 2 hoặc ít hơn (bao gồm cả 0).

Để làm điều này, bạn cần viết công thức:
= BINOM.DIST (2, 10, 0,1, TRUE)

Ghi chú: Với giá trị không nguyên của x,. Ví dụ: các công thức sau sẽ trả về cùng một giá trị:
= BINOM.DIST ( 2 ; mười; 0,1; THẬT)
= BINOM.DIST ( 2,9 ; mười; 0,1; THẬT)

Ghi chú: Trong tệp ví dụ mật độ xác suấtChức năng phân phối cũng được tính bằng cách sử dụng định nghĩa và hàm COMBIN ().

Các chỉ số phân phối

TẠI tập tin ví dụ trên trang tính Ví dụ có các công thức tính toán một số chỉ tiêu phân phối:

  • = n * p;
  • (độ lệch chuẩn bình phương) = n * p * (1-p);
  • = (n + 1) * p;
  • = (1-2 * p) * ROOT (n * p * (1-p)).

Chúng tôi rút ra công thức kỳ vọng toán học Phân phối nhị thức sử dụng Đề án Bernoulli.

Theo định nghĩa giá trị ngẫu nhiên X trong Đề án Bernoulli(Biến ngẫu nhiên Bernoulli) có Chức năng phân phối:

Phân phối này được gọi là Phân phối Bernoulli.

Ghi chú: Phân phối Bernoullitrương hợp đặc biệt Phân phối nhị thức với tham số n = 1.

Hãy tạo ra 3 mảng gồm 100 số với các xác suất thành công khác nhau: 0,1; 0,5 và 0,9. Để làm điều này, trong cửa sổ Thế hệ Số ngẫu nhiên bộ các thông số sau với mỗi xác suất p:

Ghi chú: Nếu bạn đặt tùy chọn Phân tán ngẫu nhiên (Hạt giống ngẫu nhiên), sau đó bạn có thể chọn một tập hợp ngẫu nhiên số được tạo. Ví dụ: bằng cách đặt tùy chọn này = 25, bạn có thể tạo các bộ số ngẫu nhiên giống nhau trên các máy tính khác nhau (tất nhiên nếu các tham số phân phối khác giống nhau). Giá trị tùy chọn có thể nhận các giá trị nguyên từ 1 đến 32,767. Tên tùy chọn Phân tán ngẫu nhiên có thể nhầm lẫn. Sẽ tốt hơn nếu dịch nó thành Đặt số với các số ngẫu nhiên.

Kết quả là chúng ta sẽ có 3 cột gồm 100 số, dựa vào đó, chẳng hạn, chúng ta có thể ước lượng xác suất thành công P theo công thức: Số lần thành công / 100(cm. trang tệp ví dụ Tạo Bernoulli).

Ghi chú: Vì Bản phân phối Bernoulli với p = 0,5, bạn có thể sử dụng công thức = RANDBETWEEN (0; 1), tương ứng với.

Sinh số ngẫu nhiên. Phân phối nhị thức

Giả sử có 7 mặt hàng bị lỗi trong mẫu. Điều này có nghĩa là "rất có thể" tỷ lệ sản phẩm bị lỗi đã thay đổi. P, đó là một đặc điểm của quy trình sản xuất của chúng tôi. Mặc dù tình huống này là "rất có thể xảy ra", nhưng có khả năng xảy ra (rủi ro alpha, lỗi loại 1, "báo động sai") P không thay đổi, và số lượng sản phẩm bị lỗi tăng lên là do lấy mẫu ngẫu nhiên.

Như có thể thấy trong hình dưới đây, 7 là số sản phẩm bị lỗi có thể chấp nhận được cho một quá trình với p = 0,21 ở cùng một giá trị Alpha. Điều này minh họa rằng khi vượt quá ngưỡng các mặt hàng bị lỗi trong một mẫu, P"Có thể" tăng lên. Cụm từ "nhiều khả năng" có nghĩa là chỉ có 10% cơ hội (100% -90%) rằng độ lệch của tỷ lệ phần trăm sản phẩm bị lỗi trên ngưỡng chỉ là do các nguyên nhân ngẫu nhiên.

Do đó, vượt quá ngưỡng số lượng sản phẩm bị lỗi trong mẫu có thể coi là một tín hiệu cho thấy quá trình đã trở nên khó khăn và bắt đầu tạo ra b Về tỷ lệ sản phẩm bị lỗi cao hơn.

Ghi chú: Trước MS EXCEL 2010, EXCEL có một hàm CRITBINOM (), tương đương với BINOM.INV (). CRITBINOM () được để lại trong MS EXCEL 2010 trở lên để tương thích.

Mối quan hệ của phân phối Nhị thức với các phân phối khác

Nếu tham số N Phân phối nhị thức có xu hướng vô cùng và P có xu hướng về 0, thì trong trường hợp này Phân phối nhị thức có thể được gần đúng.
Có thể hình thành các điều kiện khi tính gần đúng Phân phối Poisson hoạt động tốt:

  • P<0,1 (ít P và nhiều hơn nữa N, ước tính càng chính xác);
  • P>0,9 (xem xét điều đó q=1- P, các phép tính trong trường hợp này phải được thực hiện bằng cách sử dụng q(một X cần được thay thế bằng N- x). Do đó, càng ít q và nhiều hơn nữa N, gần đúng càng chính xác).

Tại 0,1<=p<=0,9 и n*p>10 Phân phối nhị thức có thể được gần đúng.

Đến lượt nó, Phân phối nhị thức có thể đóng vai trò là một phép gần đúng tốt khi quy mô dân số là N Phân phối siêu đo lớn hơn nhiều so với cỡ mẫu n (tức là N >> n hoặc n / N<<1).

Bạn có thể đọc thêm về mối quan hệ của các phân phối trên trong bài viết. Các ví dụ về tính gần đúng cũng được đưa ra ở đó, và các điều kiện được giải thích khi nào có thể và với độ chính xác.

LỜI KHUYÊN: Bạn có thể đọc về các bản phân phối khác của MS EXCEL trong bài viết.

Phân phối nhị thức là một trong những phân phối xác suất quan trọng nhất đối với một biến ngẫu nhiên thay đổi liên tục. Phân phối nhị thức là phân phối xác suất của một số m Sự kiện NHƯNG Trong N quan sát độc lập lẫn nhau. Thường là một sự kiện NHƯNGđược gọi là "thành công" của quan sát, và sự kiện ngược lại - "thất bại", nhưng sự chỉ định này rất có điều kiện.

Các điều khoản của phân phối nhị thức:

  • thực hiện tổng thể N thử nghiệm trong đó sự kiện NHƯNG có thể xảy ra hoặc không;
  • Sự kiện NHƯNG trong mỗi thử nghiệm có thể xảy ra với cùng một xác suất P;
  • các bài kiểm tra độc lập lẫn nhau.

Xác suất mà trong N sự kiện thử nghiệm NHƯNG một cách chính xác m thời gian, có thể được tính bằng công thức Bernoulli:

,

ở đâu P- xác suất của sự kiện xảy ra NHƯNG;

q = 1 - P là xác suất xảy ra sự kiện ngược lại.

Hãy tìm ra nó tại sao phân phối nhị thức có liên quan đến công thức Bernoulli theo cách được mô tả ở trên . Sự kiện - số lần thành công tại N các bài kiểm tra được chia thành một số tùy chọn, mỗi tùy chọn sẽ đạt được thành công trong m thử nghiệm và thất bại - trong N - m các bài kiểm tra. Hãy xem xét một trong những lựa chọn sau - B1 . Theo quy tắc cộng xác suất, chúng ta nhân xác suất của các sự kiện ngược lại:

,

và nếu chúng ta biểu thị q = 1 - P, sau đó

.

Xác suất tương tự sẽ có bất kỳ lựa chọn nào khác trong đó m thành công và N - m những thất bại. Số lượng các lựa chọn như vậy bằng số cách mà nó có thể từ N kiểm tra nhận được m thành công.

Tổng các xác suất của tất cả m số sự kiện NHƯNG(các số từ 0 đến N) bằng một:

trong đó mỗi số hạng là một số hạng của nhị thức Newton. Do đó, phân phối đang xét được gọi là phân phối nhị thức.

Trong thực tế, thường phải tính toán xác suất "nhiều nhất là m thành công trong N kiểm tra "hoặc" ít nhất m thành công trong N Kiểm tra ". Đối với điều này, các công thức sau được sử dụng.

Hàm tích phân, đó là xác suất F(m) mà trong N sự kiện quan sát NHƯNG sẽ không đến nữa m Một lần, có thể được tính bằng công thức:

Đến lượt nó xác suất F(≥m) mà trong N sự kiện quan sát NHƯNGđến ít nhất m Một lần, được tính theo công thức:

Đôi khi, việc tính toán xác suất mà trong N sự kiện quan sát NHƯNG sẽ không đến nữa m lần, thông qua xác suất của sự kiện ngược lại:

.

Công thức nào sẽ sử dụng tùy thuộc vào công thức nào chứa ít thuật ngữ hơn.

Các đặc điểm của phân phối nhị thức được tính bằng các công thức sau .

Gia trị được ki vọng: .

sự phân tán:.

Độ lệch chuẩn: .

Phân phối nhị thức và tính toán trong MS Excel

Xác suất phân phối nhị thức P N ( m) và giá trị của hàm tích phân F(m) có thể được tính bằng hàm BINOM.DIST trong MS Excel. Cửa sổ cho phép tính tương ứng được hiển thị bên dưới (nhấp chuột trái để phóng to).


MS Excel yêu cầu bạn nhập dữ liệu sau:

  • số lần thành công;
  • số lần kiểm tra;
  • xác suất thành công;
  • tích phân - giá trị logic: 0 - nếu bạn cần tính xác suất P N ( m) và 1 - nếu xác suất F(m).

ví dụ 1 Người quản lý của công ty đã tổng hợp thông tin về số lượng máy ảnh đã bán được trong hơn 100 ngày qua. Bảng tóm tắt thông tin và tính toán xác suất mà một số lượng máy ảnh nhất định sẽ được bán mỗi ngày.

Ngày kết thúc với lợi nhuận nếu bán được 13 máy ảnh trở lên. Xác suất để ngày đó sẽ làm việc có lãi:

Xác suất để ngày đó sẽ được làm việc mà không có lợi nhuận:

Đặt xác suất để ngày đó kinh doanh có lãi là không đổi và bằng 0,61, và số máy ảnh bán được trong ngày không phụ thuộc vào ngày. Sau đó, bạn có thể sử dụng phân phối nhị thức, trong đó sự kiện NHƯNG- ngày sẽ được thực hiện với lợi nhuận, - không có lợi nhuận.

Xác suất để trong 6 ngày làm việc tất cả đều có lãi:

.

Chúng tôi nhận được kết quả tương tự bằng cách sử dụng hàm MS Excel BINOM.DIST (giá trị của giá trị tích phân là 0):

P 6 (6 ) = BINOM.DIST (6; 6; 0,61; 0) = 0,052.

Xác suất để trong 6 ngày, 4 ngày trở lên sẽ làm việc có lãi:

ở đâu ,

,

Sử dụng hàm BINOM.DIST trong MS Excel, chúng tôi tính xác suất trong 6 ngày không quá 3 ngày sẽ hoàn thành có lãi (giá trị của giá trị tích phân là 1):

P 6 (≤3 ) = BINOM.DIST (3, 6, 0,61, 1) = 0,435.

Xác suất để trong 6 ngày xử lý hết tất cả các khoản lỗ:

,

Chúng tôi tính toán chỉ số tương tự bằng cách sử dụng hàm MS Excel BINOM.DIST:

P 6 (0 ) = BINOM.DIST (0; 6; 0,61; 0) = 0,0035.

Tự giải quyết vấn đề và sau đó xem giải pháp

Ví dụ 2 Một lọ đựng 2 quả cầu màu trắng và 3 quả bóng màu đen. Một quả bóng được lấy ra khỏi bình, màu sắc được thiết lập và đặt lại. Nỗ lực được lặp lại 5 lần. Số lần xuất hiện bóng trắng là một biến ngẫu nhiên rời rạc X, phân phối theo luật nhị thức. Soạn luật phân phối của một biến ngẫu nhiên. Xác định chế độ, kỳ vọng toán học và phương sai.

Chúng tôi tiếp tục giải quyết vấn đề cùng nhau

Ví dụ 3 Từ dịch vụ chuyển phát nhanh đến các đối tượng N= 5 giao thông viên. Mỗi chuyển phát nhanh với một xác suất P= 0,3 là trễ đối với đối tượng không phụ thuộc vào các đối tượng khác. Biến ngẫu nhiên rời rạc X- số lượng người chuyển phát muộn. Xây dựng một chuỗi phân phối của biến ngẫu nhiên này. Tìm kỳ vọng toán học, phương sai, độ lệch chuẩn của nó. Tìm xác suất để có ít nhất hai giao thông viên đến trễ đối với các đối tượng.

Phân phối nhị thức

phân phối xác suất của số lần xuất hiện của một số sự kiện trong các thử nghiệm độc lập lặp lại. Nếu, đối với mỗi thử nghiệm, xác suất của một sự kiện xảy ra là R, và 0 ≤ P≤ 1, thì số μ lần xuất hiện của sự kiện này cho N các thử nghiệm độc lập, có một biến ngẫu nhiên nhận các giá trị m = 1, 2,.., N với xác suất

ở đâu q= 1 - P, một - hệ số nhị thức (do đó có tên là B. r.). Công thức trên đôi khi được gọi là công thức Bernoulli. Kỳ vọng toán học và phương sai của đại lượng μ, có B. R., bằng M(μ) = npD(μ) = npq, tương ứng. Lớn N, nhờ định lý Laplace (Xem định lý Laplace), B. r. gần với phân phối chuẩn (Xem Phân phối chuẩn), là phân phối được sử dụng trong thực tế. Nhỏ N nó là cần thiết để sử dụng các bảng B. r.

Lít: Bolshev L. N., Smirnov N. V., Các bảng thống kê toán học, M., 1965.


Bách khoa toàn thư Liên Xô vĩ đại. - M.: Bách khoa toàn thư Liên Xô. 1969-1978 .

Xem "Phân phối nhị thức" là gì trong các từ điển khác:

    Hàm xác suất ... Wikipedia

    - (phân phối nhị thức) Một phân phối cho phép bạn tính xác suất xuất hiện của bất kỳ sự kiện ngẫu nhiên nào thu được do quan sát một số sự kiện độc lập, nếu xác suất xuất hiện của các sự kiện cơ bản cấu thành của nó ... ... Từ điển kinh tế

    - (Phân phối Bernoulli) phân phối xác suất của số lần xuất hiện của một số sự kiện trong các thử nghiệm độc lập lặp lại, nếu xác suất xuất hiện của sự kiện này trong mỗi thử nghiệm bằng p (0 p 1). Chính xác, con số? có sự kiện này xảy ra ... ... Từ điển Bách khoa toàn thư lớn

    phân phối nhị thức- - Chuyên đề viễn thông, các khái niệm cơ bản Phân phối nhị thức EN ...

    - (Phân phối Bernoulli), phân phối xác suất của số lần xuất hiện của một số sự kiện trong các thử nghiệm độc lập lặp lại, nếu xác suất xuất hiện của sự kiện này trong mỗi thử nghiệm là p (0≤p≤1). Cụ thể, số μ lần xuất hiện của sự kiện này…… từ điển bách khoa

    phân phối nhị thức- 1,49. phân phối nhị thức Phân phối xác suất của một biến ngẫu nhiên rời rạc X, nhận bất kỳ giá trị nguyên nào từ 0 đến n, sao cho x = 0, 1, 2, ..., n và các tham số n = 1, 2, ... và 0< p < 1, где Источник … Sách tham khảo từ điển về thuật ngữ của tài liệu quy chuẩn và kỹ thuật

    Phân phối Bernoulli, phân phối xác suất của một biến ngẫu nhiên X, nhận các giá trị nguyên với xác suất tương ứng (hệ số nhị thức; p tham số B. R., được gọi là xác suất của một kết quả dương, nhận các giá trị ... Bách khoa toàn thư toán học

    - (Phân phối Bernoulli), phân phối xác suất của số lần xuất hiện của một sự kiện nhất định trong các thử nghiệm độc lập lặp lại, nếu xác suất xuất hiện của sự kiện này trong mỗi thử nghiệm là p (0<или = p < или = 1). Именно, число м появлений … Khoa học Tự nhiên. từ điển bách khoa

    Phân phối xác suất nhị thức- (phân phối nhị thức) Phân phối được quan sát trong trường hợp kết quả của mỗi thử nghiệm độc lập (quan sát thống kê) nhận một trong hai giá trị có thể có: chiến thắng hoặc thất bại, bao gồm hoặc loại trừ, cộng hoặc ... Từ điển Kinh tế và Toán học

    phân phối xác suất nhị thức- Phân phối được quan sát trong trường hợp kết quả của mỗi thí nghiệm độc lập (quan sát thống kê) nhận một trong hai giá trị có thể có: chiến thắng hoặc thất bại, bao gồm hoặc loại trừ, cộng hoặc trừ, 0 hoặc 1. Tức là ... ... Sổ tay phiên dịch kỹ thuật

Sách

  • Lý thuyết xác suất và thống kê toán học trong các vấn đề. Hơn 360 nhiệm vụ và bài tập, D. A. Borzykh. Sổ tay hướng dẫn được đề xuất bao gồm các nhiệm vụ có mức độ phức tạp khác nhau. Tuy nhiên, trọng tâm chính được đặt vào các nhiệm vụ có độ phức tạp trung bình. Điều này được thực hiện có chủ đích để khuyến khích học sinh…
  • Lý thuyết xác suất và thống kê toán học trong các vấn đề: Hơn 360 vấn đề và bài tập, Borzykh D. Sách hướng dẫn được đề xuất bao gồm các bài toán ở nhiều mức độ phức tạp khác nhau. Tuy nhiên, trọng tâm chính được đặt vào các nhiệm vụ có độ phức tạp trung bình. Điều này được thực hiện có chủ đích để khuyến khích học sinh…

Chương 7

Các quy luật cụ thể về phân phối của các biến ngẫu nhiên

Các dạng luật phân phối biến ngẫu nhiên rời rạc

Để một biến ngẫu nhiên rời rạc nhận các giá trị X 1 , X 2 , …, x n,…. Xác suất của các giá trị này có thể được tính bằng nhiều công thức khác nhau, ví dụ, sử dụng các định lý cơ bản của lý thuyết xác suất, công thức Bernoulli hoặc một số công thức khác. Đối với một số công thức này, luật phân phối có tên riêng.

Các luật phân phối phổ biến nhất của một biến ngẫu nhiên rời rạc là luật phân phối nhị thức, hình học, siêu phương, Poisson.

Luật phân phối nhị thức

Hãy để nó được sản xuất N các thử nghiệm độc lập, trong mỗi thử nghiệm một sự kiện có thể xảy ra hoặc không NHƯNG. Xác suất xảy ra sự kiện này trong mỗi lần thử là không đổi, không phụ thuộc vào số lần thử và bằng R=R(NHƯNG). Do đó xác suất sự kiện sẽ không xảy ra NHƯNG trong mỗi bài kiểm tra cũng không đổi và bằng q=1–R. Xem xét một biến ngẫu nhiên X bằng số lần xuất hiện của sự kiện NHƯNG Trong N các bài kiểm tra. Rõ ràng là các giá trị của đại lượng này bằng

X 1 = 0 - sự kiện NHƯNG Trong N các bài kiểm tra không xuất hiện;

X 2 = 1 - sự kiện NHƯNG Trong N các thử nghiệm đã xuất hiện một lần;

X 3 = 2 - sự kiện NHƯNG Trong N các thử nghiệm xuất hiện hai lần;

…………………………………………………………..

x n +1 = N- Sự kiện NHƯNG Trong N kiểm tra xuất hiện tất cả mọi thứ N Một lần.

Xác suất của các giá trị này có thể được tính bằng công thức Bernoulli (4.1):

ở đâu đến=0, 1, 2, …,N .

Luật phân phối nhị thức X bằng số lần thành công trong N Thử nghiệm Bernoulli, với xác suất thành công R.

Vì vậy, một biến ngẫu nhiên rời rạc có phân phối nhị thức (hoặc được phân phối theo luật nhị thức) nếu các giá trị có thể có của nó là 0, 1, 2,…, N, và các xác suất tương ứng được tính theo công thức (7.1).

Phân phối nhị thức phụ thuộc vào hai thông số RN.

Dãy số phân phối của một biến ngẫu nhiên có phân phối theo luật nhị thức có dạng:

X k N
R

Thí dụ 7.1 . Ba phát độc lập được bắn vào mục tiêu. Xác suất bắn trúng mỗi lần bắn là 0,4. Giá trị ngẫu nhiên X- số lần bắn trúng mục tiêu. Xây dựng chuỗi phân phối của nó.

Dung dịch. Các giá trị có thể có của một biến ngẫu nhiên XX 1 =0; X 2 =1; X 3 =2; X 4 = 3. Tìm xác suất tương ứng bằng công thức Bernoulli. Dễ dàng cho thấy rằng việc áp dụng công thức này ở đây là hoàn toàn chính đáng. Lưu ý rằng xác suất bắn không trúng mục tiêu của một lần bắn sẽ bằng 1-0,4 = 0,6. Lấy

Chuỗi phân phối có dạng sau:

X
R 0,216 0,432 0,288 0,064

Dễ dàng kiểm tra rằng tổng tất cả các xác suất đều bằng 1. Bản thân biến ngẫu nhiên X phân phối theo luật nhị thức. ■

Hãy tìm kỳ vọng toán học và phương sai của một biến ngẫu nhiên có phân phối theo luật nhị thức.

Khi giải ví dụ 6.5, người ta chỉ ra rằng kỳ vọng toán học về số lần xuất hiện của một sự kiện NHƯNG Trong N kiểm tra độc lập, nếu xác suất xảy ra NHƯNG trong mỗi bài kiểm tra là không đổi và bằng nhau R, bằng N· R

Trong ví dụ này, một biến ngẫu nhiên đã được sử dụng, được phân phối theo luật nhị thức. Do đó, lời giải của Ví dụ 6.5 trên thực tế là một bằng chứng của định lý sau.

Định lý 7.1. Kỳ vọng toán học của một biến ngẫu nhiên rời rạc được phân phối theo luật nhị thức bằng tích của số lần thử và xác suất "thành công", tức là M(X)=N· R.

Định lý 7.2. Phương sai của một biến ngẫu nhiên rời rạc được phân phối theo luật nhị thức bằng tích của số lần thử theo xác suất "thành công" và xác suất "thất bại", tức là D(X)=npq.

Độ xiên và độ lệch của một biến ngẫu nhiên được phân phối theo luật nhị thức được xác định bởi các công thức

Các công thức này có thể thu được bằng cách sử dụng khái niệm mômen đầu và mômen trung tâm.

Luật phân phối nhị thức làm cơ sở cho nhiều tình huống thực tế. Đối với các giá trị lớn N phân phối nhị thức có thể được xấp xỉ bởi các phân phối khác, đặc biệt là phân phối Poisson.

Phân phối Poisson

Để đó đi N Thử nghiệm Bernoulli, với số lượng thử nghiệm Nđủ lớn. Trước đây, người ta đã chỉ ra rằng trong trường hợp này (nếu, ngoài ra, xác suất R sự phát triển NHƯNG rất nhỏ) để tìm xác suất mà một sự kiện NHƯNG xuất hiện t một lần trong các bài kiểm tra, bạn có thể sử dụng công thức Poisson (4.9). Nếu biến ngẫu nhiên X có nghĩa là số lần xuất hiện của sự kiện NHƯNG Trong N Thử nghiệm Bernoulli, sau đó xác suất X sẽ mang ý nghĩa k có thể được tính bằng công thức

, (7.2)

ở đâu λ = nr.

Luật phân phối Poissonđược gọi là phân phối của một biến ngẫu nhiên rời rạc X, trong đó các giá trị có thể là số nguyên không âm và xác suất p t các giá trị này được tìm thấy bằng công thức (7.2).

Giá trị λ = nr gọi là tham số Phân phối Poisson.

Một biến ngẫu nhiên được phân phối theo định luật Poisson có thể nhận vô số giá trị. Vì đối với phân phối này, xác suất R sự xuất hiện của một sự kiện trong mỗi thử nghiệm là nhỏ, khi đó sự phân bố này đôi khi được gọi là quy luật của hiện tượng hiếm.

Dãy số phân phối của một biến ngẫu nhiên có phân phối theo định luật Poisson có dạng

X t
R

Dễ dàng xác minh rằng tổng xác suất của hàng thứ hai bằng 1. Để làm được điều này, chúng ta cần nhớ rằng hàm có thể được mở rộng trong chuỗi Maclaurin, chuỗi này hội tụ cho bất kỳ X. Trong trường hợp này, chúng tôi có

. (7.3)

Như đã lưu ý, luật Poisson trong một số trường hợp giới hạn nhất định sẽ thay thế luật nhị thức. Một ví dụ là một biến ngẫu nhiên X, các giá trị này bằng số lần hỏng hóc trong một thời gian nhất định khi sử dụng nhiều lần thiết bị kỹ thuật. Người ta cho rằng thiết bị này có độ tin cậy cao, tức là xác suất thất bại trong một ứng dụng là rất nhỏ.

Ngoài những trường hợp giới hạn như vậy, trong thực tế có những biến ngẫu nhiên được phân phối theo định luật Poisson, không liên quan đến phân phối nhị thức. Ví dụ, phân phối Poisson thường được sử dụng khi xử lý số lượng sự kiện xảy ra trong một khoảng thời gian (số lượng cuộc gọi đến tổng đài điện thoại trong giờ, số lượng xe đến rửa xe trong ngày, số lần dừng máy mỗi tuần, v.v.). Tất cả những sự kiện này phải tạo thành cái gọi là dòng sự kiện, là một trong những khái niệm cơ bản của lý thuyết xếp hàng. Tham số λ đặc trưng cho cường độ trung bình của dòng sự kiện.