Tiểu sử Đặc điểm Phân tích

Tìm phân phối chuẩn của một biến ngẫu nhiên. Phân phối chuẩn của các biến ngẫu nhiên liên tục

Luật phân phối xác suất thông thường

Không ngoa, nó có thể được gọi là một quy luật triết học. Quan sát các đối tượng và quá trình khác nhau của thế giới xung quanh chúng ta, chúng ta thường gặp phải thực tế là có điều gì đó là chưa đủ, và rằng có một quy tắc:


Đây là một cái nhìn cơ bản hàm mật độ phân phối xác suất chuẩn, và tôi chào mừng bạn đến với bài học thú vị nhất này.

Có thể đưa ra những ví dụ nào? Chúng chỉ là bóng tối. Ví dụ, đây là chiều cao, cân nặng của con người (và không chỉ), sức mạnh thể chất, khả năng tinh thần của họ, v.v. Có một "khối lượng" (bằng cách này hay cách khác) và có sự sai lệch theo cả hai hướng.

Đây là những đặc điểm khác nhau của các vật vô tri (cùng kích thước, trọng lượng). Đây là khoảng thời gian ngẫu nhiên của các quá trình, ví dụ, thời gian của một cuộc chạy đua hàng trăm mét hoặc quá trình biến đổi nhựa thành hổ phách. Từ vật lý học, các phân tử không khí đã xuất hiện trong tâm trí: trong số chúng có những cái chậm, có những cái nhanh, nhưng hầu hết chúng chuyển động với tốc độ “chuẩn”.

Tiếp theo, chúng tôi làm lệch tâm thêm một độ lệch chuẩn nữa và tính chiều cao:

Đánh dấu các điểm trên bản vẽ (màu xanh lá cây) và chúng tôi thấy rằng điều này là khá đủ.

Ở giai đoạn cuối cùng, chúng tôi cẩn thận vẽ một biểu đồ và đặc biệt cẩn thận phản ánh nó sự lồi lõm / độ cong! Chà, có lẽ bạn đã nhận ra cách đây rất lâu rằng trục abscissa là tiệm cận ngang, và hoàn toàn không thể “leo lên” được!

Với thiết kế điện tử của giải pháp, đồ thị rất dễ dàng để xây dựng trong Excel, và thật bất ngờ đối với bản thân tôi, tôi thậm chí còn quay một video ngắn về chủ đề này. Nhưng trước tiên, hãy nói về hình dạng của đường cong thông thường thay đổi như thế nào tùy thuộc vào các giá trị của và.

Khi tăng hoặc giảm "a" (với "sigma" không thay đổi) biểu đồ vẫn giữ nguyên hình dạng của nó và di chuyển sang phải / trái tương ứng. Vì vậy, ví dụ, khi hàm có dạng và biểu đồ của chúng tôi "di chuyển" 3 đơn vị sang trái - chính xác đến điểm gốc:


Một đại lượng được phân phối chuẩn với kỳ vọng toán học bằng không nhận được một cái tên hoàn toàn tự nhiên - tập trung; hàm mật độ của nó thậm chí, và đồ thị đối xứng qua trục y.

Trong trường hợp có sự thay đổi trong "sigma" (với hằng số "a"), biểu đồ "vẫn giữ nguyên vị trí", nhưng thay đổi hình dạng. Khi được mở rộng, nó trở nên thấp hơn và dài ra, giống như một con bạch tuộc đang duỗi các xúc tu của mình. Và ngược lại, khi giảm đồ thị trở nên hẹp hơn và cao hơn- Hóa ra là "con bạch tuộc ngạc nhiên." Có, tại giảm bớt"sigma" hai lần: biểu đồ trước đó thu hẹp và kéo dài lên hai lần:

Mọi thứ đều phù hợp với phép biến đổi hình học của đồ thị.

Phân phối chuẩn với giá trị đơn vị "sigma" được gọi là bình thường hóa, và nếu nó cũng vậy tập trung(trường hợp của chúng tôi), thì phân phối như vậy được gọi là Tiêu chuẩn. Nó có một hàm mật độ thậm chí còn đơn giản hơn, đã từng gặp ở định lý Laplace cục bộ: . Phân phối chuẩn đã được ứng dụng rộng rãi trong thực tế, và rất nhanh thôi thì cuối cùng chúng ta cũng sẽ hiểu được mục đích của nó.

Bây giờ chúng ta hãy xem một bộ phim:

Vâng, hoàn toàn đúng - bằng cách nào đó chúng ta vẫn còn trong bóng tối hàm phân phối xác suất. Chúng tôi nhớ cô ấy Định nghĩa:
- xác suất để một biến ngẫu nhiên nhận giá trị ÍT NHẤT so với biến, giá trị này "chạy" tất cả các giá trị thực \ u200b \ u200b đến "cộng" vô cùng.

Bên trong tích phân, một chữ cái khác thường được sử dụng để không có "lớp phủ" với ký hiệu, bởi vì ở đây mỗi giá trị được gán Tích phân không đúng , bằng với một số con số từ khoảng thời gian.

Hầu như tất cả các giá trị không thể được tính toán chính xác, nhưng như chúng ta vừa thấy, với sức mạnh tính toán hiện đại, điều này không khó. Vì vậy, đối với hàm của phân phối chuẩn, hàm excel tương ứng thường chứa một đối số:

= NORMSDIST (z)

Một, hai - và bạn đã hoàn thành:

Bản vẽ cho thấy rõ ràng việc thực hiện tất cả thuộc tính hàm phân phối và từ các sắc thái kỹ thuật ở đây, bạn nên chú ý đến không có triệu chứng ngang và một điểm uốn.

Bây giờ chúng ta hãy nhớ lại một trong những nhiệm vụ chính của chủ đề, đó là tìm cách tìm - xác suất mà một biến ngẫu nhiên bình thường sẽ nhận một giá trị từ khoảng thời gian. Về mặt hình học, xác suất này bằng diện tích giữa đường cong thông thường và trục x trong phần tương ứng:

nhưng mỗi lần nghiền ra một giá trị gần đúng là không hợp lý, và do đó nó hợp lý hơn để sử dụng công thức "dễ dàng":
.

! cũng nhớ , Gì

Ở đây, bạn có thể sử dụng lại Excel, nhưng có một số “buts” quan trọng: thứ nhất, nó không phải lúc nào cũng sẵn sàng, và thứ hai, các giá trị “sẵn sàng”, rất có thể, sẽ đặt ra câu hỏi từ giáo viên. Tại sao?

Tôi đã nhiều lần nói về điều này trước đây: một thời (và cách đây không lâu) một chiếc máy tính bình thường là một thứ xa xỉ, và cách giải bài toán “thủ công” đang được xem xét vẫn còn được lưu giữ trong các tài liệu giáo dục. Bản chất của nó là để tiêu chuẩn hóa các giá trị "alpha" và "beta", nghĩa là giảm giải pháp xuống phân phối chuẩn:

Ghi chú : hàm dễ lấy từ trường hợp chungsử dụng một tuyến tính sự thay thế. Sau đó và:

và từ thay thế chỉ cần tuân theo công thức chuyển từ các giá trị của phân phối tùy ý sang các giá trị tương ứng của phân phối chuẩn.

tại sao nó cần thiết? Thực tế là các giá trị đã được tổ tiên của chúng ta tính toán một cách cẩn thận và được tóm tắt trong một bảng đặc biệt, có trong nhiều sách về terver. Nhưng phổ biến hơn nữa là bảng giá trị, chúng tôi đã xử lý Định lý tích phân Laplace:

Nếu chúng ta có sẵn một bảng các giá trị của hàm Laplace , sau đó chúng tôi giải quyết thông qua nó:

Các giá trị phân số được làm tròn theo truyền thống đến 4 chữ số thập phân, như được thực hiện trong bảng tiêu chuẩn. Và để kiểm soát Mặt hàng 5 cách trình bày.

tôi sẽ nhắc bạn điều đó và để tránh nhầm lẫn luôn kiểm soát, bảng chức năng CÁI GÌ trước mắt bạn.

Câu trả lời bắt buộc phải được đưa ra dưới dạng phần trăm, vì vậy xác suất được tính phải được nhân với 100 và cung cấp kết quả với một nhận xét có ý nghĩa:

- với đường bay từ 5 đến 70 m, khoảng 15,87% số vỏ đạn sẽ rơi

Chúng tôi tự đào tạo:

Ví dụ 3

Đường kính của vòng bi được sản xuất tại nhà máy là một biến ngẫu nhiên có phân phối chuẩn với kỳ vọng là 1,5 cm và độ lệch chuẩn là 0,04 cm Tìm xác suất để kích thước của một vòng bi được lấy ngẫu nhiên nằm trong khoảng từ 1,4 đến 1,6 cm.

Trong giải pháp mẫu và bên dưới, tôi sẽ sử dụng hàm Laplace làm tùy chọn phổ biến nhất. Nhân tiện, hãy lưu ý rằng theo cách diễn đạt, ở đây bạn có thể bao gồm các phần cuối của khoảng trong đang xem xét. Tuy nhiên, điều này không phải là quan trọng.

Và trong ví dụ này, chúng ta đã gặp một trường hợp đặc biệt - khi khoảng này đối xứng với kỳ vọng toán học. Trong tình huống như vậy, nó có thể được viết dưới dạng và, bằng cách sử dụng hàm Laplace, đơn giản hóa công thức làm việc:


Tham số delta được gọi là lệch lạc từ kỳ vọng toán học và bất đẳng thức kép có thể được "đóng gói" bằng cách sử dụng mô-đun:

là xác suất giá trị của một biến ngẫu nhiên sai lệch so với kỳ vọng toán học nhỏ hơn.

Chà, giải pháp phù hợp trong một dòng :)
là xác suất để đường kính của một ổ trục được lấy ngẫu nhiên khác 1,5 cm không quá 0,1 cm.

Kết quả của nhiệm vụ này hóa ra là gần với sự thống nhất, nhưng tôi muốn độ tin cậy cao hơn nữa - cụ thể là, để tìm ra ranh giới trong đó đường kính hầu hết mọi người vòng bi. Có tiêu chí nào cho việc này không? Tồn tại! Câu hỏi được trả lời bởi cái gọi là

quy tắc ba sigma

Bản chất của nó là thực tế đáng tin cậy thực tế là một biến ngẫu nhiên có phân phối chuẩn sẽ nhận một giá trị từ khoảng .

Thật vậy, xác suất sai lệch so với kỳ vọng nhỏ hơn:
hoặc 99,73%

Về "vòng bi" - đây là 9973 mảnh có đường kính từ 1,38 đến 1,62 cm và chỉ có 27 bản sao "không đạt tiêu chuẩn".

Trong nghiên cứu thực tế, quy tắc “ba sigma” thường được áp dụng theo hướng ngược lại: nếu thống kê nhận thấy rằng hầu hết tất cả các giá trị biến ngẫu nhiên đang nghiên cứu phù hợp với khoảng 6 độ lệch chuẩn, thì có những lý do chính đáng để tin rằng giá trị này được phân phối theo luật chuẩn. Việc xác minh được thực hiện bằng cách sử dụng lý thuyết giả thuyết thống kê.

Chúng tôi tiếp tục giải quyết các nhiệm vụ khắc nghiệt của Liên Xô:

Ví dụ 4

Giá trị ngẫu nhiên của sai số cân được phân phối theo quy luật thông thường với kỳ vọng toán học bằng không và độ lệch chuẩn là 3 gam. Tìm xác suất để lần cân tiếp theo có sai số về giá trị tuyệt đối không quá 5 gam.

Dung dịch rất đơn giản. Theo điều kiện, và chúng tôi ngay lập tức ghi nhận rằng ở lần cân tiếp theo (cái gì đó hoặc ai đó) chúng ta sẽ gần như 100% nhận được kết quả với độ chính xác là 9 gam. Nhưng trong bài toán có độ lệch hẹp hơn và theo công thức :

- xác suất để lần cân tiếp theo được thực hiện với sai số không quá 5 gam.

Câu trả lời:

Một vấn đề đã được giải quyết về cơ bản khác với một vấn đề có vẻ tương tự. Ví dụ 3 bài học về phân bố đồng đều. Có một lỗi làm tròn kết quả đo, ở đây chúng ta đang nói về sai số ngẫu nhiên của chính các phép đo. Những lỗi như vậy phát sinh do các đặc tính kỹ thuật của chính thiết bị. (phạm vi sai sót cho phép, như một quy luật, được chỉ ra trong hộ chiếu của anh ta), và cũng do lỗi của người thử nghiệm - chẳng hạn, khi "bằng mắt thường", chúng tôi lấy số đọc từ mũi tên của cùng một thang đo.

Trong số những người khác, cũng có cái gọi là có hệ thống sai số đo lường. Đã sẵn sàng không ngẫu nhiên các lỗi xảy ra do thiết lập hoặc vận hành thiết bị không chính xác. Vì vậy, ví dụ, cân sàn chưa được điều chỉnh có thể liên tục "thêm" một kg và người bán thiếu cân một cách có hệ thống. Hoặc không có hệ thống vì bạn có thể rút ngắn. Tuy nhiên, trong mọi trường hợp, một lỗi như vậy sẽ không phải là ngẫu nhiên và kỳ vọng của nó khác 0.

… Mình đang gấp rút mở khóa đào tạo bán hàng =)

Hãy tự mình giải quyết vấn đề:

Ví dụ 5

Đường kính con lăn là một biến ngẫu nhiên ngẫu nhiên có phân phối chuẩn, độ lệch chuẩn của nó là mm. Tìm độ dài của khoảng, đối xứng với kỳ vọng toán học, trong đó độ dài đường kính của hạt sẽ rơi theo xác suất.

Mặt hàng 5 * thiết kế bố trí giúp đỡ. Xin lưu ý rằng kỳ vọng toán học không được biết ở đây, nhưng điều này ít nhất gây trở ngại cho việc giải quyết vấn đề.

Và nhiệm vụ ôn thi mà tôi rất khuyên bạn nên củng cố tài liệu:

Ví dụ 6

Một biến ngẫu nhiên có phân phối chuẩn được cho bởi các tham số của nó (kỳ vọng toán học) và (độ lệch chuẩn). Yêu cầu:

a) viết ra mật độ xác suất và mô tả bằng biểu đồ của nó;
b) tìm xác suất để nó nhận một giá trị trong khoảng thời gian ;
c) tìm xác suất để môđun sai lệch không quá;
d) áp dụng quy tắc "ba sigma", tìm các giá trị của biến ngẫu nhiên.

Những vấn đề như vậy được đưa ra ở khắp mọi nơi, và qua nhiều năm thực hành, tôi đã có thể giải hàng trăm và hàng trăm chúng. Hãy chắc chắn để thực hành vẽ tay và sử dụng bảng tính trên giấy;)

Vâng, tôi sẽ phân tích một ví dụ về sự phức tạp tăng lên:

Ví dụ 7

Mật độ phân phối xác suất của một biến ngẫu nhiên có dạng . Tìm, kỳ vọng toán học, phương sai, hàm phân phối, mật độ đồ thị và các hàm phân phối, tìm.

Dung dịch: trước hết, chúng ta hãy chú ý rằng điều kiện không nói gì về bản chất của biến ngẫu nhiên. Tự nó, sự hiện diện của người tham gia triển lãm không có nghĩa gì cả: chẳng hạn, nó có thể là Biểu tình hoặc nói chung là tùy ý phân phối liên tục. Và do đó, "tính bình thường" của phân phối vẫn cần được chứng minh:

Kể từ khi chức năng xác định tại không tí nào giá trị thực và nó có thể được giảm xuống dạng , khi đó biến ngẫu nhiên được phân phối theo luật chuẩn.

Chúng tôi xin giới thiệu. Đối với điều này chọn một hình vuông đầy đủ và tổ chức phần ba tầng:


Đảm bảo thực hiện kiểm tra, đưa chỉ báo về dạng ban đầu:

đó là những gì chúng tôi muốn xem.

Theo cách này:
- trên quy tắc quyền lực"tách ra". Và ở đây bạn có thể viết ngay ra các đặc điểm số rõ ràng:

Bây giờ chúng ta hãy tìm giá trị của tham số. Vì số nhân phân phối chuẩn có dạng và nên:
, từ đó chúng tôi thể hiện và thay thế vào chức năng của chúng tôi:
, sau đó, chúng tôi sẽ một lần nữa xem xét bản ghi bằng mắt của chúng tôi và đảm bảo rằng hàm kết quả có dạng .

Hãy vẽ biểu đồ mật độ:

và biểu đồ của hàm phân phối :

Nếu không có Excel và thậm chí một máy tính thông thường trong tay, thì biểu đồ cuối cùng sẽ dễ dàng được xây dựng theo cách thủ công! Tại điểm, hàm phân phối nhận giá trị và đây là

Sự định nghĩa. Bình thườngđược gọi là phân phối xác suất của một biến ngẫu nhiên liên tục, được mô tả bằng mật độ xác suất

Phân phối chuẩn còn được gọi là Luật Gauss.

Luật phân phối chuẩn là trọng tâm của lý thuyết xác suất. Điều này là do quy luật này thể hiện trong mọi trường hợp khi một biến ngẫu nhiên là kết quả của tác động của một số lượng lớn các yếu tố khác nhau. Tất cả các luật phân phối khác đều tiếp cận luật thông thường.

Có thể dễ dàng chỉ ra rằng các thông số , được bao gồm trong mật độ phân phối, tương ứng là kỳ vọng toán học và độ lệch chuẩn của biến ngẫu nhiên X.

Hãy tìm hàm phân phối F(x) .

Biểu đồ mật độ phân phối chuẩn được gọi là đường cong bình thường hoặc Đường cong Gaussian.

Một đường cong thông thường có các đặc tính sau:

1) Hàm được xác định trên toàn bộ trục số.

2) Cho tất cả X hàm phân phối chỉ nhận các giá trị dương.

3) Trục OX là tiệm cận ngang của đồ thị mật độ xác suất, vì với sự gia tăng không giới hạn về giá trị tuyệt đối của đối số X, giá trị của hàm có xu hướng bằng không.

4) Tìm cực trị của hàm số.

Tại vì tại y’ > 0 tại x < my’ < 0 tại x > m, sau đó tại điểm x = t hàm có giá trị lớn nhất bằng
.

5) Hàm số đối xứng với một đường thẳng x = a, tại vì Sự khác biệt

(x - a) vào hàm mật độ phân phối bình phương.

6) Để tìm các điểm uốn của đồ thị, ta tìm đạo hàm cấp hai của hàm mật độ.

Tại x = m+  và x = m-  đạo hàm cấp hai bằng 0, và khi đi qua các điểm này, nó đổi dấu, tức là tại những điểm này, hàm có một sự uốn cong.

Tại những điểm này, giá trị của hàm là
.

Hãy xây dựng một đồ thị của hàm mật độ phân phối (Hình 5).

Đồ thị được xây dựng cho t= 0 và ba giá trị có thể có của độ lệch chuẩn  = 1,  = 2 và  = 7. Như bạn thấy, khi giá trị của độ lệch chuẩn tăng lên, đồ thị trở nên phẳng hơn và giá trị lớn nhất giảm.

Nếu một một> 0, khi đó đồ thị sẽ chuyển dịch theo chiều dương nếu một < 0 – в отрицательном.

Tại một= 0 và  = 1 đường cong được gọi là bình thường hóa. Phương trình đường cong chuẩn hóa:

      Hàm Laplace

Tìm xác suất để một biến ngẫu nhiên có phân phối theo luật chuẩn rơi vào một khoảng cho trước.

Chứng tỏ

Tại vì tích phân
không được thể hiện dưới dạng các hàm cơ bản, thì hàm

,

được gọi là Hàm Laplace hoặc tích phân xác suất.

Các giá trị của hàm này cho các giá trị khác nhau Xđược tính toán và trình bày trong các bảng đặc biệt.

Trên hình. 6 cho thấy một đồ thị của hàm Laplace.

Hàm Laplace có các thuộc tính sau:

1) F (0) = 0;

2) F (-x) = - F (x);

3) F () = 1.

Hàm Laplace còn được gọi là chức năng lỗi và biểu thị erf x.

Vẫn còn sử dụng bình thường hóa hàm Laplace, có liên quan đến hàm Laplace theo quan hệ:

Trên hình. 7 cho thấy một biểu đồ của hàm Laplace chuẩn hóa.

      P quy tắc ba sigma

Khi xem xét phân phối chuẩn, một trường hợp đặc biệt quan trọng được phân biệt, được gọi là quy tắc ba sigma.

Hãy viết xác suất để độ lệch của một biến ngẫu nhiên có phân phối chuẩn so với kỳ vọng toán học nhỏ hơn một giá trị cho trước :

Nếu chúng ta chấp nhận  = 3, thì chúng ta thu được bằng cách sử dụng bảng giá trị của hàm Laplace:

Những thứ kia. xác suất mà một biến ngẫu nhiên sai lệch so với kỳ vọng toán học của nó một số tiền lớn hơn ba lần độ lệch chuẩn trên thực tế là bằng không.

Quy tắc này được gọi là quy tắc ba sigma.

Trong thực tế, người ta coi rằng nếu đối với một biến ngẫu nhiên nào đó thỏa mãn quy luật ba sigma thì biến ngẫu nhiên này có phân phối chuẩn.

Kết luận bài giảng:

Trong bài giảng, chúng ta đã xem xét các quy luật phân phối của các đại lượng liên tục, để chuẩn bị cho bài giảng tiếp theo và các bài tập thực hành, bạn nên độc lập bổ sung vào phần ghi chú bài giảng của mình bằng cách nghiên cứu sâu các tài liệu đã đề xuất và giải các bài toán đã đề xuất.

Lý thuyết ngắn gọn

Bình thường là phân phối xác suất của một biến ngẫu nhiên liên tục, có mật độ có dạng:

đâu là kỳ vọng toán học, là độ lệch chuẩn.

Xác suất để nó nhận một giá trị thuộc khoảng:

Hàm Laplace ở đâu:

Xác suất để giá trị tuyệt đối của độ lệch nhỏ hơn một số dương:

Cụ thể, đối với, sự bình đẳng sau đây giữ:

Khi giải quyết các vấn đề mà thực tiễn đặt ra, người ta phải giải quyết các phân phối khác nhau của các biến ngẫu nhiên liên tục.

Ngoài phân phối chuẩn, các luật phân phối chính cho các biến ngẫu nhiên liên tục là:

Ví dụ về giải pháp vấn đề

Phần được thực hiện trên máy. Độ dài của nó là một biến ngẫu nhiên được phân phối theo luật chuẩn với các tham số ,. Tìm xác suất để chiều dài của bộ phận nằm trong khoảng từ 22 đến 24,2 cm. Độ lệch của bộ phận đó có thể được đảm bảo với xác suất 0,92; 0,98? Trong giới hạn nào, đối xứng về mặt thực tế, tất cả các kích thước của các bộ phận sẽ nằm trong giới hạn nào?

tham gia nhóm VK.

Dung dịch:

Xác suất để một biến ngẫu nhiên được phân phối theo luật chuẩn sẽ nằm trong khoảng:

Chúng tôi nhận được:

Xác suất để một biến ngẫu nhiên, được phân phối theo luật chuẩn, lệch khỏi giá trị trung bình không quá:

Theo điều kiện

:

Nếu bạn không cần trợ giúp bây giờ, nhưng có thể cần trong tương lai, thì để không mất liên lạc,

Cũng sẽ có các nhiệm vụ cho một giải pháp độc lập mà bạn có thể xem câu trả lời.

Phân phối chuẩn: cơ sở lý thuyết

Ví dụ về các biến ngẫu nhiên phân bố theo quy luật thông thường là chiều cao của một người, khối lượng của con cá cùng loài đánh bắt được. Phân phối bình thường có nghĩa là sau : có các giá trị về chiều cao của con người, khối lượng của cá cùng loài, ở cấp độ trực quan được coi là "bình thường" (và trên thực tế - tính trung bình) và chúng phổ biến hơn nhiều ở mức đủ lớn mẫu hơn những mẫu khác nhau lên hoặc xuống.

Phân phối xác suất chuẩn của một biến ngẫu nhiên liên tục (đôi khi là phân phối Gauss) có thể được gọi là hình chuông do hàm mật độ của phân phối này, đối xứng về giá trị trung bình, rất giống với hình cắt của một cái chuông ( đường cong màu đỏ trong hình trên).

Xác suất đáp ứng các giá trị nhất định trong mẫu bằng diện tích của hình dưới đường cong, và trong trường hợp có phân phối chuẩn, chúng ta thấy rằng dưới đỉnh của "chuông", tương ứng với đối với các giá trị có xu hướng trung bình, diện tích, và do đó xác suất, lớn hơn dưới các cạnh. Do đó, chúng ta nhận được điều tương tự như đã nói: xác suất gặp một người có chiều cao "bình thường", bắt được một con cá có trọng lượng "bình thường" cao hơn so với các giá trị khác nhau lên hoặc xuống. Trong rất nhiều trường hợp thực tế, sai số đo được phân phối theo một quy luật gần với bình thường.

Chúng ta hãy dừng lại ở hình ở đầu bài học, nó cho thấy hàm mật độ của phân phối chuẩn. Đồ thị của hàm này thu được bằng cách tính toán một số mẫu dữ liệu trong gói phần mềm SỐ LIỆU THỐNG KÊ. Trên đó, các cột biểu đồ biểu thị các khoảng giá trị mẫu có phân phối gần (hoặc, như họ nói trong thống kê, không khác biệt đáng kể) với chính đồ thị hàm mật độ phân phối chuẩn, là một đường cong màu đỏ. Biểu đồ cho thấy đường cong này thực sự có dạng hình chuông.

Phân phối chuẩn có giá trị theo nhiều cách vì chỉ cần biết giá trị trung bình của một biến ngẫu nhiên liên tục và độ lệch chuẩn, bạn có thể tính toán bất kỳ xác suất nào liên quan đến biến đó.

Phân phối chuẩn có thêm lợi ích là trở thành một trong những phân phối dễ sử dụng nhất tiêu chí thống kê được sử dụng để kiểm tra các giả thuyết thống kê - Kiểm tra t của sinh viên- chỉ có thể được sử dụng trong trường hợp dữ liệu mẫu tuân theo luật phân phối chuẩn.

Hàm mật độ của phân phối chuẩn của một biến ngẫu nhiên liên tục có thể được tìm thấy bằng cách sử dụng công thức:

,

ở đâu x- giá trị của biến, - giá trị trung bình, - độ lệch chuẩn, e\ u003d 2.71828 ... - cơ số của logarit tự nhiên, \ u003d 3,1416 ...

Các thuộc tính của hàm mật độ phân phối chuẩn

Những thay đổi về giá trị trung bình di chuyển đường cong hình chuông theo hướng của trục Con bò. Nếu nó tăng, đường cong di chuyển sang phải, nếu nó giảm, sau đó sang trái.

Nếu độ lệch chuẩn thay đổi, thì chiều cao của đỉnh đường cong thay đổi. Khi độ lệch chuẩn tăng, đỉnh của đường cong cao hơn, khi nó giảm, nó thấp hơn.

Xác suất để giá trị của một biến ngẫu nhiên có phân phối chuẩn sẽ nằm trong một khoảng thời gian nhất định

Đã có trong đoạn này, chúng ta sẽ bắt đầu giải quyết các vấn đề thực tế, ý nghĩa của nó được chỉ ra trong tiêu đề. Chúng ta hãy phân tích những khả năng mà lý thuyết cung cấp để giải quyết vấn đề. Khái niệm ban đầu để tính xác suất của một biến ngẫu nhiên có phân phối chuẩn rơi vào một khoảng nhất định là hàm tích phân của phân phối chuẩn.

Hàm phân phối chuẩn tích phân:

.

Tuy nhiên, vấn đề là có được các bảng cho mọi kết hợp có thể có của giá trị trung bình và độ lệch chuẩn. Do đó, một trong những cách đơn giản để tính xác suất của một biến ngẫu nhiên có phân phối chuẩn rơi vào một khoảng nhất định là sử dụng các bảng xác suất cho một phân phối chuẩn đã được chuẩn hóa.

Phân phối chuẩn được gọi là phân phối chuẩn hóa hoặc phân phối chuẩn hóa., giá trị trung bình của nó là và độ lệch chuẩn là.

Hàm mật độ của phân phối chuẩn được chuẩn hóa:

.

Hàm tích lũy của phân phối chuẩn được chuẩn hóa:

.

Hình dưới đây cho thấy hàm tích phân của phân phối chuẩn được chuẩn hóa, đồ thị của nó được thu được bằng cách tính toán một số mẫu dữ liệu trong gói phần mềm SỐ LIỆU THỐNG KÊ. Bản thân đồ thị là một đường cong màu đỏ và các giá trị mẫu đang tiến gần đến nó.


Để phóng to bức tranh, bạn có thể nhấp vào nó bằng nút chuột trái.

Tiêu chuẩn hóa một biến ngẫu nhiên có nghĩa là chuyển từ các đơn vị ban đầu được sử dụng trong nhiệm vụ sang các đơn vị được tiêu chuẩn hóa. Tiêu chuẩn hóa được thực hiện theo công thức

Trong thực tế, tất cả các giá trị có thể có của một biến ngẫu nhiên thường không được biết trước, do đó không thể xác định chính xác giá trị của giá trị trung bình và độ lệch chuẩn. Chúng được thay thế bằng trung bình cộng của các quan sát và độ lệch chuẩn S. Giá trị z thể hiện độ lệch của các giá trị của một biến ngẫu nhiên so với giá trị trung bình số học khi đo độ lệch chuẩn.

Khoảng thời gian mở

Bảng xác suất cho phân phối chuẩn chuẩn hóa, có sẵn trong hầu hết mọi cuốn sách về thống kê, chứa các xác suất mà một biến ngẫu nhiên có phân phối chuẩn chuẩn Z nhận một giá trị nhỏ hơn một số nhất định z. Tức là, nó sẽ rơi vào khoảng mở từ âm vô cực đến z. Ví dụ: xác suất mà giá trị Z nhỏ hơn 1,5 bằng 0,93319.

ví dụ 1 Công ty sản xuất các bộ phận có tuổi thọ được phân bổ thông thường với giá trị trung bình là 1000 và độ lệch chuẩn là 200 giờ.

Đối với một bộ phận được chọn ngẫu nhiên, hãy tính xác suất để tuổi thọ của nó ít nhất là 900 giờ.

Dung dịch. Hãy giới thiệu ký hiệu đầu tiên:

Xác suất mong muốn.

Các giá trị của biến ngẫu nhiên nằm trong khoảng mở. Nhưng ta có thể tính xác suất để một biến ngẫu nhiên nhận giá trị nhỏ hơn một giá trị cho trước, và theo điều kiện của bài toán, yêu cầu tìm một giá trị bằng hoặc lớn hơn một giá trị đã cho. Đây là phần khác của không gian dưới đường cong của chuông. Do đó, để tìm xác suất mong muốn, cần phải trừ đi một xác suất đã đề cập để biến ngẫu nhiên sẽ nhận giá trị nhỏ hơn 900 xác định:

Bây giờ biến ngẫu nhiên cần được chuẩn hóa.

Chúng tôi tiếp tục giới thiệu ký hiệu:

z = (X ≤ 900) ;

x= 900 - giá trị đã cho của một biến ngẫu nhiên;

μ = 1000 - giá trị trung bình;

σ = 200 - độ lệch chuẩn.

Dựa trên những dữ liệu này, chúng tôi có được các điều kiện của vấn đề:

.

Theo các bảng của một biến ngẫu nhiên chuẩn hóa (biên khoảng) z= −0,5 tương ứng với xác suất 0,30854. Trừ nó ra khỏi sự thống nhất và nhận được những gì được yêu cầu trong điều kiện của vấn đề:

Vì vậy, xác suất để tuổi thọ của bộ phận này ít nhất là 900 giờ là 69%.

Xác suất này có thể đạt được bằng cách sử dụng hàm MS Excel NORM.DIST (giá trị của giá trị tích phân là 1):

P(X≥900) = 1 - P(X≤900) = 1 - NORM.DIST (900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

Giới thiệu về các phép tính trong MS Excel - ở một trong các đoạn tiếp theo của bài học này.

Ví dụ 2Ở một số thành phố, thu nhập trung bình hàng năm của gia đình là một biến ngẫu nhiên có phân phối chuẩn với giá trị trung bình là 300.000 và độ lệch chuẩn là 50.000. Được biết, thu nhập của 40% gia đình nhỏ hơn giá trị Một. Tìm giá trị Một.

Dung dịch. Trong bài toán này, 40% không hơn gì xác suất mà một biến ngẫu nhiên sẽ nhận một giá trị từ một khoảng mở nhỏ hơn một giá trị nhất định, được biểu thị bằng ký tự Một.

Để tìm giá trị Một, trước tiên chúng ta soạn hàm tích phân:

Theo nhiệm vụ

μ = 300000 - giá trị trung bình;

σ = 50000 - độ lệch chuẩn;

x = Một là giá trị được tìm thấy.

Tạo nên sự bình đẳng

.

Theo các bảng thống kê, chúng tôi thấy rằng xác suất 0,40 tương ứng với giá trị của biên khoảng z = −0,25 .

Do đó, chúng tôi tạo ra sự bình đẳng

và tìm ra giải pháp của nó:

Một = 287300 .

Trả lời: thu nhập của 40% gia đình nhỏ hơn 287300.

Khoảng thời gian đóng cửa

Trong nhiều bài toán, yêu cầu tìm xác suất để một biến ngẫu nhiên có phân phối chuẩn nhận một giá trị trong khoảng thời gian từ z 1 đến z 2. Tức là nó sẽ rơi vào khoảng đóng. Để giải quyết những vấn đề như vậy, cần phải tìm trong bảng các xác suất tương ứng với các ranh giới của khoảng, và sau đó tìm sự khác biệt giữa các xác suất này. Điều này yêu cầu trừ giá trị nhỏ hơn cho giá trị lớn hơn. Ví dụ để giải quyết những vấn đề phổ biến này như sau, và nó được đề xuất để tự giải quyết chúng, sau đó bạn có thể xem các giải pháp và câu trả lời chính xác.

Ví dụ 3 Lợi nhuận của doanh nghiệp trong một thời kỳ nhất định là một biến ngẫu nhiên tuân theo quy luật phân phối chuẩn với giá trị bình quân là 0,5 triệu c.u. và độ lệch chuẩn là 0,354. Hãy xác định, với độ chính xác đến hai chữ số thập phân, xác suất để lợi nhuận của doanh nghiệp đạt từ 0,4 đến 0,6 c.u.

Ví dụ 4 Chiều dài của chi tiết được chế tạo là một biến ngẫu nhiên được phân phối theo luật chuẩn với các tham số μ = 10 và σ = 0,071. Tìm, với độ chính xác đến hai chữ số thập phân, xác suất kết hôn nếu kích thước cho phép của bộ phận phải là 10 ± 0,05.

Gợi ý: trong bài toán này, ngoài việc tìm xác suất để biến ngẫu nhiên rơi vào khoảng đóng (xác suất lấy được bộ phận không bị lỗi) thì cần thực hiện thêm một thao tác nữa.

cho phép bạn xác định xác suất mà giá trị chuẩn hóa Z không ít hơn -z và không nhiều + z, ở đâu z- một giá trị được chọn tùy ý của một biến ngẫu nhiên chuẩn hóa.

Phương pháp gần đúng để kiểm tra tính chuẩn mực của phân phối

Một phương pháp gần đúng để kiểm tra tính chuẩn mực của sự phân bố các giá trị mẫu dựa trên những điều sau đây thuộc tính của phân phối chuẩn: độ lệch β 1 và hệ số kurtosis β 2 số không.

Hệ số bất đối xứng β 1 đặc trưng về mặt số học cho tính đối xứng của phân phối thực nghiệm đối với giá trị trung bình. Nếu độ lệch bằng 0, thì trung bình số học, trung vị và chế độ bằng nhau: và đường cong mật độ phân phối là đối xứng về giá trị trung bình. Nếu hệ số bất đối xứng nhỏ hơn 0 (β 1 < 0 ), thì trung bình cộng nhỏ hơn trung vị, và trung vị, đến lượt nó, nhỏ hơn mode () và đường cong bị dịch chuyển sang phải (so với phân phối chuẩn). Nếu hệ số bất đối xứng lớn hơn 0 (β 1 > 0 ), thì trung bình cộng lớn hơn trung vị, và trung vị, đến lượt nó, lớn hơn mode () và đường cong bị dịch chuyển sang trái (so với phân phối chuẩn).

Hệ số Kurtosis β 2 đặc trưng cho nồng độ của phân bố thực nghiệm xung quanh trung bình cộng theo hướng của trục Oy và mức độ đạt đỉnh của đường cong mật độ phân bố. Nếu hệ số kurtosis lớn hơn 0, thì đường cong kéo dài hơn (so với phân phối chuẩn) dọc theo trục Oy(đồ thị nhọn hơn). Nếu hệ số kurtosis nhỏ hơn 0, thì đường cong sẽ phẳng hơn (so với phân phối chuẩn) dọc theo trục Oy(đồ thị càng tù).

Hệ số xiên có thể được tính bằng hàm SKRS của MS Excel. Nếu bạn đang kiểm tra một mảng dữ liệu, thì bạn cần nhập một dải dữ liệu vào một hộp "Số".


Hệ số kurtosis có thể được tính bằng cách sử dụng hàm kurtosis trong MS Excel. Khi kiểm tra một mảng dữ liệu, cũng đủ để nhập dải dữ liệu vào một hộp "Số".


Vì vậy, như chúng ta đã biết, với phân phối chuẩn, hệ số lệch và hệ số kurtosis bằng không. Nhưng điều gì sẽ xảy ra nếu chúng ta có hệ số độ lệch bằng -0,14, 0,22, 0,43 và hệ số kurtosis bằng 0,17, -0,31, 0,55? Câu hỏi này khá công bằng, vì trong thực tế, chúng ta chỉ xử lý các giá trị gần đúng, có chọn lọc của bất đối xứng và kurtosis, những giá trị này có thể xảy ra một số phân tán không thể tránh khỏi, không thể kiểm soát được. Do đó, không thể đòi hỏi sự bằng nhau nghiêm ngặt của các hệ số này bằng 0, chúng chỉ nên đủ gần bằng không. Nhưng đủ nghĩa là gì?

Yêu cầu so sánh các giá trị thực nghiệm nhận được với các giá trị có thể chấp nhận được. Để làm điều này, bạn cần kiểm tra các bất đẳng thức sau (so sánh các giá trị của modulo hệ số với các giá trị tới hạn - ranh giới của vùng kiểm tra giả thuyết).

Đối với hệ số bất đối xứng β 1 .

Sự định nghĩa. Bình thườngđược gọi là phân phối xác suất của một biến ngẫu nhiên liên tục, được mô tả bằng mật độ xác suất

Phân phối chuẩn còn được gọi là Luật Gauss.

Luật phân phối chuẩn là trọng tâm của lý thuyết xác suất. Điều này là do quy luật này thể hiện trong mọi trường hợp khi một biến ngẫu nhiên là kết quả của tác động của một số lượng lớn các yếu tố khác nhau. Tất cả các luật phân phối khác đều tiếp cận luật thông thường.

Có thể dễ dàng chỉ ra rằng các thông số , được bao gồm trong mật độ phân phối, tương ứng là kỳ vọng toán học và độ lệch chuẩn của biến ngẫu nhiên X.

Hãy tìm hàm phân phối F(x) .

Biểu đồ mật độ phân phối chuẩn được gọi là đường cong bình thường hoặc Đường cong Gaussian.

Một đường cong thông thường có các đặc tính sau:

1) Hàm được xác định trên toàn bộ trục số.

2) Cho tất cả X hàm phân phối chỉ nhận các giá trị dương.

3) Trục OX là tiệm cận ngang của đồ thị mật độ xác suất, vì với sự gia tăng không giới hạn về giá trị tuyệt đối của đối số X, giá trị của hàm có xu hướng bằng không.

4) Tìm cực trị của hàm số.

Tại vì tại y’ > 0 tại x < my’ < 0 tại x > m, sau đó tại điểm x = t hàm có giá trị lớn nhất bằng
.

5) Hàm số đối xứng với một đường thẳng x = a, tại vì Sự khác biệt

(x - a) vào hàm mật độ phân phối bình phương.

6) Để tìm các điểm uốn của đồ thị, ta tìm đạo hàm cấp hai của hàm mật độ.

Tại x = m+  và x = m-  đạo hàm cấp hai bằng 0, và khi đi qua các điểm này, nó đổi dấu, tức là tại những điểm này, hàm có một sự uốn cong.

Tại những điểm này, giá trị của hàm là
.

Hãy xây dựng một đồ thị của hàm mật độ phân phối (Hình 5).

Đồ thị được xây dựng cho t= 0 và ba giá trị có thể có của độ lệch chuẩn  = 1,  = 2 và  = 7. Như bạn thấy, khi giá trị của độ lệch chuẩn tăng lên, đồ thị trở nên phẳng hơn và giá trị lớn nhất giảm.

Nếu một một> 0, khi đó đồ thị sẽ chuyển dịch theo chiều dương nếu một < 0 – в отрицательном.

Tại một= 0 và  = 1 đường cong được gọi là bình thường hóa. Phương trình đường cong chuẩn hóa:

      Hàm Laplace

Tìm xác suất để một biến ngẫu nhiên có phân phối theo luật chuẩn rơi vào một khoảng cho trước.

Chứng tỏ

Tại vì tích phân
không được thể hiện dưới dạng các hàm cơ bản, thì hàm

,

được gọi là Hàm Laplace hoặc tích phân xác suất.

Các giá trị của hàm này cho các giá trị khác nhau Xđược tính toán và trình bày trong các bảng đặc biệt.

Trên hình. 6 cho thấy một đồ thị của hàm Laplace.

Hàm Laplace có các thuộc tính sau:

1) F (0) = 0;

2) F (-x) = - F (x);

3) F () = 1.

Hàm Laplace còn được gọi là chức năng lỗi và biểu thị erf x.

Vẫn còn sử dụng bình thường hóa hàm Laplace, có liên quan đến hàm Laplace theo quan hệ:

Trên hình. 7 cho thấy một biểu đồ của hàm Laplace chuẩn hóa.

      P quy tắc ba sigma

Khi xem xét phân phối chuẩn, một trường hợp đặc biệt quan trọng được phân biệt, được gọi là quy tắc ba sigma.

Hãy viết xác suất để độ lệch của một biến ngẫu nhiên có phân phối chuẩn so với kỳ vọng toán học nhỏ hơn một giá trị cho trước :

Nếu chúng ta chấp nhận  = 3, thì chúng ta thu được bằng cách sử dụng bảng giá trị của hàm Laplace:

Những thứ kia. xác suất mà một biến ngẫu nhiên sai lệch so với kỳ vọng toán học của nó một số tiền lớn hơn ba lần độ lệch chuẩn trên thực tế là bằng không.

Quy tắc này được gọi là quy tắc ba sigma.

Trong thực tế, người ta coi rằng nếu đối với một biến ngẫu nhiên nào đó thỏa mãn quy luật ba sigma thì biến ngẫu nhiên này có phân phối chuẩn.

Kết luận bài giảng:

Trong bài giảng, chúng ta đã xem xét các quy luật phân phối của các đại lượng liên tục, để chuẩn bị cho bài giảng tiếp theo và các bài tập thực hành, bạn nên độc lập bổ sung vào phần ghi chú bài giảng của mình bằng cách nghiên cứu sâu các tài liệu đã đề xuất và giải các bài toán đã đề xuất.