Tiểu sử Đặc trưng Phân tích

Hàm phân phối thực nghiệm, tính chất. Hàm phân phối theo kinh nghiệm Sử dụng mẫu này, xây dựng hàm phân phối theo kinh nghiệm

Như đã biết, luật phân phối của một biến ngẫu nhiên có thể được xác định theo nhiều cách khác nhau. Một biến ngẫu nhiên rời rạc có thể được xác định bằng cách sử dụng chuỗi phân phối hoặc hàm tích phân và biến ngẫu nhiên liên tục có thể được xác định bằng cách sử dụng hàm tích phân hoặc hàm vi phân. Hãy xem xét các điểm tương tự có chọn lọc của hai chức năng này.

Giả sử có một tập hợp mẫu các giá trị của một số biến thể tích ngẫu nhiên và mỗi tùy chọn từ bộ này được liên kết với tần số của nó. Hãy tiếp tục là một số thực và – số giá trị mẫu của biến ngẫu nhiên
, nhỏ hơn .Rồi số là tần số của các giá trị đại lượng quan sát được trong mẫu X, nhỏ hơn , những thứ kia. tần suất xuất hiện của sự kiện
. Khi nó thay đổi x trong trường hợp chung, giá trị cũng sẽ thay đổi . Điều này có nghĩa là tần số tương đối là một hàm của đối số . Và vì hàm này được tìm thấy từ dữ liệu mẫu thu được từ các thí nghiệm nên nó được gọi là chọn lọc hoặc thực nghiệm.

Định nghĩa 10.15. Hàm phân phối theo kinh nghiệm(hàm phân phối mẫu) là hàm
, xác định cho từng giá trị x tần suất tương đối của sự kiện
.

(10.19)

Ngược lại với hàm phân phối lấy mẫu theo kinh nghiệm, hàm phân phối F(x) của dân số nói chung được gọi là hàm phân phối lý thuyết. Sự khác biệt giữa chúng là hàm lý thuyết F(x) xác định xác suất của một sự kiện
và thực nghiệm là tần suất tương đối của cùng một sự kiện. Từ định lý Bernoulli nó suy ra

,
(10.20)

những thứ kia. nói chung xác suất
và tần suất tương đối của sự kiện
, I E.
khác nhau chút ít. Từ đó, nên sử dụng hàm phân phối thực nghiệm của mẫu để ước tính hàm phân phối lý thuyết (tích phân) của tổng thể nói chung.

Chức năng

có những tính chất giống nhau. Điều này tuân theo định nghĩa của hàm.

Của cải
:


Ví dụ 10.4. Xây dựng hàm thực nghiệm dựa trên phân phối mẫu đã cho:

Tùy chọn

Tần số

Giải pháp: Hãy tìm kích thước mẫu N= 12+18+30=60. Tùy chọn nhỏ nhất
, kể từ đây,
Tại
. Nghĩa
, cụ thể là
quan sát 12 lần, do đó:

=
Tại
.

Nghĩa x< 10, cụ thể là

được quan sát 12+18=30 lần, do đó,
=
Tại
. Tại

.

Hàm phân phối thực nghiệm cần thiết:

=

Lịch trình
thể hiện trong hình. 10.2

R
là. 10.2

Câu hỏi kiểm soát

1. Thống kê toán học giải quyết được những vấn đề chính nào? 2. Dân số chung và dân số mẫu? 3. Xác định cỡ mẫu. 4. Mẫu nào được gọi là đại diện? 5. Lỗi về tính đại diện. 6. Phương pháp lấy mẫu cơ bản. 7. Khái niệm tần số, tần số tương đối. 8. Khái niệm về chuỗi thống kê. 9. Viết công thức Sturges. 10. Xây dựng các khái niệm về khoảng mẫu, trung vị và mode. 11. Đa giác tần số, biểu đồ. 12. Khái niệm ước lượng điểm của tổng thể mẫu. 13. Ước lượng điểm thiên vị và không thiên vị. 14. Xây dựng khái niệm trung bình mẫu. 15. Xây dựng khái niệm phương sai mẫu. 16. Xây dựng khái niệm độ lệch chuẩn mẫu. 17. Xây dựng khái niệm hệ số biến thiên mẫu. 18. Xây dựng khái niệm trung bình hình học của mẫu.

Xác định hàm phân phối thực nghiệm

Cho $X$ là một biến ngẫu nhiên. $F(x)$ là hàm phân phối của một biến ngẫu nhiên nhất định. Chúng ta sẽ thực hiện $n$ thí nghiệm trên một biến ngẫu nhiên cho trước trong cùng điều kiện, độc lập với nhau. Trong trường hợp này, chúng ta thu được một chuỗi các giá trị $x_1,\ x_2\ $, ... ,$\ x_n$, được gọi là mẫu.

Định nghĩa 1

Mỗi giá trị $x_i$ ($i=1,2\ $, ... ,$ \ n$) được gọi là một biến thể.

Một ước tính của hàm phân phối lý thuyết là hàm phân phối thực nghiệm.

Định nghĩa 3

Hàm phân phối thực nghiệm $F_n(x)$ là hàm xác định tần suất tương đối của sự kiện $X \ cho mỗi giá trị $x$

trong đó $n_x$ là số lượng tùy chọn nhỏ hơn $x$, $n$ là kích thước mẫu.

Sự khác biệt giữa hàm thực nghiệm và hàm lý thuyết là hàm lý thuyết xác định xác suất của sự kiện $X

Tính chất của hàm phân phối thực nghiệm

Bây giờ chúng ta hãy xem xét một số tính chất cơ bản của hàm phân phối.

    Phạm vi của hàm $F_n\left(x\right)$ là đoạn $$.

    $F_n\left(x\right)$ là hàm không giảm.

    $F_n\left(x\right)$ là một hàm liên tục bên trái.

    $F_n\left(x\right)$ là hàm hằng từng phần và chỉ tăng tại các điểm có giá trị của biến ngẫu nhiên $X$

    Đặt $X_1$ là biến thể nhỏ nhất và $X_n$ là biến thể lớn nhất. Khi đó $F_n\left(x\right)=0$ cho $(x\le X)_1$ và $F_n\left(x\right)=1$ cho $x\ge X_n$.

Hãy để chúng tôi giới thiệu một định lý kết nối các hàm lý thuyết và thực nghiệm.

Định lý 1

Đặt $F_n\left(x\right)$ là hàm phân phối theo kinh nghiệm và $F\left(x\right)$ là hàm phân phối lý thuyết của mẫu tổng quát. Khi đó đẳng thức giữ:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Ví dụ về bài toán tìm hàm phân phối thực nghiệm

ví dụ 1

Giả sử phân phối lấy mẫu có dữ liệu sau được ghi lại bằng bảng:

Bức tranh 1.

Tìm cỡ mẫu, tạo hàm phân phối thực nghiệm và vẽ biểu đồ đó.

Cỡ mẫu: $n=5+10+15+20=50$.

Theo thuộc tính 5, chúng ta có giá trị đó cho $x\le 1$ $F_n\left(x\right)=0$ và cho $x>4$ $F_n\left(x\right)=1$.

giá trị $x

giá trị $x

giá trị $x

Vì vậy, chúng tôi nhận được:

Hình 2.

Hình 3.

Ví dụ 2

20 thành phố được chọn ngẫu nhiên từ các thành phố ở miền trung nước Nga, thu được dữ liệu sau về giá vé giao thông công cộng: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13, 13, 12, 12, 15, 14, 14.

Tạo hàm phân phối thực nghiệm cho mẫu này và vẽ đồ thị.

Hãy viết các giá trị mẫu theo thứ tự tăng dần và tính tần số của từng giá trị. Chúng tôi nhận được bảng sau:

Hinh 4.

Cỡ mẫu: $n=20$.

Theo thuộc tính 5, chúng ta có giá trị đó cho $x\le 12$ $F_n\left(x\right)=0$ và cho $x>15$ $F_n\left(x\right)=1$.

giá trị $x

giá trị $x

giá trị $x

Vì vậy, chúng tôi nhận được:

Hình 5.

Hãy vẽ đồ thị phân bố thực nghiệm:

Hình 6.

Độc đáo: $92,12\%$.

Tìm hiểu công thức thực nghiệm là gì. Trong hóa học, EP là cách đơn giản nhất để mô tả một hợp chất—về cơ bản là danh sách các nguyên tố tạo nên hợp chất, dựa trên tỷ lệ phần trăm của chúng. Cần lưu ý rằng công thức đơn giản này không mô tả đặt hàng nguyên tử trong một hợp chất, nó chỉ đơn giản cho biết nó bao gồm những nguyên tố nào. Ví dụ:

  • Một hợp chất gồm 40,92% cacbon; 4,58% hydro và 54,5% oxy sẽ có công thức thực nghiệm C 3 H 4 O 3 (ví dụ về cách tìm EF của hợp chất này sẽ được thảo luận trong phần thứ hai).
  • Hiểu thuật ngữ “thành phần phần trăm”."Thành phần phần trăm" dùng để chỉ tỷ lệ phần trăm của từng nguyên tử riêng lẻ trong toàn bộ hợp chất được đề cập. Để tìm công thức thực nghiệm của một hợp chất, bạn cần biết thành phần phần trăm của hợp chất đó. Nếu bạn đang tra cứu một công thức thực nghiệm cho bài tập về nhà thì rất có thể nó sẽ đưa ra tỷ lệ phần trăm.

    • Để tìm thành phần phần trăm của một hợp chất hóa học trong phòng thí nghiệm, người ta phải thực hiện một số thí nghiệm vật lý và sau đó phân tích định lượng. Trừ khi bạn đang ở trong phòng thí nghiệm, bạn không cần phải thực hiện những thí nghiệm này.
  • Hãy nhớ rằng bạn sẽ phải đối phó với các nguyên tử gram. Nguyên tử gram là một lượng cụ thể của một chất có khối lượng bằng khối lượng nguyên tử của nó. Để tìm nguyên tử gram, bạn cần sử dụng phương trình sau: Tỷ lệ phần trăm của một nguyên tố trong hợp chất được chia cho khối lượng nguyên tử của nguyên tố đó.

    • Ví dụ: giả sử chúng ta có một hợp chất chứa 40,92% carbon. Khối lượng nguyên tử của cacbon là 12, vì vậy phương trình của chúng ta sẽ là 40,92 / 12 = 3,41.
  • Biết cách tìm tỉ số nguyên tử. Khi làm việc với một hợp chất, bạn sẽ thu được nhiều hơn một gam nguyên tử. Sau khi tìm thấy tất cả các nguyên tử gram trong hợp chất của bạn, hãy nhìn vào chúng. Để tìm tỷ lệ nguyên tử, bạn cần chọn giá trị gam-nguyên tử nhỏ nhất mà bạn đã tính được. Sau đó, bạn sẽ cần chia tất cả các nguyên tử gram thành nguyên tử gram nhỏ nhất. Ví dụ:

    • Giả sử bạn đang làm việc với một hợp chất chứa ba nguyên tử gam: 1,5; 2 và 2,5. Số nhỏ nhất trong các số này là 1,5. Do đó, để tìm tỷ lệ của các nguyên tử, bạn phải chia tất cả các số cho 1,5 và đặt dấu tỷ lệ giữa chúng : .
    • 1,5 / 1,5 = 1. 2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Do đó tỉ số nguyên tử là 1: 1,33: 1,66 .
  • Hiểu cách chuyển đổi các giá trị tỷ lệ nguyên tử thành số nguyên. Khi viết một công thức thực nghiệm, bạn phải sử dụng số nguyên. Điều này có nghĩa là bạn không thể sử dụng các số như 1,33. Sau khi tìm được tỷ lệ của các nguyên tử, bạn cần chuyển phân số (như 1,33) thành số nguyên (như 3). Để làm điều này, bạn cần tìm một số nguyên, nhân từng số của tỷ lệ nguyên tử với đó bạn sẽ nhận được số nguyên. Ví dụ:

    • Hãy thử 2. Nhân các số có tỷ số nguyên tử (1, 1,33 và 1,66) với 2. Bạn nhận được 2, 2,66 và 3,32. Đây không phải là số nguyên nên 2 không phù hợp.
    • Hãy thử 3. Nếu bạn nhân 1, 1,33 và 1,66 với 3, bạn sẽ nhận được 3, 4 và 5 tương ứng. Do đó tỉ số nguyên tử của các số nguyên có dạng 3: 4: 5 .
  • Trung bình mẫu.

    Lấy một mẫu có kích thước n để nghiên cứu tổng thể chung về đặc tính định lượng X.

    Giá trị trung bình mẫu là giá trị trung bình số học của một đặc tính trong một quần thể mẫu.

    Phương sai mẫu.

    Để quan sát sự phân tán của đặc tính định lượng của các giá trị mẫu xung quanh giá trị trung bình của nó, một đặc tính tóm tắt được đưa ra - phương sai mẫu.

    Phương sai mẫu là giá trị trung bình số học của bình phương độ lệch của các giá trị quan sát được của một đặc tính so với giá trị trung bình của chúng.

    Nếu tất cả các giá trị của đặc tính mẫu là khác nhau thì

    Đã hiệu chỉnh phương sai.

    Phương sai mẫu là ước tính sai lệch của phương sai tổng thể, tức là kỳ vọng toán học của phương sai mẫu không bằng phương sai chung ước tính, nhưng bằng

    Để hiệu chỉnh phương sai mẫu, chỉ cần nhân nó với phân số

    Hệ số tương quan mẫuđược tìm thấy bởi công thức

    đâu là độ lệch chuẩn mẫu của các giá trị và .

    Hệ số tương quan mẫu cho thấy mối quan hệ tuyến tính chặt chẽ giữa và : càng gần thống nhất thì mối quan hệ tuyến tính giữa và càng chặt chẽ.

    23. Đa giác tần số là một đường đứt nét có các đoạn nối các điểm. Để xây dựng một đa giác tần số, các biến thể được vẽ trên trục abscissa và các tần số tương ứng được vẽ trên trục tọa độ và các điểm được kết nối bằng các đoạn đường.

    Đa giác tần số tương đối được xây dựng theo cách tương tự, ngoại trừ tần số tương đối được vẽ trên trục tọa độ.

    Biểu đồ tần số là một hình bậc bao gồm các hình chữ nhật, các đáy của chúng là các khoảng một phần có chiều dài h và chiều cao bằng tỷ lệ. Để xây dựng biểu đồ tần số, các khoảng từng phần được bố trí trên trục hoành độ và các đoạn song song với trục hoành độ ở một khoảng cách (chiều cao) được vẽ phía trên chúng. Diện tích của hình chữ nhật thứ i bằng tổng tần số của khoảng i-o, do đó diện tích của biểu đồ tần số bằng tổng của tất cả các tần số, tức là. cỡ mẫu.

    Hàm phân phối theo kinh nghiệm

    Ở đâu nx- số lượng giá trị mẫu nhỏ hơn x; N- cỡ mẫu.

    22Chúng ta hãy xác định các khái niệm cơ bản của thống kê toán học

    .Các khái niệm cơ bản của thống kê toán học. Dân số và mẫu. Chuỗi biến thiên, chuỗi thống kê. Mẫu được nhóm. Chuỗi thống kê được nhóm. Đa giác tần số. Hàm phân phối mẫu và biểu đồ.

    Dân số– toàn bộ tập hợp các đối tượng có sẵn.

    Vật mẫu– một tập hợp các đối tượng được chọn ngẫu nhiên từ tổng thể chung.

    Một chuỗi các lựa chọn được viết theo thứ tự tăng dần được gọi là biến thểở gần đó và danh sách các tùy chọn cũng như tần số tương ứng hoặc tần số tương đối của chúng - loạt thống kê: được chọn ngẫu nhiên từ tổng thể.

    Đa giác tần số được gọi là đường đứt nét, các đoạn nối các điểm.

    biểu đồ tần số là một hình bậc bao gồm các hình chữ nhật, các đáy của chúng là các đoạn có chiều dài h và chiều cao bằng tỷ lệ .

    Hàm phân phối mẫu (theo kinh nghiệm) gọi hàm F*(x), xác định cho từng giá trị X tần suất tương đối của sự kiện X< x.

    Nếu một số đặc điểm liên tục đang được nghiên cứu thì chuỗi biến thể có thể bao gồm một số lượng rất lớn các số. Trong trường hợp này sẽ thuận tiện hơn khi sử dụng mẫu được nhóm. Để có được nó, khoảng chứa tất cả các giá trị quan sát được của thuộc tính được chia thành nhiều khoảng có độ dài bằng nhau h, rồi tìm cho mỗi khoảng từng phần và tôi– tổng tần số của biến thể có trong Tôi khoảng thứ.

    20. Không nên hiểu luật số lớn như bất kỳ một luật chung nào gắn liền với số lớn. Định luật số lớn là tên gọi tổng quát cho một số định lý, từ đó suy ra rằng với sự gia tăng không giới hạn số lần thử, các giá trị trung bình có xu hướng trở thành một hằng số nhất định.

    Chúng bao gồm các định lý của Chebyshev và Bernoulli. Định lý Chebyshev là định luật tổng quát nhất về số lớn.

    Chứng minh của các định lý, được thống nhất bởi thuật ngữ “luật số lớn”, dựa trên bất đẳng thức Chebyshev, bất đẳng thức này thiết lập xác suất sai lệch so với kỳ vọng toán học của nó:

    19Phân phối Pearson (chi - bình phương) - phân phối của một biến ngẫu nhiên

    các biến ngẫu nhiên ở đâu X 1, X 2,…, Xnđộc lập và có cùng phân phối N(0,1). Trong trường hợp này, số lượng các điều khoản, tức là. N, được gọi là “số bậc tự do” của phân bố chi bình phương.

    Phân phối chi bình phương được sử dụng khi ước tính phương sai (sử dụng khoảng tin cậy), khi kiểm tra các giả thuyết về tính đồng nhất, tính đồng nhất, tính độc lập,

    Phân bổ t Sinh viên t là phân phối của một biến ngẫu nhiên

    các biến ngẫu nhiên ở đâu bạnXđộc lập, bạn có phân phối chuẩn chuẩn N(0,1) và X– phân phối chi – bình phương c N bậc tự do. trong đó Nđược gọi là “số bậc tự do” của phân phối Sinh viên.

    Nó được sử dụng khi ước tính kỳ vọng toán học, giá trị dự báo và các đặc điểm khác bằng khoảng tin cậy, kiểm tra các giả thuyết về giá trị của kỳ vọng toán học, hệ số hồi quy,

    Phân phối Fisher là phân phối của một biến ngẫu nhiên

    Phân phối Fisher được sử dụng khi kiểm tra các giả thuyết về tính đầy đủ của mô hình trong phân tích hồi quy, sự bằng nhau của phương sai và trong các vấn đề khác của thống kê ứng dụng.

    18Hồi quy tuyến tính là một công cụ thống kê dùng để dự đoán giá trong tương lai dựa trên dữ liệu trong quá khứ và thường được dùng để xác định khi nào giá quá nóng. Phương pháp bình phương tối thiểu được sử dụng để xây dựng một đường thẳng “phù hợp nhất” thông qua một loạt các điểm giá trị. Các điểm giá được sử dụng làm đầu vào có thể là bất kỳ điểm nào sau đây: mở, đóng, cao, thấp,

    17. Biến ngẫu nhiên hai chiều là tập hợp có thứ tự của hai biến ngẫu nhiên hoặc .

    Ví dụ: Gieo hai con xúc xắc. – số điểm gieo được ở xúc xắc thứ nhất và thứ hai tương ứng

    Một cách phổ biến để xác định luật phân phối của biến ngẫu nhiên hai chiều là hàm phân phối.

    15.m.o Biến ngẫu nhiên rời rạc

    Của cải:

    1) M(C) = C, C- không thay đổi;

    2) M(CX) = C.M.(X);

    3) M(X 1 + X 2) = M(X 1) + M(X 2), Ở đâu X 1, X 2- các biến ngẫu nhiên độc lập;

    4) M(X 1 X 2) = M(X 1)M(X 2).

    Kỳ vọng toán học của tổng các biến ngẫu nhiên bằng tổng kỳ vọng toán học của chúng, tức là

    Kỳ vọng toán học về sự khác biệt giữa các biến ngẫu nhiên bằng với sự khác biệt về kỳ vọng toán học của chúng, tức là

    Kỳ vọng toán học của tích của các biến ngẫu nhiên bằng tích của kỳ vọng toán học của chúng, tức là

    Nếu tất cả các giá trị của một biến ngẫu nhiên đều tăng (giảm) cùng một số C thì kỳ vọng toán học của nó sẽ tăng (giảm) cùng một số

    14. số mũ(số mũ)luật phân phối X có quy luật phân bố hàm mũ với tham số λ >0 nếu mật độ xác suất của nó có dạng:

    Gia trị được ki vọng: .

    Độ phân tán: .

    Luật phân phối mũ đóng một vai trò lớn trong lý thuyết xếp hàng và lý thuyết độ tin cậy.

    13. Định luật phân phối chuẩn được đặc trưng bởi tần số hư hỏng a(t) hoặc mật độ xác suất hư hỏng f(t) có dạng:

    , (5.36)

    trong đó σ là độ lệch chuẩn của SV x;

    tôi x– kỳ vọng toán học của SV x. Thông số này thường được gọi là tâm phân tán hoặc giá trị có xác suất lớn nhất của SV X.

    x– một biến ngẫu nhiên, có thể được lấy làm thời gian, giá trị dòng điện, giá trị điện áp và các đối số khác.

    Luật thông thường là luật hai tham số, để viết được bạn cần biết x và σ.

    Phân phối chuẩn (phân phối Gaussian) được sử dụng để đánh giá độ tin cậy của sản phẩm bị ảnh hưởng bởi một số yếu tố ngẫu nhiên, mỗi yếu tố có ảnh hưởng nhỏ đến hiệu ứng thu được

    12. Luật phân phối thống nhất. Biến ngẫu nhiên liên tục X có quy luật phân bố đồng đều trên đoạn [ Một, b], nếu mật độ xác suất của nó không đổi trên đoạn này và bằng 0 bên ngoài nó, tức là

    Ký hiệu: .

    Gia trị được ki vọng: .

    Độ phân tán: .

    Giá trị ngẫu nhiên X, phân bố theo quy luật thống nhất trên đoạn đó được gọi là số ngẫu nhiên từ 0 đến 1. Nó đóng vai trò là nguyên liệu ban đầu để thu được các biến ngẫu nhiên với bất kỳ luật phân phối nào. Luật phân phối đồng nhất được sử dụng trong phân tích các lỗi làm tròn khi thực hiện các phép tính số, trong một loạt các bài toán xếp hàng, trong mô hình thống kê các quan sát tuân theo một phân bố nhất định.

    11. Sự định nghĩa. Mật độ phân bố xác suất của biến ngẫu nhiên liên tục X được gọi là hàm f(x)– đạo hàm bậc nhất của hàm phân phối F(x).

    Mật độ phân bố còn được gọi là hàm vi phân. Để mô tả một biến ngẫu nhiên rời rạc, mật độ phân bố là không thể chấp nhận được.

    Ý nghĩa của mật độ phân bố là nó cho biết tần suất xuất hiện của một biến ngẫu nhiên X trong một vùng lân cận nhất định của một điểm. X khi lặp lại thí nghiệm.

    Sau khi giới thiệu các hàm phân phối và mật độ phân phối, có thể đưa ra định nghĩa sau về biến ngẫu nhiên liên tục.

    10. Mật độ xác suất, mật độ phân bố xác suất của biến ngẫu nhiên x, là hàm p(x) sao cho

    và với bất kỳ a< b вероятность события a < x < b равна
    .

    Nếu p(x) là liên tục thì với ∆x đủ nhỏ xác suất bất đẳng thức x< X < x+∆x приближенно равна p(x) ∆x (с точностью до малых более высокого порядка). Функция распределения F(x) случайной величины x, связана с плотностью распределения соотношениями

    và nếu F(x) khả vi thì