Tiểu sử Đặc điểm Phân tích

Tìm khoảng tin cậy cho kỳ vọng toán học. Ví dụ về các nhiệm vụ để tìm khoảng tin cậy

Và những người khác. Tất cả chúng đều là ước tính của các đối chứng lý thuyết của chúng, có thể thu được nếu không có mẫu mà là tổng thể chung. Nhưng than ôi, dân số nói chung rất đắt và thường không có sẵn.

Khái niệm về ước lượng khoảng thời gian

Bất kỳ ước tính mẫu nào cũng có một số phân tán, bởi vì là một biến ngẫu nhiên phụ thuộc vào các giá trị trong một mẫu cụ thể. Do đó, để có kết luận thống kê đáng tin cậy hơn, người ta không chỉ nên biết ước tính điểm, mà còn là một khoảng thời gian, với xác suất cao γ (gamma) bao gồm chỉ báo ước tính θ (theta).

Về mặt hình thức, đây là hai giá trị như vậy (thống kê) T1 (X)T2 (X), Gì T1< T 2 , mà ở một mức xác suất nhất định γ điều kiện được đáp ứng:

Trong ngắn hạn, nó có khả năng γ trở lên giá trị thực nằm giữa các điểm T1 (X)T2 (X), được gọi là giới hạn dưới và giới hạn trên khoảng tin cậy.

Một trong những điều kiện để xây dựng khoảng tin cậy là độ hẹp tối đa của nó, tức là nó phải càng ngắn càng tốt. Mong muốn là khá tự nhiên, bởi vì. nhà nghiên cứu cố gắng xác định vị trí chính xác hơn việc tìm kiếm tham số mong muốn.

Theo đó, khoảng tin cậy phải bao hàm các xác suất tối đa của phân phối. và bản thân điểm số là trung tâm.

Nghĩa là, xác suất độ lệch (của chỉ số thực so với ước tính) trở lên bằng xác suất độ lệch hướng xuống. Cũng cần lưu ý rằng đối với các phân phối lệch, khoảng ở bên phải không bằng khoảng bên trái.

Hình trên cho thấy rõ ràng rằng mức độ tin cậy càng lớn thì khoảng - mối quan hệ trực tiếp càng rộng.

Đây là một phần giới thiệu nhỏ về lý thuyết ước tính khoảng thời gian tham số không xác định. Hãy chuyển sang việc tìm giới hạn tin cậy cho kỳ vọng toán học.

Khoảng tin cậy cho kỳ vọng toán học

Nếu dữ liệu gốc được phân phối nhiều hơn, thì giá trị trung bình sẽ là một giá trị bình thường. Điều này tuân theo quy tắc rằng kết hợp tuyến tính của các giá trị chuẩn cũng có phân phối chuẩn. Do đó, để tính toán xác suất, chúng ta có thể sử dụng bộ máy toán học luật phân phối chuẩn.

Tuy nhiên, điều này sẽ yêu cầu kiến ​​thức về hai tham số - giá trị kỳ vọng và phương sai, thường không được biết đến. Tất nhiên, bạn có thể sử dụng các ước tính thay vì tham số (trung bình số học và), nhưng khi đó phân phối của giá trị trung bình sẽ không hoàn toàn bình thường, nó sẽ bị làm phẳng một chút. Công dân William Gosset của Ireland đã đặc biệt ghi nhận thực tế này khi ông công bố khám phá của mình trên tạp chí Biometrica tháng 3 năm 1908. Vì mục đích bí mật, Gosset đã ký với Student. Đây là cách phân phối t của Student xuất hiện.

Tuy nhiên, phân phối chuẩn của dữ liệu được K. Gauss sử dụng trong phân tích sai số quan sát thiên văn, cực kỳ hiếm trong cuộc sống trần thế và rất khó để thiết lập điều này (đối với độ chính xác cao khoảng 2.000 quan sát là cần thiết). Do đó, tốt nhất là bỏ giả định về tính chuẩn mực và sử dụng các phương pháp không phụ thuộc vào sự phân bố của dữ liệu gốc.

Câu hỏi đặt ra: phân phối của trung bình cộng là gì nếu nó được tính từ dữ liệu của một phân phối chưa biết? Câu trả lời được đưa ra bởi lý thuyết xác suất nổi tiếng Trung tâm định lý giới hạn (CPT). Trong toán học, có một số phiên bản của nó (các công thức đã được tinh chỉnh trong nhiều năm), nhưng, nói một cách đại khái, tất cả chúng đều đi đến tuyên bố rằng tổng một số lượng lớn các biến ngẫu nhiên độc lập tuân theo luật phân phối chuẩn.

Khi tính giá trị trung bình cộng, tổng các biến ngẫu nhiên được sử dụng. Từ đó nó chỉ ra rằng giá trị trung bình số học có phân phối chuẩn, trong đó giá trị kỳ vọng là giá trị kỳ vọng của dữ liệu gốc và phương sai là.

Người thông minh biết cách chứng minh CLT, nhưng chúng tôi sẽ xác minh điều này với sự trợ giúp của một thử nghiệm được thực hiện trong Excel. Hãy mô phỏng một mẫu gồm 50 biến ngẫu nhiên được phân phối đồng đều (sử dụng Hàm Excel NGẪU NHIÊN). Sau đó, chúng tôi sẽ tạo ra 1000 mẫu như vậy và tính giá trị trung bình cộng cho mỗi mẫu. Hãy xem sự phân bố của chúng.

Có thể thấy rằng phân phối của số trung bình là gần với quy luật thông thường. Nếu khối lượng mẫu và số lượng của chúng càng lớn, thì độ giống nhau càng tốt.

Bây giờ chúng ta đã tự mình thấy tính hợp lệ của CLT, chúng ta có thể, sử dụng, tính toán khoảng tin cậy cho giá trị trung bình số học, bao gồm giá trị trung bình thực sự hoặc kỳ vọng toán học với một xác suất nhất định.

Để đặt giới hạn trên và giới hạn dưới, bạn cần biết các thông số phân phối bình thường. Do đó, theo quy luật, chúng không được sử dụng: trung bình cộngphương sai mẫu . Một lần nữa, phương pháp này chỉ đưa ra giá trị gần đúng cho các mẫu lớn. Khi các mẫu nhỏ, thường nên sử dụng phân phối của Student. Đừng tin! Phân phối của Student cho giá trị trung bình chỉ xảy ra khi dữ liệu gốc có phân phối chuẩn, tức là hầu như không bao giờ. Do đó, tốt hơn là ngay lập tức đặt thanh tối thiểu cho lượng dữ liệu cần thiết và sử dụng các phương pháp tiệm cận đúng. Họ nói rằng 30 quan sát là đủ. Lấy 50 - bạn không thể sai.

T 1,2 là giới hạn dưới và giới hạn trên của khoảng tin cậy

- trung bình cộng mẫu

s0- độ lệch chuẩn mẫu (không thiên vị)

N - cỡ mẫu

γ - mức độ tin cậy (thường bằng 0,9, 0,95 hoặc 0,99)

c γ = Φ -1 ((1 + γ) / 2)nghĩa ngược các hàm phân phối chuẩn chuẩn. Nói một cách dễ hiểu, đây là số lỗi tiêu chuẩn từ trung bình cộng đến giới hạn dưới hoặc giới hạn trên (ba xác suất được chỉ ra tương ứng với các giá trị \ u200b \ u200bof 1,64, 1,96 và 2,58).

Bản chất của công thức là giá trị trung bình số học được lấy và sau đó một số tiền nhất định được tách ra khỏi nó ( với γ) lỗi tiêu chuẩn ( s 0 / √n). Mọi thứ đều đã biết, hãy nắm lấy nó và tính toán.

Trước khi sử dụng hàng loạt PC, họ đã sử dụng các giá trị của hàm phân phối chuẩn và nghịch đảo của nó. Chúng vẫn đang được sử dụng, nhưng chuyển sang chế biến sẵn sẽ hiệu quả hơn Công thức Excel. Tất cả các phần tử từ công thức trên (và) có thể được tính toán dễ dàng trong Excel. Nhưng cũng có một công thức làm sẵn để tính khoảng tin cậy - BÃO MẬT. Cú pháp của nó như sau.

THÔNG TIN MẬT MÃ (alpha, standard_dev, size)

alpha- mức ý nghĩa hoặc mức độ tự tin, trong ký hiệu trên bằng 1- γ, tức là xác suất mà toán họckỳ vọng sẽ nằm ngoài khoảng tin cậy. Với mức độ tin cậy là 0,95, alpha là 0,05, v.v.

standard_off là độ lệch chuẩn của dữ liệu mẫu. Bạn không cần tính sai số chuẩn, Excel sẽ chia cho căn bậc n.

kích cỡ- cỡ mẫu (n).

Kết quả của hàm CONFIDENCE.NORM là số hạng thứ hai từ công thức tính khoảng tin cậy, tức là nửa khoảng. Theo đó, điểm dưới và điểm trên là giá trị trung bình ± giá trị thu được.

Như vậy, có thể xây dựng một thuật toán phổ quát để tính khoảng tin cậy cho giá trị trung bình cộng, thuật toán này không phụ thuộc vào sự phân bố của dữ liệu ban đầu. Cái giá phải trả cho tính phổ quát là bản chất tiệm cận của nó, tức là nhu cầu sử dụng mẫu tương đối lớn. Tuy nhiên, trong thế kỷ công nghệ hiện đại sưu tầm đúng số lượng dữ liệu thường không khó.

Kiểm tra các giả thuyết thống kê bằng cách sử dụng khoảng tin cậy

(mô-đun 111)

Một trong những vấn đề chính được giải quyết trong thống kê là. Tóm lại, bản chất của nó là thế này. Ví dụ, giả thuyết rằng kỳ vọng dân số bằng một giá trị nào đó. Sau đó, sự phân bố của các phương tiện mẫu được xây dựng, có thể được quan sát với một kỳ vọng nhất định. Tiếp theo, chúng ta xem xét vị trí trong phân phối có điều kiện này, giá trị trung bình thực nằm ở đâu. Nếu nó vượt quá giới hạn cho phép, thì việc xuất hiện một giá trị trung bình như vậy là rất khó xảy ra, và với một lần lặp lại thí nghiệm thì điều đó gần như là không thể, điều này mâu thuẫn với giả thuyết đã đưa ra, vốn đã bị bác bỏ thành công. Nếu trung bình không vượt ra ngoài mức độ quan trọng, thì giả thuyết không bị bác bỏ (nhưng không được chứng minh!).

Vì vậy, với sự trợ giúp của khoảng tin cậy, trong trường hợp của chúng tôi đối với kỳ vọng, bạn cũng có thể kiểm tra một số giả thuyết. Nó rất dễ dàng để làm. Giả sử trung bình cộng của một mẫu nhất định là 100. Giả thuyết đang được kiểm định rằng kỳ vọng là 90. Nghĩa là, nếu chúng ta đặt câu hỏi một cách ban đầu, thì nó sẽ giống như sau: ý nghĩa thật sự trung bình bằng 90, trung bình quan sát được bằng 100?

Để trả lời câu hỏi này, thông tin bổ sung về mức trung bình độ lệch chuẩn và kích thước mẫu. Hãy cùng nói nào độ lệch chuẩn là 30 và số lần quan sát là 64 (để dễ dàng rút gốc). Khi đó, sai số tiêu chuẩn của giá trị trung bình là 30/8 hoặc 3,75. Để tính toán khoảng tin cậy 95%, sẽ cần phải lùi về cả hai phía của giá trị trung bình là hai lỗi tiêu chuẩn(chính xác hơn là 1,96). Khoảng tin cậy sẽ xấp xỉ 100 ± 7,5, hoặc từ 92,5 đến 107,5.

Lý luận sâu hơn như sau. Nếu giá trị được kiểm tra nằm trong khoảng tin cậy, thì nó không mâu thuẫn với giả thuyết, vì phù hợp với giới hạn của dao động ngẫu nhiên (với xác suất 95%). Nếu điểm được kiểm tra nằm ngoài khoảng tin cậy, thì khả năng xảy ra sự kiện như vậy là rất nhỏ, trong mọi trường hợp đều dưới mức có thể chấp nhận được. Do đó, giả thuyết bị bác bỏ vì mâu thuẫn với dữ liệu quan sát. Trong trường hợp của chúng tôi, giả thuyết kỳ vọng nằm ngoài khoảng tin cậy (giá trị 90 đã kiểm định không nằm trong khoảng 100 ± 7,5), vì vậy nó nên bị bác bỏ. Trả lời câu hỏi cơ bản ở trên, người ta nên nói: không, nó không thể, trong mọi trường hợp, điều này cực kỳ hiếm khi xảy ra. Thông thường, điều này chỉ ra một xác suất cụ thể của việc bác bỏ giả thuyết (mức p), và không phải là một mức nhất định, theo đó khoảng tin cậy được xây dựng, nhưng nhiều hơn vào thời điểm khác.

Như bạn thấy, không khó để xây dựng khoảng tin cậy cho giá trị trung bình (hoặc kỳ vọng toán học). Điều chính là để nắm bắt bản chất, và sau đó mọi thứ sẽ đi. Trong thực tế, hầu hết sử dụng khoảng tin cậy 95%, khoảng hai sai số chuẩn ở hai phía của giá trị trung bình.

Đó là tất cả cho bây giờ. Tất cả những gì tốt nhất!

Khoảng tin cậy- giá trị giới hạn thống kê, với xác suất tin cậy cho trước γ sẽ nằm trong khoảng này với cỡ mẫu lớn hơn. Được ký hiệu là P (θ - ε. Trong thực tế, hãy chọn mức độ tự tinγ từ các giá trị γ = 0,9, γ = 0,95, γ = 0,99 đủ gần với sự thống nhất.

Phân công dịch vụ. Dịch vụ này xác định:

  • khoảng tin cậy cho giá trị trung bình chung, khoảng tin cậy cho phương sai;
  • khoảng tin cậy cho độ lệch chuẩn, khoảng tin cậy cho phân số tổng quát;
Giải pháp kết quả được lưu trong tệp Word (xem ví dụ). Dưới đây là video hướng dẫn cách điền dữ liệu ban đầu.

Ví dụ 1. Trong một trang trại tập thể, trong tổng số 1.000 con cừu, có 100 con cừu bị xén lông có chọn lọc. Kết quả là, mức cắt lông cừu trung bình là 4,2 kg cho mỗi con cừu được thiết lập. Xác định với xác suất 0,99 sai số tiêu chuẩn của mẫu trong việc xác định độ cắt lông cừu trung bình trên mỗi con cừu và các giới hạn trong đó giá trị độ cắt nằm nếu phương sai là 2,5. Mẫu không hoạt động.
Ví dụ # 2. Từ lô sản phẩm nhập khẩu tại bưu cục của Hải quan Bắc Mátxcơva được lấy theo thứ tự ngẫu nhiên lấy mẫu lại 20 mẫu sản phẩm "A". Kết quả của việc kiểm tra, độ ẩm trung bình của sản phẩm "A" trong mẫu được thiết lập, hóa ra là 6% với mức trung bình độ lệch chuẩn 1 %.
Xác định với xác suất 0,683 giới hạn độ ẩm trung bình của sản phẩm trong toàn bộ lô sản phẩm nhập khẩu.
Ví dụ # 3. Một cuộc khảo sát với 36 sinh viên cho thấy rằng số lượng sách giáo khoa trung bình mà họ đọc trong năm học, hóa ra bằng 6. Giả sử rằng số lượng sách giáo khoa mà một học sinh đọc trong mỗi học kỳ có luật bình thường phân phối có độ lệch chuẩn bằng 6, tìm: A) với độ tin cậy 0,99 ước tính khoảng thời gian cho kỳ vọng toán học của điều này biến ngẫu nhiên; B) với xác suất nào có thể lập luận rằng số sách giáo khoa trung bình mà một học sinh đọc trong mỗi học kỳ, được tính cho mẫu này, sẽ sai lệch so với kỳ vọng toán học bằng giá trị tuyệt đối không quá 2.

Phân loại khoảng tin cậy

Theo loại tham số đang được đánh giá:

Theo loại mẫu:

  1. Khoảng tin cậy để lấy mẫu vô hạn;
  2. Khoảng tin cậy cho mẫu cuối cùng;
Lấy mẫu được gọi là lấy mẫu lại, nếu đối tượng đã chọn được trả về tổng thể trước khi chọn đối tượng tiếp theo. Mẫu được gọi là không lặp lại. nếu đối tượng đã chọn không được trả về tổng thể chung. Trong thực tế, người ta thường xử lý các mẫu không lặp lại.

Tính toán sai số lấy mẫu trung bình cho lựa chọn ngẫu nhiên

Sự khác biệt giữa giá trị của các chỉ số thu được từ mẫu và các tham số tương ứng của tổng thể chung được gọi là lỗi tính đại diện.
Các chỉ định của các tham số chính của tổng thể chung và tổng thể mẫu.
Công thức lỗi trung bình mẫu
sự lựa chọn lạilựa chọn không lặp lại
cho giữađể chia sẻcho giữađể chia sẻ
Tỷ lệ giữa giới hạn lỗi lấy mẫu (Δ) được đảm bảo với một số xác suất P (t),lỗi trung bình mẫu có dạng: hoặc Δ = t μ, trong đó t- hệ số tin cậy, được xác định phụ thuộc vào mức xác suất P (t) theo bảng của hàm Laplace tích phân.

Công thức tính cỡ mẫu với phương pháp chọn ngẫu nhiên thích hợp

Hãy để một mẫu được thực hiện từ một dân số chung tuân theo luật thông thường phân bổ XN ( m; ). Giả thiết cơ bản này của thống kê toán học dựa trên định lý giới hạn trung tâm. Hãy cho biết độ lệch chuẩn chung , nhưng kỳ vọng toán học của phân phối lý thuyết là không xác định m(bần tiện ).

Trong trường hợp này, mẫu có nghĩa là , thu được trong quá trình thử nghiệm (phần 3.4.2), cũng sẽ là một biến ngẫu nhiên m;
). Sau đó, độ lệch "chuẩn hóa"
N (0; 1) là biến ngẫu nhiên thông thường chuẩn.

Vấn đề là tìm một ước lượng khoảng thời gian cho m. Hãy để chúng tôi xây dựng khoảng tin cậy hai phía cho m để kỳ vọng toán học thực sự thuộc về anh ta với một xác suất nhất định (độ tin cậy) .

Đặt khoảng thời gian như vậy cho giá trị
nghĩa là tìm giá trị lớn nhất của đại lượng này
và tối thiểu
, đó là ranh giới của vùng quan trọng:
.

Tại vì xác suất này là
, thì căn của phương trình này
có thể được tìm thấy bằng cách sử dụng các bảng của hàm Laplace (Bảng 3, Phụ lục 1).

Sau đó với xác suất có thể lập luận rằng biến ngẫu nhiên
, nghĩa là, giá trị trung bình chung mong muốn thuộc về khoảng
. (3.13)

giá trị
(3.14)

gọi là sự chính xácước tính.

Con số
lượng tử phân phối chuẩn - có thể được tìm thấy như một đối số của hàm Laplace (Bảng 3, Phụ lục 1), với tỷ lệ 2Ф ( u)=, I E. F ( u)=
.

Quay lại đặt giá trị sai lệch có thể tìm thấy với xác suất nào mà giá trị trung bình chung chưa biết thuộc về khoảng
. Để làm được điều này, bạn cần tính toán

. (3.15)

Cho một mẫu ngẫu nhiên được lấy từ tổng thể chung bằng phương pháp chọn lại. Từ phương trình
có thể được tìm thấy tối thiểu lấy lại mẫu âm lượng N cần thiết để đảm bảo rằng khoảng tin cậy với độ tin cậy nhất định không vượt quá giá trị đặt trước . Cỡ mẫu yêu cầu được ước tính theo công thức:

. (3.16)

Khám phá ước tính độ chính xác
:

1) Với kích thước mẫu ngày càng tăng N kích cỡ giảm và do đó độ chính xác của ước tính tăng.

2) C tăngđộ tin cậy của các ước tính giá trị của đối số được tăng lên u(tại vì F(u) tăng đơn điệu) và do đó tăng . Trong trường hợp này, sự gia tăng độ tin cậy giảm bớtđộ chính xác của đánh giá của nó .

Ước tính
(3.17)

gọi là cổ điển(ở đâu t là một tham số phụ thuộc vào N), tại vì nó đặc trưng cho các luật phân phối thường gặp nhất.

3.5.3 Khoảng tin cậy để ước tính kỳ vọng của phân phối chuẩn với độ lệch chuẩn chưa biết 

Biết rằng quần thể nói chung tuân theo quy luật phân phối chuẩn XN ( m;), giá trị ở đâu căn bậc hai có nghĩa là sai lệch không xác định.

Để xây dựng khoảng tin cậy để ước tính giá trị trung bình chung, trong trường hợp này, thống kê được sử dụng
, có phân phối Sinh viên với k= N–1 bậc tự do. Điều này xuất phát từ thực tế rằng N (0; 1) (xem mục 3.5.2), và
(xem điều 3.5.3) và từ định nghĩa phân phối của Student (phần 1. điều 2.11.2).

Hãy để chúng tôi tìm độ chính xác của ước lượng cổ điển của phân phối Student: tức là tìm thấy t từ công thức (3.17). Giả sử xác suất thực hiện bất đẳng thức
được đưa ra bởi độ tin cậy :

. (3.18)

TSt ( N-1), rõ ràng là t phụ thuộc N, vì vậy chúng tôi thường viết
.

(3.19)

ở đâu
là hàm phân phối của Student với N-1 bậc tự do.

Giải phương trình này cho m, chúng tôi nhận được khoảng thời gian
với độ tin cậy  bao hàm tham số không xác định m.

Giá trị t , N-1, được sử dụng để xác định khoảng tin cậy của một biến ngẫu nhiên T(N-1), được phân phối bởi Sinh viên với N-1 bậc tự do được gọi là Hệ số của sinh viên. Nó phải được tìm thấy bởi các giá trị đã cho N và  từ các bảng " Điểm quan trọng Các phân phối của sinh viên. (Bảng 6, Phụ lục 1), là các nghiệm của phương trình (3.19).

Kết quả là, chúng tôi nhận được biểu thức sau sự chính xác khoảng tin cậy để ước tính kỳ vọng toán học (giá trị trung bình chung), nếu phương sai là không xác định:

(3.20)

Do đó, có một công thức chung để xây dựng khoảng tin cậy cho kỳ vọng toán học của dân số chung:

độ chính xác của khoảng tin cậy ở đâu tùy thuộc vào phương sai đã biết hoặc chưa biết được tìm theo các công thức tương ứng là 3.16. và 3,20.

Nhiệm vụ 10. Một số thử nghiệm đã được thực hiện, kết quả được liệt kê trong bảng:

x tôi

Người ta biết rằng chúng tuân theo luật phân phối chuẩn với
. Tìm một ước tính m* cho kỳ vọng toán học m, xây dựng khoảng tin cậy 90% cho nó.

Dung dịch:

Vì thế, m(2.53;5.47).

Nhiệm vụ 11.Độ sâu của biển được đo bằng một công cụ có sai số hệ thống là 0 và sai số ngẫu nhiên được phân bổ theo quy luật thông thường, với độ lệch chuẩn = 15phút. Cần thực hiện bao nhiêu phép đo độc lập để xác định độ sâu với sai số không quá 5 m với độ tin cậy 90%?

Dung dịch:

Theo điều kiện của vấn đề, chúng tôi có XN ( m; ), ở đâu = 15 m, = 5m, = 0,9. Hãy tìm khối lượng N.

1) Với độ tin cậy cho trước  = 0,9, từ bảng 3 (Phụ lục 1) chúng ta tìm được đối số của hàm Laplace u = 1.65.

2) Biết được độ chính xác của ước tính đã cho =u= 5, tìm
. Chúng ta có

. Do đó, số lần thử N25.

Nhiệm vụ 12. Lấy mẫu nhiệt độ t trong 6 ngày đầu tiên của tháng 1 được trình bày trong bảng:

Tìm khoảng tin cậy cho kỳ vọng m dân số chung với xác suất tin cậy
và đánh giá chung độ lệch chuẩn S.

Dung dịch:



.

2) Ước tính không chệch tìm theo công thức
:

=-175

=234.84

;
;

=-192

=116


.

3) Vì phương sai tổng quát là chưa biết, nhưng ước lượng của nó đã được biết, do đó để ước tính kỳ vọng toán học m chúng tôi sử dụng phân phối Student (Bảng 6, Phụ lục 1) và công thức (3.20).

Tại vì N 1 =N 2 = 6, sau đó,
, S 1 = 6,85 ta có:
, do đó -29,2-4,1<m 1 < -29.2+4.1.

Do đó -33,3<m 1 <-25.1.

Tương tự, chúng tôi có
, S 2 = 4,8, vì vậy

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1  (-33,3; -25,1) và m 2 (-34.9;-29.1).

Trong khoa học ứng dụng, ví dụ, trong các ngành xây dựng, bảng khoảng tin cậy được sử dụng để đánh giá độ chính xác của các đối tượng, được đưa ra trong các tài liệu tham khảo có liên quan.

Bạn có thể sử dụng biểu mẫu tìm kiếm này để tìm nhiệm vụ phù hợp. Nhập một từ, một cụm từ nhiệm vụ hoặc số của nhiệm vụ nếu bạn biết.


Chỉ tìm kiếm trong phần này


Khoảng tin cậy: Danh sách các giải pháp vấn đề

Khoảng tin cậy: lý thuyết và vấn đề

Hiểu khoảng tin cậy

Hãy để chúng tôi giới thiệu ngắn gọn khái niệm về khoảng tin cậy,
1) ước tính một số tham số của mẫu số trực tiếp từ dữ liệu của chính mẫu đó,
2) bao hàm giá trị của tham số này với xác suất γ.

Khoảng tin cậy cho tham số X(với xác suất γ) được gọi là một khoảng có dạng, sao cho và các giá trị được tính theo một cách nào đó từ mẫu.

Thông thường, trong các bài toán áp dụng, xác suất tin cậy được lấy bằng γ = 0,9; 0,95; 0,99.

Hãy xem xét một số mẫu cỡ n, được tạo ra từ tổng thể chung, được phân phối theo luật phân phối chuẩn. Hãy để chúng tôi hiển thị bằng những công thức được tìm thấy khoảng tin cậy cho các tham số phân phối- kỳ vọng toán học và độ phân tán (độ lệch chuẩn).

Khoảng tin cậy cho kỳ vọng toán học

Trường hợp 1 Phương sai phân phối đã biết và bằng. Sau đó, khoảng tin cậy cho tham số một giống như:
tđược xác định từ bảng phân phối Laplace theo tỷ lệ

Trường hợp 2 Phương sai phân phối là không xác định; ước tính điểm của phương sai đã được tính toán từ mẫu. Sau đó, khoảng tin cậy cho tham số một giống như:
, trung bình mẫu được tính từ mẫu ở đâu, tham số tđược xác định từ bảng phân phối của Học sinh

Thí dụ. Dựa trên dữ liệu của 7 lần đo với một giá trị nhất định, giá trị trung bình của các kết quả đo được tìm thấy bằng 30 và phương sai mẫu bằng 36. Tìm các ranh giới trong đó giá trị thực của giá trị đo được chứa với độ tin cậy 0,99 .

Dung dịch. Hãy tìm . Sau đó, giới hạn tin cậy cho khoảng chứa giá trị thực của đại lượng đo có thể được tìm thấy bằng công thức:
, đâu là giá trị trung bình của mẫu, là phương sai của mẫu. Cắm vào tất cả các giá trị, chúng tôi nhận được:

Khoảng tin cậy cho phương sai

Chúng tôi tin rằng, nói chung, kỳ vọng toán học là không xác định, và chỉ có một ước lượng không chệch điểm của phương sai được biết. Khi đó khoảng tin cậy sẽ giống như sau:
, ở đâu - lượng tử phân phối được xác định từ bảng.

Thí dụ. Dựa trên dữ liệu của 7 thử nghiệm, giá trị ước tính cho độ lệch chuẩn được tìm thấy s = 12. Tìm với xác suất 0,9 độ rộng của khoảng tin cậy được xây dựng để ước tính phương sai.

Dung dịch. Khoảng tin cậy cho phương sai tổng thể chưa biết có thể được tìm thấy bằng cách sử dụng công thức:

Thay thế và nhận được:


Khi đó độ rộng của khoảng tin cậy là 465.589-71.708 = 393.881.

Khoảng tin cậy cho xác suất (phần trăm)

Trường hợp 1 Hãy cho biết kích thước mẫu và phân số mẫu (tần số tương đối) trong bài toán. Khi đó khoảng tin cậy cho phân số tổng quát (xác suất đúng) là:
, tham số ở đâu tđược xác định từ bảng phân phối Laplace theo tỷ lệ.

Trường hợp 2 Nếu bài toán biết thêm tổng kích thước của dân số mà từ đó mẫu được lấy, khoảng tin cậy cho phần tổng quát (xác suất đúng) có thể được tìm thấy bằng cách sử dụng công thức đã điều chỉnh:
.

Thí dụ. Người ta biết rằng Tìm ranh giới trong đó phần chung được kết luận với xác suất.

Dung dịch. Chúng tôi sử dụng công thức:

Hãy tìm tham số từ điều kiện , chúng tôi nhận được thay thế trong công thức:


Bạn có thể tìm thấy các ví dụ khác về các vấn đề trong thống kê toán học trên trang

Cho biến ngẫu nhiên X của tổng thể chung có phân phối chuẩn, cho rằng phương sai và độ lệch chuẩn s của phân phối này đã biết. Yêu cầu ước tính kỳ vọng toán học chưa biết từ giá trị trung bình của mẫu. Trong trường hợp này, vấn đề được rút gọn thành việc tìm khoảng tin cậy cho kỳ vọng toán học với độ tin cậy b. Nếu chúng ta đặt giá trị của xác suất tin cậy (độ tin cậy) b, thì chúng ta có thể tìm xác suất rơi vào khoảng cho kỳ vọng toán học chưa biết bằng cách sử dụng công thức (6.9a):

trong đó Ф (t) là hàm Laplace (5.17a).

Kết quả là, chúng ta có thể xây dựng một thuật toán để tìm ranh giới của khoảng tin cậy cho kỳ vọng toán học nếu phương sai D = s 2 được biết:

  1. Đặt giá trị độ tin cậy là b.
  2. Từ (6.14) biểu thị Ф (t) = 0,5 × b. Chọn giá trị t từ bảng cho hàm Laplace bằng giá trị Ф (t) (xem Phụ lục 1).
  3. Tính độ lệch e theo công thức (6.10).
  4. Viết khoảng tin cậy theo công thức (6.12) sao cho với xác suất b, bất đẳng thức sau là đúng:

.

Ví dụ 5.

Biến ngẫu nhiên X có phân phối chuẩn. Tìm khoảng tin cậy cho một ước lượng có độ tin cậy b = 0,96 của giá trị trung bình chưa biết a, nếu cho trước:

1) độ lệch chuẩn chung s = 5;

2) trung bình của mẫu;

3) cỡ mẫu n = 49.

Trong công thức (6.15) ước lượng khoảng thời gian của kỳ vọng toán học một với độ tin cậy b, tất cả các đại lượng trừ t đã biết. Giá trị của t có thể được tìm thấy bằng cách sử dụng (6.14): b = 2Ф (t) = 0,96. Ф (t) = 0,48.

Theo bảng phụ lục 1 cho hàm Laplace Ф (t) = 0,48, tìm giá trị t = 2,06 tương ứng. Do đó, . Thay giá trị tính toán của e vào công thức (6.12), ta có thể thu được khoảng tin cậy: 30-1,47< a < 30+1,47.

Khoảng tin cậy mong muốn cho một ước lượng với độ tin cậy b = 0,96 của kỳ vọng toán học chưa biết là: 28,53< a < 31,47.