Phương pháp xử lý thông tin và dự báo cho sinh viên chuyên ngành: “Quản lý tổ chức”. Các giá trị dạng bảng của tiêu chí Irwin cho các phần tử cực đoan của chuỗi biến thể V.V.

Gọi là mẫu được quan sát và là chuỗi biến phân được xây dựng từ nó. Giả thuyết được kiểm tra là tất cả đều thuộc về cùng một dân số(không có ngoại lệ). Một giả thuyết thay thế là có những ngoại lệ trong mẫu được quan sát.

Theo tiêu chí Chauvenet, một phần tử của mẫu thể tích là ngoại lệ nếu xác suất sai lệch của nó so với giá trị trung bình không lớn hơn .

Số liệu thống kê Chauvenet sau đây được tổng hợp:

ý nghĩa ở đâu,

phương sai mẫu

Hãy để chúng tôi xác định phân phối của số liệu thống kê khi giả thuyết được đáp ứng. Để làm được điều này, ta giả thiết rằng ngay cả khi các biến ngẫu nhiên nhỏ và độc lập với nhau thì mật độ phân phối biến ngẫu nhiên giống như:

Các giá trị của hàm phân phối này có thể được tính bằng gói toán học Maple 14, thay thế các giá trị thu được thay vì các tham số chưa biết.

Nếu thống kê thì giá trị () phải được công nhận là ngoại lệ. Các giá trị tới hạn được đưa ra trong bảng (xem Phụ lục A). Thay vào đó, trong công thức (1.1), chúng ta thay thế các giá trị cực trị để kiểm tra các giá trị ngoại lai.

Tiêu chuẩn Irwin

Tiêu chí này được sử dụng khi phương sai phân phối được biết trước.

Một mẫu khối lượng được lấy từ một tổng thể chung bình thường và một chuỗi biến thể được tổng hợp (sắp xếp theo thứ tự tăng dần). Các giả thuyết tương tự và được xem xét như trong tiêu chí trước đó.

Khi giá trị lớn nhất (nhỏ nhất) được công nhận là ngoại lệ có xác suất. Các giá trị quan trọng được liệt kê trong bảng.

Tiêu chí Grubbs

Hãy để một mẫu được trích xuất và một chuỗi biến phân được xây dựng trên đó. Giả thuyết được kiểm tra là tất cả () thuộc về cùng một tổng thể. Khi kiểm tra một ngoại lệ của giá trị mẫu lớn nhất, giả thuyết thay thế là chúng thuộc về một luật, nhưng thuộc về một luật khác, dịch chuyển đáng kể sang phải. Khi kiểm tra một ngoại lệ có giá trị lớn nhất của mẫu, thống kê của phép kiểm định Grubbs có dạng

trong đó được tính theo công thức (1.2) và - theo (1.3)

Khi kiểm tra một ngoại lệ của giá trị mẫu nhỏ nhất, giả thuyết thay thế giả định rằng nó thuộc về một số luật khác, dịch chuyển đáng kể sang trái. TẠI trường hợp này thống kê tính toán có dạng

trong đó được tính theo công thức (1.2) và - theo (1.3).

Thống kê hoặc được áp dụng khi phương sai được biết trước; thống kê và -- khi phương sai được ước tính từ mẫu sử dụng quan hệ (1.3).

Tối đa hoặc yếu tố tối thiểu Mẫu được coi là ngoại lệ nếu giá trị của số liệu thống kê tương ứng vượt quá giá trị tới hạn: hoặc, ở đâu là mức ý nghĩa được chỉ định. Các giá trị tới hạn và được cho trong các bảng tóm tắt (xem Phụ lục A). Các số liệu thống kê thu được trong thử nghiệm này, khi giả thuyết không được đáp ứng, có cùng phân phối với số liệu thống kê trong thử nghiệm Chauvenet.

Đối với > 25, người ta có thể sử dụng phép tính gần đúng cho các giá trị tới hạn

lượng tử của tiêu chuẩn ở đâu phân phối bình thường.

A được xấp xỉ như sau

Nếu phương sai ( ) và kỳ vọng toán học (µ - giá trị trung bình) được biết trong mẫu được trích xuất, thì thống kê được sử dụng

Các giá trị quan trọng của các số liệu thống kê này cũng được liệt kê trong các bảng. Nếu, thì ngoại lệ được coi là đáng kể và giả thuyết thay thế được chấp nhận.

nhiệm vụ cho tự học kỷ luật.

Bài tập 1. Theo tùy chọn, mô phỏng một tập hợp dữ liệu thực nghiệm thu được do đo tính năng một chiều. Để làm điều này, bạn cần lập bảng chức năng:

, ,

và nhận được 15 - 20 dữ liệu liên tiếp. Ở đây, có lẽ là đặc điểm của dấu hiệu (phản ánh xu hướng chính của dấu hiệu) và sự can thiệp (lỗi) của các phép đo, là kết quả của sự biểu hiện của các loại tai nạn.

Tùy chọn dữ liệu ban đầu:

Tiến hành phát hiện các mức độ bất thường của chuỗi dữ liệu thu được bằng cách lập bảng hàm và thực hiện làm mịn chúng:

một). Phương pháp của Irwin, theo công thức

Các giá trị được tính toán được so sánh với các giá trị dạng bảng của tiêu chí Irwin:

Bảng kiểm tra của Irwin

Bảng cho thấy các giá trị của kiểm định Irwin cho mức ý nghĩa (với sai số 5%).

b). bằng cách kiểm tra sự khác biệt ở các mức trung bình, chia chuỗi thời gian của dữ liệu thành hai phần bằng nhau và tính toán giá trị trung bình và phương sai cho từng phần. Tiếp theo, kiểm tra sự bằng nhau của phương sai của cả hai phần bằng phép thử Fisher. Nếu giả thuyết về sự bằng nhau của phương sai được chấp nhận, hãy tiến hành kiểm tra giả thuyết về việc không có xu hướng bằng cách sử dụng t-test của Sinh viên. Tính toán giá trị thực nghiệm thống kê, sử dụng công thức:

ý nghĩa ở đâu độ lệch chuẩn có nghĩa là sự khác biệt:

So sánh giá trị tính được của số liệu thống kê với bảng.

Trong). Phương pháp Foster-Stuart.

2. Thực hiện làm mịn cơ học các cấp độ của chuỗi:

một). phương pháp trung bình động đơn giản;

b). phương pháp bình quân gia quyền;

Trong). Phương pháp làm mịn hàm mũ.

Nhiệm vụ 2. Bảng dữliệu chỉ số kinh tế, một chuỗi thời gian của khối lượng vận chuyển hàng tháng (gắn với một khu vực nhất định) của hàng hóa nông nghiệp trong các đơn vị thông thường được đưa ra.

Áp dụng phương pháp Chetverikov để trích xuất các thành phần của chuỗi thời gian:

một). căn chỉnh chuỗi thực nghiệm bằng cách sử dụng trung bình di chuyển ở giữa với khoảng thời gian làm mịn;

b). trừ đi ước tính sơ bộ thu được về xu hướng từ chuỗi thực nghiệm ban đầu: .

Trong). Tính toán cho mỗi năm (theo hàng) độ lệch chuẩn của giá trị bằng công thức

G). tìm giá trị sơ bộ của sóng trung bình theo mùa: .

e). nhận được một loạt không có sóng theo mùa: .

e). chuỗi kết quả được làm mịn bằng cách sử dụng đường trung bình động đơn giản với khoảng làm mịn bằng năm và thu được ước tính xu hướng mới.

và). tính độ lệch của chuỗi so với chuỗi thực nghiệm ban đầu:

h). các sai lệch kết quả phải được xử lý theo các đoạn văn. Trong). và d). để xác định các giá trị mới của sóng mùa.

và). để tính hệ số cường độ của sóng theo mùa theo các công thức và hơn nữa (chính hệ số):

Hệ số căng thẳng không được tính cho năm đầu tiên và năm cuối cùng.

đến). Sử dụng hệ số căng thẳng, tính toán các giá trị cuối cùng thành phần theo mùa chuỗi thời gian: .

Nhiệm vụ 3. Chuỗi thời gian được đưa ra trong bảng:

Thực hiện lựa chọn sơ bộ của đường cong tăng trưởng tốt nhất:

một). phương pháp sai phân hữu hạn (Tintner);

b). phương pháp đặc tính sinh trưởng.

2. Đối với dãy ban đầu, hãy xây dựng mô hình tuyến tính , đã xác định các tham số của nó bằng phương pháp bình phương nhỏ nhất.

3. Đối với chuỗi thời gian ban đầu, hãy xây dựng mô hình Brown thích nghi với tham số làm trơn và ; chọn nai Mô hình tốt nhất Màu nâu , đâu là thời gian dẫn đầu (số bước tiến).

4. Đánh giá tính đầy đủ của các mô hình dựa trên nghiên cứu:

một). sự gần gũi kỳ vọng toán học thành phần dư bằng không; giá trị quan trọng của thống kê của Sinh viên để chấp nhận (đối với mức độ tự tin 0,70);

b). các sai lệch ngẫu nhiên của thành phần dư theo tiêu chí các đỉnh (điểm quay đầu); thực hiện các phép tính dựa vào tỉ số ;

Trong). tính độc lập (thiếu tự tương quan) của các mức của một số phần dư, bằng kiểm định Durbin-Watson (sử dụng các mức và làm mức tới hạn), hoặc bằng hệ số tự tương quan thứ nhất (lấy mức tới hạn bằng );

G). tính quy tắc của luật phân phối của thành phần dư dựa trên tiêu chí RS (như mức độ quan trọng chấp nhận khoảng (2.7 - 3.7)).

5. Đánh giá độ chính xác của mô hình bằng độ lệch chuẩn và giá trị trung bình sai số tương đối xấp xỉ.

6. Dựa phân tích so sánh tính đầy đủ và chính xác của các mô hình, chọn mô hình tốt nhất, theo đó để xây dựng dự báo điểm và khoảng trước hai bước (). Hiển thị kết quả dự báo bằng đồ họa.

Nhiệm vụ 4. Việc đánh giá bộ xử lý của 10 máy trạm của mạng cục bộ, được xây dựng trên cơ sở các máy gần giống nhau, nhưng từ các nhà sản xuất khác nhau (có nghĩa là một số sai lệch về thông số của máy so với kiểu máy cơ sở). Để kiểm tra hoạt động của bộ xử lý, một hỗn hợp loại ICOMP 2.0 đã được sử dụng, dựa trên hai thử nghiệm chính:

1. 125.turb3D - thử nghiệm mô phỏng nhiễu loạn trong thể tích khối(phần mềm ứng dụng);

2.NortonSI32 - chương trình kỹ thuật loại AutoCAD

và một thử nghiệm phụ trợ để chuẩn hóa thời gian xử lý dữ liệu SPECint_base95. Các bộ xử lý được đánh giá bằng thời gian thực thi có trọng số của hỗn hợp, được chuẩn hóa bằng hiệu suất của bộ xử lý cơ sở, theo công thức

thời gian thực hiện bài kiểm tra thứ ở đâu;

trọng lượng của bài kiểm tra;

hiệu suất của bộ xử lý cơ bản trong bài kiểm tra m.

Nếu biểu thức (1) là logarit thì ta có:

và sau khi đổi tên các biến:

thời gian xử lý thử nghiệm cơ sở SPECint_base95 ;

logarit của thời gian xử lý của bài kiểm tra đầu tiên,

logarit của thời gian xử lý của bài kiểm tra thứ hai, hệ số hồi quy thu được trong các lần đánh giá (test weight);

hệ số hồi quy - trọng số của bài kiểm tra để xử lý các phép tính số học trong số nguyên (bài kiểm tra cơ bản).

1. Dựa vào dữ liệu đo lường cho trong bảng, xây dựng hàm hồi quy (thực nghiệm), đánh giá các hệ số hồi quy và kiểm tra tính phù hợp của mô hình (tính ma trận hiệp phương sai, cặp hệ số tương quan, hệ số xác định).

Tùy chọn dữ liệu:

Lựa chọn 1.

Lựa chọn 2.

Phương án 3.

Phương án 4.

Với sự trượt tương đối của các bộ phận của các cặp ma sát, sẽ xảy ra hư hỏng cho các bề mặt tiếp xúc. Loại thiệt hại này đối với thể tích bề mặt của bộ phận được gọi là mặc vào. Việc mất chỉ một phần nghìn khối lượng của máy do hao mòn dẫn đến mất hoàn toàn hiệu suất. Ba năm một lần...
(Cơ khí. Cơ sở tính toán thiết kế chi tiết máy)

CÁC CHỈ TIÊU ỔN ĐỊNH CỦA HỆ THỐNG VÀ PHƯƠNG PHÁP XÁC ĐỊNH TẢI TRỌNG ĐẾN HẠN

Có ba tiêu chí chính về độ ổn định của kết cấu: động, tĩnh và năng lượng, các tiêu chí này cũng xác định phương pháp tính toán độ ổn định của kết cấu. một. Năng động(theo Lyapunov) tiêu chuẩn dựa trên cơ sở nghiên cứu các nghiệm của phương trình động lực học lệch khỏi phương trình ban đầu...
(cơ học kết cấu hệ thống thanh phẳng)

TIÊU CHÍ LỰA CHỌN KÊNH PHÂN PHỐI QUẢNG CÁO

Trong số tất cả các quyết định được đưa ra trong quá trình lập kế hoạch, điều quan trọng nhất là lựa chọn phương tiện truyền thông cụ thể trong mỗi phương tiện truyền thông. Theo quy định, các nhà lập kế hoạch truyền thông có xu hướng chọn những phương tiện cho phép họ đạt được các mục tiêu sau: 1) đạt được tần suất trình bày thông điệp quảng cáo nhất định ...
(Tâm lý truyền thông đại chúng)

Phân tích tương quan-hồi quy

Tương quan và hồi quy là phương pháp để xác định phụ thuộc thống kê giữa các biến nghiên cứu. “Dựa trên phân tích dữ liệu thực nghiệm được thu thập trong quá trình nghiên cứu, không chỉ sự thật về sự tồn tại của sự phụ thuộc thống kê được mô tả mà còn cả công thức toán học của hàm ...
(Nghiên cứu thị trường)

PHƯƠNG PHÁP NGHIÊN CỨU TƯƠNG QUAN VÀ HỒI QUY

Một trong những phương pháp mô hình hóa quá trình kinh tế là phương pháp nghiên cứu hồi quy tương quan. Mô hình hóa là quá trình thể hiện các mối quan hệ phức tạp hiện tượng kinh tế có nghĩa công thức toán học và các ký hiệu. Sự phối hợp phân tích định tính sử dụng toán học...
(Thống kê tổng hợp và ứng dụng)

PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUY

Nghiên cứu thống kê về kinh tế và quy trình công nghệ hiện là một trong công cụ thiết yếu trong việc phát triển các hệ thống điều khiển quá trình. Biết mối quan hệ giữa các tham số cho phép bạn xác định các yếu tố chính ảnh hưởng đến chất lượng của thành phẩm hoặc nghiên cứu ...
(Toán học và các mô hình kinh tế-toán học)

Sai sót lớn (miss) là một trong những lỗi thay đổi ngẫu nhiên với các quan sát lặp đi lặp lại. Chúng rõ ràng vượt quá giá trị của chúng so với các sai số được chứng minh bằng các điều kiện của thí nghiệm. Sai số được hiểu là giá trị của sai số, độ lệch của nó so với trung tâm phân phối vượt quá đáng kể giá trị được chứng minh bằng các điều kiện khách quan của phép đo. Do đó, từ quan điểm của lý thuyết xác suất, việc bỏ sót là không thể xảy ra.

Sai số lớn có thể do những thay đổi không kiểm soát được trong điều kiện đo, sự cố, lỗi của người vận hành, v.v.

Để loại bỏ các sai số lớn, bộ máy kiểm tra các giả thuyết thống kê được sử dụng.

Trong đo lường, các giả thuyết thống kê được sử dụng, được hiểu là giả thuyết về dạng phân phối chưa biết hoặc về các tham số của phân phối đã biết.

Ví dụ về các giả thuyết thống kê:

Mẫu được xem xét (hoặc kết quả riêng biệt của nó) thuộc về dân số chung;

Dân số nói chung được phân bố theo luật thông thường;

phương sai của hai bộ sưu tập bình thường là bình đẳng với nhau.

Trong hai giả thuyết đầu tiên, một giả định đã được đưa ra về loại phân phối chưa biết và thuộc về các kết quả cá nhân (đáng ngờ) loài này các bản phân phối và trong phần thứ ba - về các tham số của hai bản phân phối đã biết. Cùng với giả thuyết đưa ra, một giả thuyết mâu thuẫn với nó cũng được xem xét. Giả thuyết null (cơ bản) được gọi. Một cạnh tranh (thay thế) là một mâu thuẫn với số không.

Khi đề xuất và chấp nhận một giả thuyết, bốn trường hợp sau có thể xảy ra:

giả thuyết được chấp nhận, và trên thực tế nó đúng;

Giả thuyết đúng nhưng bị bác bỏ sai. Lỗi kết quả được gọi là lỗi loại một và xác suất xuất hiện của nó được gọi là mức ý nghĩa và được biểu thị q(α );

giả thuyết bị bác bỏ, và trên thực tế nó không chính xác;

Giả thuyết là không chính xác, nhưng được chấp nhận sai. Lỗi xảy ra trong trường hợp này được gọi là lỗi loại hai và xác suất xảy ra của nó được biểu thị bằng β .

Giá trị 1 - β, tức là, xác suất mà một giả thuyết sẽ bị bác bỏ khi nó sai được gọi là sức mạnh của tiêu chí.

Cần lưu ý rằng trong tài liệu quy định về kiểm soát chất lượng sản phẩm thống kê và sách giáo khoa về quản lý chất lượng, xác suất nhận ra một lô sản phẩm tốt là không phù hợp (tức là mắc lỗi loại đầu tiên) được gọi là “rủi ro của nhà sản xuất”, và xác suất chấp nhận một lô không sử dụng được gọi là “rủi ro của người tiêu dùng” .

Mọi người chỉ tiêu thống kê là các biến ngẫu nhiên lấy giá trị nhất định(bảng giá trị tới hạn). Vùng chấp nhận giả thuyết (vùng giá trị được phép) là tập hợp các giá trị tiêu chí theo đó giả thuyết được chấp nhận. Tới hạn là tập hợp các giá trị tiêu chí mà tại đó giả thuyết không bị bác bỏ. Vùng chấp nhận giả thuyết và vùng tới hạn được phân tách bằng các điểm tới hạn, là các giá trị dạng bảng của tiêu chí.

Vùng bác bỏ giả thuyết, như trong Hình 1, có thể là một phía (bên phải hoặc bên trái) và hai bên.

tay phải

K obs > k cr, ở đâu k cr - số dương (Hình 1, a).

bên tráiđược gọi là miền tới hạn được xác định bởi bất đẳng thức

K quan sát< k кр, ở đâu k cr - số âm (Hình 1, b).

song phươngđược gọi là miền tới hạn được xác định bởi các bất đẳng thức

K quan sát > k 1 ; K quan sát 2, ở đâu k 2 > k 1 .

Nếu điểm quan trọngđối xứng với 0, vùng tới hạn hai phía được xác định bởi các bất đẳng thức: K quan sát<-k кр, K набл >k cr, hoặc bất đẳng thức tương đương \K obl \>k cr(Hình 1,c).

Hình 1 - Diễn giải đồ thị về sự phân bố của khu vực chấp nhận giả thuyết

Nguyên tắc cơ bản của kiểm định giả thuyết thống kê được xây dựng như sau: nếu giá trị quan sát (thực nghiệm) của tiêu chí thuộc vùng tới hạn thì giả thuyết bị bác bỏ; nếu giá trị quan sát của tiêu chí thuộc vùng chấp nhận của giả thuyết , giả thuyết được chấp nhận.

Kiểm định giả thuyết thống kê được thực hiện với mức ý nghĩa được chấp nhận q(lấy bằng 0,1; 0,05; 0,01,...). Vậy mức ý nghĩa được chấp nhận q = 0,05 có nghĩa là số 0 nâng cao giả thuyết thống kê có thể được chấp nhận với sự tự tin P= 0,95. Hay có xác suất bác bỏ giả thuyết này (lỗi loại I) bằng P= 0,95.

Giả thuyết thống kê vô giá trị xác nhận rằng kết quả đo lường (quan sát) “đáng ngờ” được thử nghiệm thuộc về nhóm phép đo này.

Tiêu chí chính thức cho kết quả quan sát bất thường (và do đó, cơ sở để chấp nhận giả thuyết cạnh tranh: kết quả “đáng ngờ” không thuộc nhóm phép đo này) là ranh giới cách trung tâm phân phối bởi giá trị TS, I E.:

(1)

ở đâu x isub- kết quả quan sát, được kiểm tra về sự hiện diện của sai số lớn; t- hệ số phụ thuộc vào dạng và luật phân phối, cỡ mẫu, mức ý nghĩa; S-RMS.

Do đó, biên độ sai số phụ thuộc vào loại phân phối, cỡ mẫu và mức độ tin cậy đã chọn.

Khi xử lý các kết quả quan sát đã có, tự ý loại bỏ kết quả cá nhân không nên được sử dụng, vì điều này có thể dẫn đến sự gia tăng giả tạo về độ chính xác của kết quả đo. Một nhóm các phép đo (mẫu) có thể chứa một số lỗi lớn và việc loại bỏ chúng được thực hiện tuần tự, từng lỗi một.

Tất cả các phương pháp để loại bỏ lỗi thô (lỡ) có thể được chia thành hai loại chính:

Các phương pháp loại trừ với RMS chung đã biết;

Các phương pháp loại trừ đối với RMS chung chưa biết.

Trong trường hợp đầu tiên x c . r. và RMS được tính toán dựa trên kết quả của toàn bộ mẫu, trường hợp thứ hai, các kết quả đáng ngờ sẽ được loại bỏ khỏi mẫu trước khi tính toán.

Trong trường hợp số lượng quan sát hạn chế và (hoặc) sự phức tạp của việc ước tính các tham số của luật phân phối, nên loại trừ các lỗi tổng bằng cách sử dụng các hệ số gần đúng của loại phân phối. Điều này loại trừ các giá trị x tôi< x r- và x tôi> x r+ , ở đâu x r - , x r+ – trượt giới hạn được xác định bởi các biểu thức:

(2),(3)

ở đâu Một– hệ số, giá trị được chọn tùy thuộc vào xác suất tin cậy đã chỉ định trong khoảng từ 0,85 đến 1,30 (nên chọn giá trị tối đa VÀ bằng 1,3); γ – phản nhọn, giá trị của nó phụ thuộc vào dạng của định luật phân phối số lượng (ZRV).

Sau khi loại bỏ các sai sót, thao tác xác định ước tính của trung tâm phân phối và độ lệch chuẩn của kết quả quan sát và đo lường phải được lặp lại.

Do các phép đo phổ biến hơn trong thực tế với RMS không xác định (số lượng quan sát hạn chế), các tiêu chí sau để kiểm tra các kết quả quan sát đáng ngờ (về lỗi) được xem xét trong sổ tay: Irvin, Romanovsky, phạm vi biến đổi, Dixon, Smirnov, Chauvin.

Vì các yêu cầu tiêu chí (hệ số) xác định ranh giới mà vượt qua đó các kết quả quan sát “thô” (theo nghĩa sai sót) là các tác giả khác nhau khác nhau, thì việc kiểm tra phải được thực hiện đồng thời theo một số tiêu chí (nên sử dụng ít nhất ba tiêu chí được xem xét bên dưới). Kết luận cuối cùng về sự liên quan của các kết quả “đáng ngờ” đối với tập hợp các quan sát được xem xét nên được đưa ra theo đa số các tiêu chí. Ngoài ra, việc lựa chọn một tiêu chí để xác định lỗi tổng nên được thực hiện sau khi xây dựng biểu đồ kết quả quan sát. Theo loại biểu đồ, việc xác định sơ bộ loại luật phân phối được thực hiện (bình thường, gần bình thường hoặc khác với nó).

Tiêu chuẩn IrwinĐối với dữ liệu thực nghiệm thu được, hệ số được xác định theo công thức:

(4)

ở đâu x n + 1, x n– giá trị cao nhất biến ngẫu nhiên; S là độ lệch chuẩn được tính cho tất cả các giá trị mẫu.

Sau đó, hệ số này được so sánh với giá trị bảng λq, các giá trị có thể được đưa ra trong Bảng 1.

Bảng 1 - Tiêu chí của Irwin λq.

Nếu λ >λ q , thì giả thuyết khống không được xác nhận, tức là kết quả là sai và cần được loại trừ trong quá trình xử lý tiếp các kết quả quan sát.

tiêu chí Romanovsky. Giả thuyết cạnh tranh về sự hiện diện của các sai số lớn trong các kết quả đáng ngờ được xác nhận nếu bất đẳng thức sau là đúng:

(5)

ở đâu tp- lượng tử phân phối của Học sinh cho một xác suất tin cậy nhất định với số bậc tự do k = n -k n (k n - số quan sát đáng ngờ). Một đoạn lượng tử cho phân phối của Học sinh được trình bày trong Bảng 2.

ước tính điểm phân phối và RMSS kết quả

các quan sát được tính toán mà không tính đến k n quan sát đáng ngờ.

Bảng 2 - Tiêu chí học sinh tp(Số lượng tử của sinh viên)

Chỉ tiêu về biên độ biến thiên. Là một trong những phương pháp đơn giản loại trừ sai số đo tổng (miss). Để sử dụng nó, xác định phạm vi loạt biến thể tập quan sát có thứ tự (x 1 ≤x 2 ≤...≤x k ≤...≤x n):

Nếu bất kỳ thành viên nào của loạt biến thể, ví dụ x k , khác hẳn so với tất cả những cái khác, thì kiểm tra được thực hiện bằng cách sử dụng bất đẳng thức sau:

(7)

ở đâu X- mẫu trung bình giá trị số học, được tính sau khi loại trừ sai sót dự kiến; z- giá trị tiêu chí.

Giả thuyết không (về việc không có sai sót lớn) được chấp nhận nếu chỉ định bất bình đẳng thực hiện. Nếu xk không thỏa mãn điều kiện (7) thì kết quả này bị loại khỏi dãy biến thiên.

hệ số z phụ thuộc vào số phần tử của chuỗi biến thiên Nđược trình bày trong bảng 3.

Bảng 3 - Tiêu chí phạm vi thay đổi

Tiêu chuẩn Dixon Tiêu chí dựa trên giả định rằng các sai số đo lường tuân theo luật chuẩn tắc (trước đây cần xây dựng biểu đồ tần số của các kết quả quan sát) và kiểm định giả thuyết rằng phân phối tuân theo luật chuẩn tắc. Khi sử dụng tiêu chí, hệ số Dixon (giá trị quan sát của tiêu chí) được tính toán để kiểm tra giá trị cực trị lớn nhất hoặc nhỏ nhất tùy thuộc vào số lần đo. Bảng 4 cho thấy các công thức để tính toán các hệ số. tỷ lệ cược r 10 , r 11 áp dụng khi có một ngoại lệ, và r 21 và r 22 - khi có hai lần phóng. Yêu cầu sắp xếp ban đầu các kết quả đo (cỡ mẫu). Tiêu chí được áp dụng khi mẫu có thể chứa nhiều hơn một lỗi tổng thể.

Bảng 4 - Công thức hệ số Dixon

Các giá trị của hệ số Dixon được tính cho mẫu bằng các công thức r so với giá trị (bảng) được chấp nhận của tiêu chí Dixon rq(bảng 5).

giả thuyết không về việc không có sai số lớn được thỏa mãn nếu bất đẳng thức r< rq.

Nếu r> rq, sau đó kết quả được công nhận là một lỗi nghiêm trọng và

bị loại khỏi quá trình xử lý tiếp theo.

Bảng 5 - Giá trị tiêu chí của các hệ số Dixon (ở mức cho phép

tầm quan trọng q)

tiêu chí wright Quy tắc ba sigma là một trong những phép thử đơn giản nhất cho kết quả tuân theo luật phân phối chuẩn. Bản chất của quy tắc ba sigma: nếu một biến ngẫu nhiên được phân phối bình thường, thì giá trị tuyệt đốiđộ lệch của nó so với kỳ vọng toán học không vượt quá ba lần độ lệch chuẩn.

Trong thực tế, quy tắc ba sigma được áp dụng như sau: nếu chưa biết phân phối của biến ngẫu nhiên đang nghiên cứu, nhưng điều kiện quy định trong quy tắc trên được đáp ứng, thì có lý do để cho rằng biến được nghiên cứu có phân phối bình thường; mặt khác, nó không được phân phối bình thường. Với mục đích này, đối với mẫu (bao gồm cả kết quả đáng ngờ), trung tâm phân phối và ước tính độ lệch chuẩn của kết quả quan sát được tính toán. Kết quả thỏa mãn điều kiện

,

được coi là có lỗi tổng thể và bị loại bỏ, đồng thời các đặc điểm phân phối được tính toán trước đó được tinh chỉnh.

Tiêu chí này tương tự Tiêu chí của Wright, dựa trên thực tế là nếu sai số dư lớn hơn 4 sigma, thì kết quả đo này là sai số lớn và cần được loại trừ trong quá trình xử lý tiếp theo. Cả hai tiêu chí đều đáng tin cậy khi số phép đo lớn hơn 20…50. Việc sử dụng chúng khi đã biết giá trị của độ lệch chuẩn chung là hợp pháp ( S).

Nó có thể chỉ ra rằng đối với các giá trị mới và S các kết quả khác sẽ rơi vào loại bất thường.

tiêu chuẩn Smirnov. Tiêu chí Smirnov được sử dụng cho cỡ mẫu P≥ 25 hoặc tại giá trị đã biết trung học phổ thông và SKO. Nó đặt ra các giới hạn ít cứng nhắc hơn đối với lỗi thô. Để thực hiện tiêu chí này, giá trị thực của các phân vị phân bổ (giá trị quan sát của tiêu chí) được tính theo công thức:

(8)

Giá trị tìm thấy được so sánh với tiêu chí β k cho trong bảng 6

Bảng 6 - Phân vị phân bổ β k

tiêu chuẩn Chauvin. Tiêu chí Chauvenet được sử dụng cho các luật không mâu thuẫn với luật thông thường và dựa trên việc xác định số lượng kết quả quan sát dự kiến n mát, có lỗi lớn như lỗi đáng ngờ. Giả thuyết về sự hiện diện của sai số lớn được chấp nhận nếu điều kiện sau được đáp ứng:

Quy trình kiểm định giả thuyết như sau:

1) trung bình cộng và độ lệch chuẩn được tính toán S kết quả quan sát cho toàn bộ mẫu;

2) từ bảng phân phối chuẩn hóa (Phụ lục 1 - hàm tích phân của phân phối chuẩn hóa) theo giá trị

xác suất của một kết quả đáng ngờ trong dân số nói chung được xác định N:

(9)

3) số lượng kết quả mong đợi flđược xác định bởi công thức:

Các tiêu chí trên trong nhiều trường hợp trở nên “khó nhằn”. Sau đó, nên sử dụng tiêu chí về lỗi tổng " k", tùy thuộc vào kích thước mẫu P và độ tin cậy được chấp nhận r.

Bảng 7 - Sự phụ thuộc của tiêu chí về sai số tổng k trên cỡ mẫu P

và mức độ tự tin r

Đối với các bản phân phối khác với bình thường, các lớp chẳng hạn như hai thành phần đỉnh tròn phương thức của bình thường và phân phối rời rạc bị gai nhọn ε = 1,5 - 3,0;đỉnh lưỡng cực; thành phần của phân phối hai giá trị rời rạc và phân phối Laplace với độ nhọn ε = 1,5 - 6,0; thành phần phân phối đồng đều với phân phối kurtosis theo cấp số nhân ε = 1,8-6,0 và lớp phân phối hàm mũ trong sự thay đổi của độ nhọn ε = 1,8-6,0 giới hạn của lỗi tổng được xác định bởi giá trị ± (t gr . σ ) hoặc ±( t gr . S), ở đâu:

(11)

ở đâu γ - phản đối;

(12)

Lỗi trong việc xác định ước tính S Bắc Kazakhstan và t sp có tương quan nghịch, tức là tăng độ lệch chuẩn S kèm theo sự sụt giảm t zp. Do đó, việc xác định ranh giới của lỗi thô đối với các luật khác với thông thường, với kurtosis ε < 6 sử dụng tiêu chí t zp đủ chính xác và có thể ứng dụng rộng rãi trong thực tế.

xếp hạng, S và ε nên được tính toán sau khi loại trừ các kết quả đáng ngờ khỏi mẫu. Sau khi tính toán các ranh giới của một lỗi tổng thể, kết quả của các quan sát bên trong các ranh giới được trả về và các đặc điểm phân phối được tìm thấy trước đó được tinh chỉnh.

Để phân phối đồng đều, có thể lấy giá trị ±1,8 . S.

Hãy xem xét một ví dụáp dụng các tiêu chí để loại bỏ sai số lớn trong phép đo tốc độ điện giật. Kết quả được trình bày trong bảng 8.

Bảng 8 - Kết quả quan sát

Cần xác định xem kết quả quan sát có chứa V= 3,50 km/s tổng sai số.

Vì độ nét đồ họa dạng của luật phân phối, chúng ta sẽ xây dựng một biểu đồ. Khi xây dựng, việc phân chia thành các khoảng được thực hiện sao cho các giá trị đo được nằm ở giữa các khoảng, được thể hiện trong Hình 2.

Được sử dụng để đánh giá các giá trị mẫu có vấn đề đối với các lỗi thô. Thứ tự của ứng dụng của nó là như sau.
Tìm giá trị tính toán của tiêu chí λ calc = (|x tới - x tới trước |)/σ,
ở đâu xk- giá trị nghi vấn x đến trước- giá trị trước đó trong chuỗi biến thể, nếu xkđược ước tính từ các giá trị tối đa của chuỗi biến thể hoặc tiếp theo, nếu xkđược ước tính từ các giá trị nhỏ nhất của chuỗi biến thiên (Irwin sử dụng trong trường hợp chung thuật ngữ “đệ nhất nghĩa”); σ là độ lệch chuẩn chung (RMSD) của biến ngẫu nhiên phân phối chuẩn liên tục.
Nếu λ calc > λ tab, xk – sai lầm. Đây bảng λ- giá trị dạng bảng (điểm phần trăm) của tiêu chí Irwin.
Các câu hỏi phát sinh trong trường hợp này được mô tả trên trang. Cụ thể, trong bài viết gốc, các giá trị dạng bảng của tiêu chí được tính cho biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn chung (MSD) đã biết σ . Bởi vì σ thường không được biết đến, Irwin đề xuất sử dụng trong tính toán thay vì σ độ lệch chuẩn mẫu s xác định theo công thức
ở đâu N là cỡ mẫu, x tôi là các phần tử của mẫu, x Thứ Tư là giá trị trung bình của mẫu.
Cách tiếp cận này thường được sử dụng trong thực tế. Tuy nhiên, khả năng chấp nhận sử dụng độ lệch chuẩn mẫu, và do đó điểm phần trăm cho độ lệch chuẩn chung, vẫn chưa được xác nhận.
Bài viết này trình bày các giá trị dạng bảng (điểm phần trăm) của tiêu chí Irwin, được tính bằng phương pháp thống kê mô hình máy tính sử dụng độ lệch chuẩn mẫu cho giá trị lớn nhất của chuỗi biến thiên có phân phối chuẩn chuẩn của một biến ngẫu nhiên (với các tham số khác của một phân phối bình thường, cũng như cho giá trị tối thiểu chuỗi biến phân, thu được kết quả tương tự). Đối với mỗi cỡ mẫu N mô phỏng 10 6 mẫu. Theo tính toán sơ bộ, định nghĩa song song sự khác biệt về giá trị điểm phần trăm có thể lên tới 0,003. Do các giá trị được làm tròn đến 0,01 nên trong các trường hợp nghi ngờ, 2 đến 4 phép xác định song song được thực hiện.
Ngoài ra, theo dữ liệu, các giá trị dạng bảng của tiêu chí Irwin cho SD chung đã biết đã được tính toán và so sánh với các giá trị được đưa ra trong .
kể từ lúc ứng dụng thực tế Irwin, một số khó khăn nhất định thường phát sinh do thiếu nguồn văn học các giá trị dạng bảng của tiêu chí đối với một số cỡ mẫu, được tính bằng cùng một phương pháp mô hình hóa máy tính thống kê, một số giá trị bị thiếu trong các giá trị dạng bảng.
Rõ ràng là với cỡ mẫu là 2, việc áp dụng kiểm định sử dụng độ lệch chuẩn của mẫu là không có ý nghĩa. Điều này được khẳng định bởi thực tế là việc đơn giản hóa biểu thức cho giá trị tính toán của tiêu chí với độ lệch chuẩn mẫu cho Căn bậc hai của cả hai, điều này cho thấy rõ sự vô nghĩa của việc áp dụng tiêu chí với cỡ mẫu là 2 và độ lệch chuẩn của mẫu.

Các kết quả được hiển thị trong bảng. một.
Bảng 1 - Các giá trị dạng bảng của tiêu chí Irwin cho yếu tố cực đoan loạt biến thể.
Cỡ mẫu Theo chung Theo độ lệch chuẩn chọn lọc
Mức độ đáng kể
0,1 0,05 0,01 0,1 0,05 0,01
2 2,33* 2,77* 3,64* - - -
3 1,79* 2,17* 2,90* 1,62 1,68 1,72
4 1,58 1,92 2,60 1,55 1,70 1,88
5 1,45 1,77 2,43 1,45 1,64 1,93/
6 1,37 1,67 2,30 1,38 1,60 1,94
7 1,31 1,60 2,22 1,32 1,55 1,93
8 1,26 1,55 2,14 1,27 1,51 1,92
9 1,22 1,50 2,09 1,23 1,47 1,90
10 1,18* 1,46* 2,04* 1,20 1,44 1,88
11 1,15 1,43 2,00 1,17 1,42 1,87
12 1,13 1,40 1,97 1,15 1,39 1,85
13 1,11 1,38 1,94 1,13 1,37 1,83
14 1,09 1,36 1,91 1,11 1,35 1,82
15 1,08 1,34 1,89 1,09 1,33 1,80
20 1,03* 1,27* 1,80* 1,03 1,27 1,75
25 0,99 1,23 1,74 0,99 1,22 1,70
30 0,96* 1,20* 1,70* 0,96 1,19 1,66
35 0,93 1,17 1,66 0,94 1,16 1,63
40 0,91* 1,15* 1,63* 0,92 1,14 1,61
45 0,89 1,13 1,61 0,90 1,12 1,59
50 0,88* 1,11* 1,59* 0,89 1,10 1,57
60 0,86* 1,08* 1,56* 0,87 1,08 1,54
70 0,84* 1,06* 1,53* 0,85 1,06 1,52
80 0,83* 1,04* 1,51* 0,83 1,04 1,50
90 0,82* 1,03* 1,49* 0,82 1,03 1,48
100 0,81* 1,02* 1,47* 0,81 1,02 1,46
200 0,75* 0,95* 1,38* 0,75 0,95 1,38
300 0,72* 0,91* 1,33* 0,72 0,91 1,33
500 0,69* 0,88* 1,28* 0,69 0,88 1,28
1000 0,65* 0,83* 1,22* 0,65 0,83 1,22
Lưu ý: các giá trị được đánh dấu hoa thị được tính toán từ dữ liệu và, nếu cần, được điều chỉnh trong quá trình phân tích thống kê. trình mô phỏng. Các giá trị còn lại được tính toán bằng mô phỏng máy tính thống kê.
Nếu chúng ta so sánh các điểm phần trăm cho RMS chung đã biết được đưa ra trong Bảng. 1, với các điểm phần trăm tương ứng được cho trong , chúng khác nhau trong một số trường hợp là 0,01 và trong một trường hợp là 0,02. Rõ ràng, điểm phần trăm được đưa ra trong bài viết này chính xác hơn, vì trong những trường hợp đáng ngờ, chúng đã được kiểm tra bằng mô hình máy tính thống kê.
Từ Bảng 1 có thể thấy rằng điểm phần trăm của tiêu chí Irwin khi sử dụng độ lệch chuẩn mẫu với cỡ mẫu tương đối nhỏ khác biệt rõ rệt so với điểm phần trăm khi sử dụng độ lệch chuẩn chung. Chỉ ở những cỡ mẫu đáng kể, khoảng 40, điểm phần trăm mới trở nên gần gũi. Vì vậy, khi sử dụng tiêu chí Irwin, bạn nên sử dụng các điểm phần trăm được đưa ra trong Bảng. 1, có tính đến thực tế là giá trị tính toán của tiêu chí thu được theo độ lệch chuẩn chung hoặc mẫu.
VĂN
1. Irvin J.O. Về một tiêu chí để từ chối quan sát bên ngoài //Biometrika.1925. Khu 17. P. 238-250.
2. Kobzar A.I. áp dụng thống kê toán học. - M.: FIZMATLIT, 2006. - 816s. © V.V. Zalyazhnykh
Khi sử dụng tài liệu, hãy đặt một liên kết.

Cỡ mẫu	Theo chung			Theo độ lệch chuẩn chọn lọc
	Mức độ đáng kể
	0,1	0,05	0,01	0,1	0,05	0,01
2	2,33*	2,77*	3,64*	-	-	-
3	1,79*	2,17*	2,90*	1,62	1,68	1,72
4	1,58	1,92	2,60	1,55	1,70	1,88
5	1,45	1,77	2,43	1,45	1,64	1,93/
6	1,37	1,67	2,30	1,38	1,60	1,94
7	1,31	1,60	2,22	1,32	1,55	1,93
8	1,26	1,55	2,14	1,27	1,51	1,92
9	1,22	1,50	2,09	1,23	1,47	1,90
10	1,18*	1,46*	2,04*	1,20	1,44	1,88
11	1,15	1,43	2,00	1,17	1,42	1,87
12	1,13	1,40	1,97	1,15	1,39	1,85
13	1,11	1,38	1,94	1,13	1,37	1,83
14	1,09	1,36	1,91	1,11	1,35	1,82
15	1,08	1,34	1,89	1,09	1,33	1,80
20	1,03*	1,27*	1,80*	1,03	1,27	1,75
25	0,99	1,23	1,74	0,99	1,22	1,70
30	0,96*	1,20*	1,70*	0,96	1,19	1,66
35	0,93	1,17	1,66	0,94	1,16	1,63
40	0,91*	1,15*	1,63*	0,92	1,14	1,61
45	0,89	1,13	1,61	0,90	1,12	1,59
50	0,88*	1,11*	1,59*	0,89	1,10	1,57
60	0,86*	1,08*	1,56*	0,87	1,08	1,54
70	0,84*	1,06*	1,53*	0,85	1,06	1,52
80	0,83*	1,04*	1,51*	0,83	1,04	1,50
90	0,82*	1,03*	1,49*	0,82	1,03	1,48
100	0,81*	1,02*	1,47*	0,81	1,02	1,46
200	0,75*	0,95*	1,38*	0,75	0,95	1,38
300	0,72*	0,91*	1,33*	0,72	0,91	1,33
500	0,69*	0,88*	1,28*	0,69	0,88	1,28
1000	0,65*	0,83*	1,22*	0,65	0,83	1,22