Tiểu sử Đặc trưng Phân tích

Công thức tính sai số lấy mẫu bình phương trung bình. Công thức lỗi lấy mẫu trung bình

Tại quan sát có chọn lọc phải được đảm bảo tai nạn lựa chọn các đơn vị. Mỗi đơn vị phải có cơ hội được lựa chọn như nhau. Đây là những gì một mẫu ngẫu nhiên được dựa trên.

ĐẾN mẫu ngẫu nhiên thực tế đề cập đến việc lựa chọn các đơn vị từ tất cả dân số(trước tiên không chia thành bất kỳ nhóm nào) bằng cách rút thăm (chủ yếu) hoặc một số phương pháp tương tự khác, ví dụ: sử dụng bảng Số ngẫu nhiên. Lựa chọn ngẫu nhiên- sự lựa chọn này không phải là ngẫu nhiên. Nguyên tắc ngẫu nhiên giả định rằng việc bao gồm hoặc loại trừ một đối tượng khỏi mẫu không thể bị ảnh hưởng bởi bất kỳ yếu tố nào ngoài sự ngẫu nhiên. Ví dụ thực sự ngẫu nhiên lựa chọn có thể đóng vai trò là trận hòa thắng: từ Tổng số Trong số vé được phát hành, một phần nhất định của các con số được chọn ngẫu nhiên và tiền thắng cược rơi vào chúng. Hơn nữa, tất cả các số đều có cơ hội bình đẳng để được đưa vào mẫu. Trong trường hợp này, số lượng đơn vị được chọn trong tổng thể mẫu thường được xác định dựa trên tỷ lệ mẫu được chấp nhận.

Chia sẻ mẫu là tỷ số giữa số đơn vị trong quần thể mẫu với số đơn vị trong tổng thể chung:

Vì vậy, với mẫu 5% từ một lô gồm 1000 bộ phận. cỡ mẫu P là 50 đơn vị và với mẫu 10% - 100 đơn vị. vân vân. Với quyền tổ chức khoa học lỗi lấy mẫu của tính đại diện có thể được giảm xuống giá trị tối thiểu, kết quả là việc quan sát có chọn lọc trở nên khá chính xác.

Trên thực tế lựa chọn ngẫu nhiên “trong thể tinh khiết“hiếm khi được sử dụng trong thực hành quan sát có chọn lọc, nhưng nó là nguyên bản trong số tất cả các hình thức chọn lọc khác; nó chứa đựng và thực hiện các nguyên tắc cơ bản của quan sát có chọn lọc.

Chúng ta hãy xem xét một số câu hỏi về lý thuyết phương pháp lấy mẫu và công thức sai số cho một mẫu ngẫu nhiên đơn giản.

Khi sử dụng phương pháp lấy mẫu trong thống kê, hai loại chỉ tiêu tổng hợp chính thường được sử dụng: giá trị trung bình của một đặc tính định lượnggiá trị tương đối của đặc tính thay thế(tỷ lệ hoặc trọng số cụ thể của các đơn vị trong một tổng thể thống kê khác với tất cả các đơn vị khác của tổng thể này chỉ bởi sự hiện diện của đặc điểm đang được nghiên cứu).

Chia sẻ có chọn lọc (w), hoặc tần số, được xác định bằng tỷ số giữa số lượng đơn vị có đặc tính đang được nghiên cứu T,ĐẾN Tổng sốđơn vị mẫu P:

Ví dụ: nếu trong số 100 chi tiết mẫu ( N=100), 95 phần hóa ra là tiêu chuẩn (T=95), thì phần mẫu

w=95/100=0,95 .

Để mô tả độ tin cậy của các chỉ số mẫu, có trung bìnhlỗi lấy mẫu tối đa

Lỗi lấy mẫu ? hay nói cách khác, sai số đại diện là sự khác biệt giữa mẫu tương ứng và đặc điểm chung:

*

*

Lỗi lấy mẫu chỉ là đặc trưng của các quan sát mẫu. Làm sao nhiều giá trị hơn lỗi này thì các chỉ tiêu mẫu càng khác biệt so với các chỉ tiêu chung tương ứng.

Giá trị trung bình mẫu và tỷ lệ mẫu vốn dĩ là biến ngẫu nhiên, có thể nhận các giá trị khác nhau tùy thuộc vào đơn vị dân số nào được đưa vào mẫu. Do đó, lỗi lấy mẫu cũng là các biến ngẫu nhiên và có thể lấy những nghĩa khác nhau. Do đó, mức trung bình của các lỗi có thể xảy ra được xác định - lỗi lấy mẫu trung bình.

Nó phụ thuộc vào cái gì lỗi lấy mẫu trung bình? Nếu tuân thủ nguyên tắc chọn ngẫu nhiên thì sai số lấy mẫu trung bình trước hết được xác định cỡ mẫu: Làm sao nhiều con số hơn khác hơn thế điều kiện bình đẳng, sai số lấy mẫu trung bình càng nhỏ. Che phủ khảo sát mẫu Tất cả số lượng lớn các đơn vị của dân số nói chung, chúng ta mô tả đặc điểm của toàn bộ dân số nói chung ngày càng chính xác hơn.

Sai số trung bình việc lấy mẫu cũng phụ thuộc vào mức độ biến đổi tính trạng đang được nghiên cứu. Mức độ biến đổi, như đã biết, được đặc trưng bởi sự phân tán? 2 hoặc w(1-w)-- để tìm một dấu hiệu thay thế. Độ biến thiên của đặc tính càng nhỏ và do đó độ phân tán càng nhỏ thì sai số lấy mẫu trung bình càng nhỏ và ngược lại. Với độ phân tán bằng 0 (đặc tính không thay đổi), sai số lấy mẫu trung bình bằng 0, nghĩa là bất kỳ đơn vị nào trong tổng thể sẽ mô tả chính xác đặc điểm của toàn bộ tổng thể theo đặc điểm này.

Sự phụ thuộc của sai số lấy mẫu trung bình vào thể tích của nó và mức độ biến thiên của thuộc tính được phản ánh trong các công thức có thể được sử dụng để tính sai số lấy mẫu trung bình trong các điều kiện quan sát chọn lọc, khi các đặc điểm chung ( x,p)đều chưa được biết và do đó, dường như không thể tìm thấy lỗi lấy mẫu thực sự trực tiếp bằng cách sử dụng các công thức (Mẫu 1), (Mẫu 2).

Sh Tình cờ lựa chọn lại lỗi trung bình về mặt lý thuyết được tính toán bằng các công thức sau:

* trung bình đặc tính định lượng

* để được chia sẻ (thuộc tính thay thế)

Vì thực tế có sự khác biệt của một đặc điểm trong quần thể? 2 không biết chính xác, trong thực tế họ sử dụng giá trị độ phân tán S 2 tính toán cho tổng thể mẫu dựa trên định luật số lượng lớn, Theo đó dân số mẫu với cỡ mẫu đủ lớn, nó tái tạo khá chính xác các đặc điểm của dân số nói chung.

Như vậy, công thức tính toán trung bình lỗi lấy mẫu với việc chọn lại ngẫu nhiên, kết quả sau sẽ là:

* cho đặc tính định lượng trung bình

* để được chia sẻ (thuộc tính thay thế)

Tuy nhiên, độ phân tán của quần thể mẫu không bằng độ phân tán của tổng thể chung và do đó, sai số lấy mẫu trung bình được tính toán bằng các công thức (Mẫu 5) và (Mẫu 6) sẽ chỉ mang tính gần đúng. Nhưng lý thuyết xác suất đã chứng minh rằng phương sai chungđược thể hiện thông qua môn tự chọn bằng quan hệ sau:

Bởi vì P/(N-1) cho đủ lớn P -- giá trị gần bằng 1 thì chúng ta có thể giả sử điều đó và do đó, trong các tính toán thực tế về sai số lấy mẫu trung bình, có thể sử dụng các công thức (Mẫu 5) và (Mẫu 6). Và chỉ trong trường hợp mẫu nhỏ (khi cỡ mẫu không quá 30) mới cần tính đến hệ số P/(N-1) và tính toán sai số trung bình mẫu nhỏ theo công thức:

WX Với lựa chọn ngẫu nhiên không lặp lại Trong các công thức tính sai số lấy mẫu trung bình ở trên, cần nhân biểu thức căn thức với 1-(n/N), vì trong quá trình lấy mẫu không lặp lại, số lượng đơn vị trong tổng thể chung sẽ giảm đi. Vì vậy, để lấy mẫu không lặp lại công thức tính toán lỗi lấy mẫu trung bình sẽ có dạng sau:

* cho đặc tính định lượng trung bình

* để được chia sẻ (thuộc tính thay thế)

. (mẫu 10)

Bởi vì P luôn ít hơn N, thì thừa số bổ sung 1-( không/không) sẽ luôn nhỏ hơn một. Theo đó, sai số trung bình trong quá trình lựa chọn không lặp lại sẽ luôn nhỏ hơn trong quá trình lựa chọn lặp lại. Đồng thời, với tỷ lệ mẫu tương đối nhỏ, hệ số này gần bằng 1 (ví dụ: với mẫu 5% thì bằng 0,95; với mẫu 2% thì bằng 0,98, v.v.). Vì vậy, đôi khi trong thực tế họ sử dụng các công thức (Mẫu 5) và (Mẫu 6) không có hệ số nhân xác định để xác định sai số lấy mẫu trung bình, mặc dù mẫu được tổ chức dưới dạng không lặp lại. Điều này xảy ra trong trường hợp số lượng đơn vị trong tổng thể N không xác định hoặc không giới hạn, hoặc khi P rất ít so với N và về bản chất, việc đưa vào một hệ số nhân bổ sung, có giá trị gần bằng đơn vị, sẽ hầu như không ảnh hưởng đến giá trị của sai số lấy mẫu trung bình.

Lấy mẫu cơ học là việc lựa chọn các đơn vị thành một quần thể mẫu từ tổng thể chung, được chia theo tiêu chí trung lập thành khoảng bằng nhau(nhóm), được thực hiện sao cho từ mỗi nhóm chỉ có một đơn vị được chọn làm mẫu. Để tránh sai lệch, nên chọn đơn vị ở giữa mỗi nhóm.

Khi tổ chức lựa chọn cơ học, các đơn vị của quần thể được sắp xếp sơ bộ (thường là dạng danh sách) theo một thứ tự nhất định (ví dụ theo bảng chữ cái, vị trí, theo thứ tự tăng dần hoặc giảm dần các giá trị của một số chỉ tiêu không liên quan đến thuộc tính). đang được nghiên cứu, v.v.), v.v.), sau đó một số đơn vị nhất định được chọn một cách máy móc, tại một khoảng thời gian nhất định. Trong trường hợp này, kích thước của khoảng trong dân số bằng giá trị nghịch đảo chia sẻ mẫu. Vì vậy, với mẫu 2%, mỗi đơn vị thứ 50 được chọn và kiểm tra (1: 0,02), với mẫu 5% - mỗi đơn vị thứ 20 (1: 0,05), ví dụ, phần hội tụ từ máy.

Khi đủ dân cư lớn Lựa chọn cơ học gần như hoàn toàn ngẫu nhiên xét về độ chính xác của kết quả. Vì vậy, để xác định sai số trung bình của lấy mẫu cơ học, người ta sử dụng các công thức lấy mẫu ngẫu nhiên không lặp lại thích hợp (Mẫu 9), (Mẫu 10).

Để chọn các đơn vị từ một quần thể không đồng nhất, cái gọi là mẫu điển hình , được sử dụng trong trường hợp tất cả các đơn vị của tổng thể nói chung có thể được chia thành nhiều nhóm đồng nhất về mặt chất lượng, tương tự nhau theo các đặc điểm ảnh hưởng đến các chỉ số đang được nghiên cứu.

Khi khảo sát doanh nghiệp, các nhóm như vậy có thể là ngành, tiểu ngành, hình thức sở hữu chẳng hạn. Sau đó, từ mỗi nhóm điển hình, một mẫu hoàn toàn ngẫu nhiên hoặc cơ học được sử dụng để chọn riêng các đơn vị vào quần thể mẫu.

Lấy mẫu điển hình thường được sử dụng khi nghiên cứu các quần thể thống kê phức tạp. Ví dụ, trong một cuộc khảo sát mẫu về ngân sách gia đình của người lao động và người lao động trong một số khu vực của nền kinh tế, năng suất lao động của người lao động trong doanh nghiệp đại diện cho nhóm riêng biệt theo trình độ chuyên môn.

Một mẫu điển hình mang lại nhiều hơn kết quả chính xác so với các phương pháp chọn đơn vị khác trong quần thể mẫu. Việc gõ tổng thể nói chung đảm bảo tính đại diện của mẫu đó, tính đại diện của từng nhóm loại hình trong đó, giúp loại trừ ảnh hưởng của sự phân tán giữa các nhóm đối với sai số lấy mẫu trung bình.

Khi xác định sai số trung bình của một mẫu điển hình hoạt động như một chỉ báo về sự thay đổi Trung bình của phương sai trong nhóm.

Lỗi lấy mẫu trung bình được tìm thấy bằng cách sử dụng các công thức:

* cho đặc tính định lượng trung bình

(tái lựa chọn); (mẫu 11)

(lựa chọn không thể đảo ngược); (mẫu 12)

* để được chia sẻ (thuộc tính thay thế)

(tái lựa chọn); (mẫu.13)

(lựa chọn không lặp lại), (mẫu 14)

đâu là mức trung bình của các phương sai nội nhóm đối với quần thể mẫu;

Giá trị trung bình của các phương sai trong nhóm của tỷ lệ (của một đặc điểm thay thế) đối với tổng thể mẫu.

Lấy mẫu nối tiếp liên quan đến việc lựa chọn ngẫu nhiên từ tổng thể không phải các đơn vị riêng lẻ mà từ các nhóm bằng nhau của chúng (tổ, chuỗi) để khiến tất cả các đơn vị trong các nhóm đó phải được quan sát mà không có ngoại lệ.

Ứng dụng lấy mẫu nối tiếp do thực tế là nhiều hàng hóa để vận chuyển, lưu trữ và bán được đóng gói theo bó, hộp, v.v. Vì vậy, khi kiểm soát chất lượng hàng hóa đóng gói, việc kiểm tra nhiều gói (loạt) sẽ hợp lý hơn là chọn từ tất cả các gói. khối lượng bắt buộc Các mặt hàng.

Vì trong các nhóm (chuỗi) tất cả các đơn vị không có ngoại lệ đều được kiểm tra nên sai số lấy mẫu trung bình (khi chọn các chuỗi bằng nhau) chỉ phụ thuộc vào độ phân tán giữa các nhóm (giữa các chuỗi).

Sh Lỗi lấy mẫu trung bình cho tính trạng định lượng trung bình trong quá trình lựa chọn nối tiếp chúng được tìm thấy bằng cách sử dụng các công thức:

(tái lựa chọn); (mẫu.15)

(lựa chọn không lặp lại), (mẫu 16)

Ở đâu r- số tập đã chọn; R- tổng số tập.

Phương sai giữa các nhóm của một mẫu nối tiếp được tính như sau:

mức trung bình ở đâu Tôi- loạt thứ; - giá trị trung bình chung của toàn bộ quần thể mẫu.

Sh Lỗi lấy mẫu trung bình cho lượt chia sẻ (thuộc tính thay thế) trong lựa chọn nối tiếp:

(tái lựa chọn); (mẫu 17)

(lựa chọn không lặp lại). (mẫu 18)

Liên nhóm(liên loạt) phương sai của việc chia sẻ mẫu nối tiếpđược xác định bởi công thức:

, (mẫu 19)

đâu là phần của đặc điểm trong Tôi-thứ loạt; - tổng tỷ trọng của đặc điểm trong toàn bộ quần thể mẫu.

Trong thực tế điều tra thống kê, ngoài các phương pháp lựa chọn đã thảo luận trước đó, sự kết hợp giữa chúng được sử dụng. (tuyển chọn tổng hợp).

quan sát có chọn lọc

Khái niệm quan sát mẫu

Phương pháp lấy mẫu được sử dụng khi việc sử dụng quan sát liên tục là không thể thực hiện được do lượng dữ liệu khổng lồ hoặc không khả thi về mặt kinh tế. Ví dụ, sự bất khả thi về mặt vật lý xảy ra khi nghiên cứu dòng hành khách, giá cả thị trường và ngân sách gia đình. Sự kém hiệu quả về kinh tế xảy ra khi đánh giá chất lượng hàng hóa liên quan đến việc chúng bị phá hủy. Ví dụ như nếm thử, kiểm tra độ bền của gạch, v.v. Quan sát mẫu cũng được sử dụng để xác minh kết quả quan sát liên tục.

Các đơn vị thống kê được chọn để quan sát là chọn lọc toàn bộ hoặc vật mẫu, và toàn bộ mảng - tổng quan tổng thể (GS). Trong trường hợp này, số lượng đơn vị trong mẫu được ký hiệu là P, trong toàn bộ HS - N. Thái độ không/khôngđược gọi là kích thước tương đối hoặc chia sẻ mẫu.

Chất lượng của kết quả quan sát mẫu phụ thuộc vào tính đại diện mẫu, tức là về mức độ đại diện của nó trong GC. Để đảm bảo tính đại diện của mẫu, cần tuân thủ nguyên tắc chọn đơn vị ngẫu nhiên, trong đó giả định rằng việc đưa đơn vị HS vào mẫu không thể bị ảnh hưởng bởi bất kỳ yếu tố nào khác ngoài sự ngẫu nhiên.

Phương pháp xét nghiệm

1. Thực sự ngẫu nhiên lựa chọn: tất cả các đơn vị GS đều được đánh số và các số được rút ra từ kết quả rút thăm tương ứng với các đơn vị có trong mẫu và số lượng bằng với cỡ mẫu dự kiến. Trong thực tế, người ta sử dụng bộ tạo số ngẫu nhiên thay cho việc rút thăm. Phương pháp này sự lựa chọn có thể lặp đi lặp lại(khi mỗi đơn vị được chọn làm mẫu sẽ quay về HS sau khi quan sát và có thể khảo sát lại) và không thể lặp lại(khi đơn vị khảo sát không trả lại HS và không thể khảo sát lại). Với việc lựa chọn lặp lại, xác suất lọt vào mẫu đối với mỗi đơn vị của GS không thay đổi và với việc lựa chọn lặp lại, xác suất lọt vào mẫu sẽ thay đổi (tăng), nhưng đối với một số ít đơn vị còn lại trong GS sau khi chọn từ đó, xác suất lọt vào mẫu mẫu là như nhau.



2. Cơ khí lựa chọn: các đơn vị dân số được chọn với một bước không đổi Không có. Vì vậy, nếu dân số nói chung chứa 100 nghìn đơn vị và bạn cần chọn 1 nghìn đơn vị thì mỗi đơn vị thứ một trăm sẽ được đưa vào mẫu.

3. phân tầng Việc lựa chọn (phân tầng) được thực hiện từ một quần thể nói chung không đồng nhất khi lần đầu tiên nó được chia thành nhóm đồng nhất, sau đó các đơn vị từ mỗi nhóm được chọn vào quần thể mẫu một cách ngẫu nhiên hoặc một cách máy móc theo tỷ lệ của chúng trong quần thể chung.

4. nối tiếp Lựa chọn (cụm): không phải các đơn vị riêng lẻ, mà một số chuỗi (tổ) nhất định được chọn ngẫu nhiên hoặc máy móc, trong đó việc quan sát liên tục được thực hiện.

Lỗi lấy mẫu trung bình

Sau khi hoàn thành việc lựa chọn số lượng đơn vị cần thiết trong mẫu và ghi lại đặc điểm nghiên cứu của các đơn vị này do chương trình quan sát cung cấp, chúng ta tiến hành tính toán các chỉ tiêu tổng quát. Chúng bao gồm giá trị trung bình của đặc tính đang được nghiên cứu và tỷ lệ đơn vị có bất kỳ giá trị nào cho đặc tính này. Tuy nhiên, nếu GS tạo ra một số mẫu, sau khi xác định các đặc điểm chung của chúng, thì có thể xác định rằng giá trị của chúng sẽ khác, ngoài ra, chúng sẽ khác với giá trị thực của chúng trong GS, nếu điều này được xác định bằng cách sử dụng quan sát liên tục . Nói cách khác, các đặc tính tổng quát tính toán từ dữ liệu mẫu sẽ khác với giá trị thực của chúng trong GS nên chúng tôi đưa ra các ký hiệu sau (Bảng 8).

Bảng 8. Huyền thoại

Sự khác biệt giữa giá trị của các đặc điểm tổng quát của mẫu và tổng thể chung được gọi là lỗi lấy mẫu,được chia thành lỗi sự đăng ký và lỗi tính đại diện. Thứ nhất phát sinh do thông tin không đúng hoặc thiếu chính xác do chưa hiểu rõ bản chất của vấn đề, sự thiếu chú ý của nhà đăng ký khi điền phiếu, biểu mẫu, v.v. Nó khá dễ dàng để phát hiện và loại bỏ. Thứ hai phát sinh từ việc không tuân thủ nguyên tắc chọn ngẫu nhiên các đơn vị trong mẫu. Nó khó phát hiện và loại bỏ hơn, nó lớn hơn nhiều so với lần đầu tiên và do đó việc đo lường nó là nhiệm vụ chính của quan sát có chọn lọc.

Để đo sai số lấy mẫu, sai số trung bình của nó được xác định bằng công thức (39) đối với lấy mẫu lặp lại và công thức (40) đối với lấy mẫu không lặp lại:

= ;(39) = . (40)

Từ công thức (39) và (40), rõ ràng là sai số trung bình nhỏ hơn đối với lấy mẫu không lặp lại, điều này quyết định việc sử dụng rộng rãi hơn.

Khái niệm và tính toán sai số lấy mẫu.

Nhiệm vụ của quan sát mẫu là đưa ra ý kiến ​​chính xác về các chỉ số tóm tắt của toàn bộ dân số trên cơ sở một phần nào đó được quan sát. Độ lệch có thể có của tỷ lệ mẫu và giá trị trung bình mẫu so với tỷ lệ và giá trị trung bình trong tổng thể được gọi là lỗi lấy mẫu hoặc lỗi về tính đại diện. Độ lớn của sai số này càng lớn thì các chỉ số quan sát mẫu càng khác biệt với các chỉ số tổng thể chung.

Chúng khác nhau:

Lỗi lấy mẫu;

Lỗi đăng ký.

Lỗi đăng ký phát sinh khi một sự kiện được thiết lập không chính xác trong quá trình quan sát. Chúng là đặc trưng của cả quan sát liên tục và quan sát chọn lọc, nhưng trong quan sát chọn lọc thì chúng ít hơn.

Về bản chất, lỗi là:

Có chủ ý – có chủ ý, tức là các đơn vị tốt nhất hoặc tồi tệ nhất trong tổng thể đều được chọn. Trong trường hợp này, các quan sát mất đi ý nghĩa;

Ngẫu nhiên – nguyên tắc tổ chức cơ bản của việc quan sát lấy mẫu là tránh lựa chọn có chủ ý, tức là. đảm bảo tuân thủ nghiêm ngặt nguyên tắc chọn lọc ngẫu nhiên.

Nguyên tắc chung lựa chọn ngẫu nhiên là: các đơn vị riêng lẻ của tổng thể phải có những điều kiện và cơ hội hoàn toàn giống nhau để rơi vào số lượng đơn vị có trong mẫu. Điều này đặc trưng cho sự độc lập của kết quả lấy mẫu với ý chí của người quan sát. Ý chí của người quan sát làm phát sinh những sai sót có chủ ý. Lỗi lấy mẫu trong lấy mẫu ngẫu nhiên là tính chất ngẫu nhiên. Nó mô tả mức độ sai lệch của các đặc tính chung so với các đặc tính của mẫu.

Do thực tế là các đặc điểm của dân số được nghiên cứu khác nhau nên thành phần của các đơn vị có trong mẫu có thể không trùng với thành phần của các đơn vị của toàn bộ dân số. Nó có nghĩa là R và không trùng với W Và . Sự khác biệt có thể có giữa các đặc điểm này được xác định bằng sai số lấy mẫu, được xác định theo công thức:

đâu là phương sai chung.

phương sai mẫu ở đâu.

Điều này cho thấy phương sai chung khác với phương sai mẫuđúng giờ.

Có lựa chọn lặp đi lặp lại và không lặp lại. Bản chất của việc lựa chọn lặp lại là mỗi đơn vị có trong mẫu, sau khi quan sát, sẽ quay trở lại tổng thể chung và có thể được kiểm tra lại. Khi lấy mẫu lại, sai số lấy mẫu trung bình được tính:

Đối với chỉ số về tỷ lệ của đặc tính thay thế, phương sai mẫu được xác định theo công thức:

Trong thực tế, lựa chọn lặp lại hiếm khi được sử dụng. Với phương pháp chọn lọc không lặp lại, quy mô của quần thể nói chung N bị giảm trong quá trình lấy mẫu, công thức tính sai số lấy mẫu trung bình đối với một đặc tính định lượng có dạng:



, Sau đó

Một trong những giá trị có thể có trong đó tỷ lệ của đặc tính được nghiên cứu có thể bằng:

lỗi lấy mẫu của thuộc tính thay thế ở đâu.

Ví dụ.

Khi lấy mẫu 10% sản phẩm trong một lô thành phẩm bằng phương pháp không lấy mẫu lặp lại, thu được dữ liệu sau về độ ẩm trong các mẫu.

Xác định % độ ẩm trung bình, phương sai, giá trị trung bình độ lệch chuẩn, với xác suất 0,954 giới hạn có thể, trong đó nó được mong đợi trung bình. % độ ẩm của tất cả các sản phẩm hoàn chỉnh, với xác suất là 0,987 giới hạn có thể trọng lượng riêng sản phẩm tiêu chuẩn, với điều kiện lô không đạt tiêu chuẩn bao gồm các sản phẩm có độ ẩm lên tới 13 và trên 19%.

Chỉ với một xác suất nhất định, chúng ta mới có thể nói rằng phần chia chung của phần mẫu và mức trung bình chung của mẫu có nghĩa là sai lệch bởi t một lần.

Trong thống kê những sai lệch này được gọi là lỗi lấy mẫu tối đa và được chỉ định.

Xác suất phán đoán có thể tăng hoặc giảm tùy theo t một lần. Với xác suất 0,683, 0,954, 0,987 thì các chỉ tiêu của tổng thể được xác định từ các chỉ tiêu của mẫu.

Lý thuyết thống kê: bài giảng Burkhanova Inessa Viktorovna

3. Lỗi lấy mẫu

3. Lỗi lấy mẫu

Mỗi đơn vị trong một mẫu quan sát phải có cơ hội bình đẳng với những đơn vị khác để được chọn - đây là cơ sở của một mẫu ngẫu nhiên thích hợp.

Lấy mẫu ngẫu nhiên thích hợp - là việc lựa chọn các đơn vị từ toàn bộ dân số bằng cách rút thăm hoặc các hình thức khác theo cách tương tự.

Nguyên tắc ngẫu nhiên là việc bao gồm hoặc loại trừ một hạng mục khỏi mẫu không thể bị ảnh hưởng bởi bất kỳ yếu tố nào ngoài sự ngẫu nhiên.

Chia sẻ mẫu là tỷ số giữa số đơn vị trong quần thể mẫu với số đơn vị trong tổng thể chung:

Lựa chọn ngẫu nhiên thích hợp ở dạng thuần túy là lựa chọn đầu tiên trong số tất cả các loại lựa chọn khác; nó chứa và thực hiện các nguyên tắc cơ bản của việc lấy mẫu quan sát thống kê.

Hai loại chỉ số chung chính được sử dụng trong phương pháp lấy mẫu là giá trị trung bình của đặc tính định lượng và giá trị tương đối dấu hiệu thay thế

Tỷ lệ mẫu (w), hay độ đặc hiệu, được xác định bằng tỷ lệ số lượng đơn vị có đặc tính đang được nghiên cứu tôi,đến tổng số đơn vị trong quần thể mẫu (n):

Để mô tả độ tin cậy của các chỉ số mẫu, cần phân biệt giữa sai số lấy mẫu trung bình và sai số lấy mẫu tối đa.

Sai số lấy mẫu hay còn gọi là sai số đại diện là sự khác biệt giữa mẫu tương ứng và đặc điểm chung:

?x =|x – x|;

?w =|x – p|.

Chỉ các quan sát mẫu mới có thể xảy ra lỗi lấy mẫu.

Giá trị trung bình mẫu và tỷ lệ mẫu– đây là các biến ngẫu nhiên có các giá trị khác nhau tùy thuộc vào đơn vị của tổng thể thống kê đang được nghiên cứu được đưa vào mẫu. Theo đó, sai số lấy mẫu cũng là biến ngẫu nhiên và cũng có thể mang những giá trị khác nhau. Vì vậy hãy xác định giá trị trung bình của lỗi có thể xảy ra– sai số lấy mẫu trung bình.

Sai số lấy mẫu trung bình được xác định bởi cỡ mẫu: số càng lớn, các yếu tố khác bằng nhau thì sai số lấy mẫu trung bình càng nhỏ. Bằng cách bao gồm số lượng ngày càng tăng các đơn vị của dân số nói chung bằng một cuộc khảo sát mẫu, chúng tôi mô tả đặc điểm của toàn bộ dân số nói chung ngày càng chính xác hơn.

Sai số lấy mẫu trung bình phụ thuộc vào mức độ biến thiên của đặc tính đang được nghiên cứu, lần lượt mức độ biến thiên được đặc trưng bởi độ phân tán? 2 hoặc w(l – w)- cho một dấu hiệu thay thế. Sự biến đổi và phân tán tính trạng càng nhỏ thì sai số lấy mẫu trung bình càng nhỏ và ngược lại.

Trong trường hợp lấy mẫu lặp lại ngẫu nhiên, sai số trung bình được tính theo lý thuyết bằng các công thức sau:

1) đối với đặc tính định lượng trung bình:

Ở đâu? 2 – giá trị trung bình của độ phân tán của đặc tính định lượng.

2) để chia sẻ (thuộc tính thay thế):

Vậy phương sai của một tính trạng trong quần thể là gì? 2 chưa được biết chính xác, trong thực tế họ sử dụng giá trị độ phân tán S 2 được tính cho quần thể mẫu trên cơ sở định luật số lớn, theo đó quần thể mẫu với cỡ mẫu đủ lớn sẽ tái tạo khá chính xác đặc điểm của dân số nói chung.

Các công thức tính sai số lấy mẫu trung bình cho việc lấy mẫu lại ngẫu nhiên như sau. Vì kích thước trung bìnhĐặc tính định lượng: phương sai tổng quát được thể hiện thông qua phương sai chọn lọc theo quan hệ sau:

trong đó S 2 là giá trị phân tán.

Lấy mẫu cơ học– đây là việc lựa chọn các đơn vị thành một quần thể mẫu từ tổng thể chung, được chia theo tiêu chí trung lập thành các nhóm bằng nhau; Nó được thực hiện sao cho từ mỗi nhóm như vậy chỉ có một đơn vị được chọn làm mẫu.

Trong lấy mẫu cơ học, các đơn vị của tổng thể thống kê đang được nghiên cứu được sắp xếp sơ bộ theo một thứ tự nhất định, sau đó một số đơn vị nhất định được chọn một cách máy móc trong một khoảng thời gian nhất định. Trong trường hợp này, kích thước của khoảng trong tổng thể bằng giá trị nghịch đảo của tỷ lệ mẫu.

Với quần thể đủ lớn, việc chọn lọc cơ học gần giống với tự ngẫu nhiên xét về độ chính xác của kết quả, do đó, để xác định sai số trung bình của lấy mẫu cơ học, người ta sử dụng các công thức lấy mẫu tự ngẫu nhiên không lặp lại.

Để chọn các đơn vị từ một quần thể không đồng nhất, cái gọi là mẫu điển hình được sử dụng, nó được sử dụng khi tất cả các đơn vị của tổng thể nói chung có thể được chia thành nhiều nhóm tương tự, đồng nhất về chất lượng theo các đặc điểm mà các chỉ số được nghiên cứu phụ thuộc vào.

Sau đó, từ mỗi nhóm điển hình, việc lựa chọn các đơn vị riêng lẻ vào quần thể mẫu được thực hiện bằng cách sử dụng mẫu hoàn toàn ngẫu nhiên hoặc cơ học.

Lấy mẫu mẫu thường được sử dụng khi nghiên cứu các quần thể thống kê phức tạp.

Lấy mẫu điển hình cho kết quả chính xác hơn. Việc gõ tổng thể nói chung đảm bảo tính đại diện của mẫu đó, tính đại diện của từng nhóm loại hình trong đó, giúp loại trừ ảnh hưởng của sự phân tán giữa các nhóm đối với sai số lấy mẫu trung bình. Do đó, khi xác định sai số trung bình của một mẫu điển hình, giá trị trung bình của các phương sai trong nhóm đóng vai trò là chỉ báo về sự biến thiên.

Lấy mẫu nối tiếp bao gồm việc lựa chọn ngẫu nhiên từ một quần thể chung gồm các nhóm bằng nhau để quan sát tất cả các đơn vị trong các nhóm đó mà không có ngoại lệ.

Vì trong các nhóm (chuỗi) tất cả các đơn vị không có ngoại lệ đều được kiểm tra nên sai số lấy mẫu trung bình (khi chọn các chuỗi bằng nhau) chỉ phụ thuộc vào độ phân tán giữa các nhóm (giữa các chuỗi).

Từ cuốn sách Ngân sách cá nhân. Tiền được kiểm soát tác giả Makarov Sergey Vladimirovich

Những sai lầm thường trú Bạn có thể tiếp cận những sai lầm theo nhiều cách khác nhau: bạn có thể sợ mắc phải chúng và lo lắng về từng sai lầm đó, bạn có thể vui mừng trước những sai lầm và khủng hoảng của mình như những chỉ dẫn trên con đường dẫn đến thành công và chiến thắng cá nhân. Điều duy nhất không đổi về những sai lầm là bạn phải trả giá cho chúng.

Từ cuốn sách Sách để bàn về kiểm toán nội bộ. Rủi ro và quy trình kinh doanh tác giả Kryshkin Oleg

Lấy mẫu Quy trình lấy mẫu là một giai đoạn không thể thiếu của dự án kiểm toán nội bộ. Nó được mô tả chi tiết trong nhiều nguồn khác nhau về chủ đề kiểm toán. Tuy nhiên, theo nhiều cách, những mô tả như vậy có tính chất học thuật. Tôi đề nghị tập trung vào những

Từ cuốn sách Tâm lý đầu tư [Cách ngừng làm những điều ngu ngốc với tiền của bạn] bởi Richards Carl

Sai lầm trong đầu tư là sai lầm của nhà đầu tư Bây giờ tôi tin chắc hơn bao giờ hết rằng mọi sai lầm trong đầu tư thực ra đều là sai lầm của nhà đầu tư. Không giống như các nhà đầu tư, đầu tư là một sự lựa chọn. Chính xác về điều này

tác giả Shcherbina Lidiya Vladimirovna

29. Xác định cỡ mẫu cần thiết Một trong nguyên tắc khoa học về lý thuyết của phương pháp chọn mẫu là đảm bảo đủ số lượng đơn vị được chọn. lỗi tiêu chuẩn việc lấy mẫu luôn gắn liền với việc tăng cỡ mẫu. Phép tính

Từ cuốn sách Lý thuyết tổng quát số liệu thống kê tác giả Shcherbina Lidiya Vladimirovna

30. Phương pháp lựa chọn và hình thức lấy mẫu. Lấy mẫu ngẫu nhiên thực tế Trong lý thuyết về phương pháp lấy mẫu, nhiều phương pháp lựa chọn và kiểu lấy mẫu khác nhau đã được phát triển để đảm bảo tính đại diện. Phương pháp lựa chọn đề cập đến thủ tục lựa chọn các đơn vị từ dân số nói chung.

Từ cuốn sách Lý thuyết chung về thống kê tác giả Shcherbina Lidiya Vladimirovna

31. Lấy mẫu cơ học và điển hình Với lấy mẫu cơ học thuần túy, toàn bộ tập hợp chung của các đơn vị trước hết phải được trình bày dưới dạng danh sách các đơn vị lựa chọn, được biên soạn theo thứ tự trung lập nào đó liên quan đến đặc điểm đang được nghiên cứu. Sau đó liệt kê

Từ cuốn sách Lý thuyết chung về thống kê tác giả Shcherbina Lidiya Vladimirovna

32. Lấy mẫu nối tiếp và kết hợp Lấy mẫu nối tiếp (cụm) là một kiểu hình thành quần thể mẫu khi không phải các đơn vị được khảo sát mà là các nhóm đơn vị (chuỗi, tổ) được chọn ngẫu nhiên. Bên trong chuỗi đã chọn (tổ)

Từ cuốn sách Lý thuyết chung về thống kê tác giả Shcherbina Lidiya Vladimirovna

33. Lấy mẫu nhiều tầng, nhiều pha và xuyên thấu. Điểm đặc biệt của lấy mẫu nhiều giai đoạn là quần thể mẫu được hình thành dần dần, theo các giai đoạn chọn lọc. Ở giai đoạn đầu tiên, sử dụng phương pháp và loại lựa chọn được xác định trước

tác giả Konik Nina Vladimirovna

3. Xác định cỡ mẫu yêu cầu Một trong những nguyên tắc khoa học trong lý thuyết lấy mẫu là đảm bảo đủ số lượng đơn vị được chọn. Sự cần thiết về mặt lý thuyết để tuân thủ nguyên tắc này được trình bày trong bằng chứng định lý giới hạn

Từ cuốn sách Lý thuyết thống kê tổng quát: Bài giảng tác giả Konik Nina Vladimirovna

4. Phương pháp lựa chọn và kiểu lấy mẫu Lý thuyết về phương pháp chọn mẫu đã phát triển nhiều cách khác nhau lựa chọn và các loại mẫu để đảm bảo tính đại diện. Phương pháp lựa chọn đề cập đến thủ tục lựa chọn các đơn vị từ dân số nói chung. Có hai phương pháp lựa chọn: lặp lại

Từ cuốn sách Lý thuyết thống kê tác giả Burkhanova Inessa Viktorovna

36. Lỗi lấy mẫu Lấy mẫu ngẫu nhiên đúng cách là việc lựa chọn các đơn vị từ toàn bộ tổng thể bằng cách rút thăm hoặc các phương pháp tương tự khác. Nguyên tắc ngẫu nhiên là việc đưa vào hay loại trừ một đối tượng khỏi mẫu không thể bị ảnh hưởng bởi bất kỳ yếu tố nào.

Từ cuốn sách Thư tín kinh doanh: hướng dẫn tác giả Kirsanova Maria Vladimirovna

Lỗi từ vựng 1. Sử dụng từ ngữ và thuật ngữ không chính xác Phần lớn lỗi trong thư tín thương mại là lỗi từ vựng. Việc thiếu hiểu biết không chỉ dẫn đến những điều vô nghĩa gây tò mò mà còn dẫn đến sự phi lý. từ lóng

Từ cuốn sách Kỷ nguyên mới- nỗi lo xưa: Kinh tế chính trị tác giả Yasin Evgeniy Grigorievich

5 Sai lầm của chúng tôi Chúng tôi khẳng định: con đường cải cách thị trường đã chọn là đúng đắn. Và họ không thất bại chút nào, họ chỉ vấp ngã lần nữa. Nhưng vẫn có những sai lầm và thiếu sót. Đó là sai lầm của chúng ta và của lãnh đạo đất nước mà chúng ta đã không ngăn chặn được. Sai lầm - theo nhiều cách

bởi Kurtis Face

Tầm quan trọng của cỡ mẫu Như tôi đã nói trước đó, mọi người có xu hướng chú ý quá nhiều đến những trường hợp hiếm gặp của một hiện tượng, mặc dù, từ quan điểm thống kê, không thể rút ra được nhiều thông tin từ một vài trường hợp. Đây là lý do chính

Từ cuốn sách Đường đi của Rùa. Từ nghiệp dư đến thương nhân huyền thoại bởi Kurtis Face

Mẫu đại diện Tính đại diện của các thử nghiệm của chúng tôi nhằm mục đích dự đoán tương lai được xác định bởi hai yếu tố: – Số lượng thị trường: các thử nghiệm được thực hiện ở các thị trường khác nhau có thể sẽ bao gồm các thị trường có mức độ khác nhau các loại biến động

Từ cuốn sách Đường đi của Rùa. Từ nghiệp dư đến thương nhân huyền thoại bởi Kurtis Face

Cỡ mẫu Khái niệm về cỡ mẫu rất đơn giản: để rút ra kết luận có giá trị về mặt thống kê, bạn cần có một mẫu đủ lớn. Mẫu càng nhỏ thì kết luận có thể rút ra càng chắc chắn; Mẫu càng lớn thì chất lượng của kết luận càng tốt. Không có

Dựa trên các giá trị đặc điểm của các đơn vị trong quần thể mẫu đăng ký theo chương trình quan trắc thống kê, tính toán các đặc điểm mẫu tổng quát: ý nghĩa mẫu() Và chia sẻ mẫu các đơn vị sở hữu bất kỳ đặc điểm nào được các nhà nghiên cứu quan tâm, trong tổng số của chúng ( w).

Sự khác biệt giữa các chỉ số của mẫu và dân số nói chung được gọi là lỗi lấy mẫu.

Lỗi lấy mẫu, giống như lỗi trong bất kỳ loại quan sát thống kê nào khác, được chia thành lỗi đăng ký và lỗi đại diện. Mục tiêu chính của phương pháp lấy mẫu là nghiên cứu và đo lường lỗi ngẫu nhiên tính đại diện.

Giá trị trung bình mẫu và tỷ lệ mẫu là các biến ngẫu nhiên có thể nhận các giá trị khác nhau tùy thuộc vào đơn vị dân số nào được đưa vào mẫu. Vì vậy, lỗi lấy mẫu cũng là các biến ngẫu nhiên và có thể mang những ý nghĩa khác nhau. Do đó, mức trung bình của các lỗi có thể được xác định.

Lỗi lấy mẫu trung bình (µ - mu) bằng:

trung bình ; để chia sẻ ,

Ở đâu R- sự chia sẻ của một đặc điểm nhất định trong dân số nói chung.

Trong các công thức này σ x 2R(1-R) là các đặc điểm của dân số nói chung chưa được biết đến trong quá trình quan sát mẫu. Trong thực tế, chúng được thay thế bằng các đặc điểm tương tự của dân số mẫu trên cơ sở quy luật số lớn, theo đó dân số mẫu, với số lượng đủ lớn, sẽ tái tạo khá chính xác các đặc điểm của dân số nói chung. Các phương pháp tính toán sai số lấy mẫu trung bình đối với giá trị trung bình và tỷ trọng trong quá trình lấy mẫu lặp lại và không lặp lại được nêu trong Bảng. 6.1.

Bảng 6.1.

Công thức tính sai số lấy mẫu trung bình cho giá trị trung bình và tỷ trọng

Giá trị luôn nhỏ hơn một, do đó sai số lấy mẫu trung bình khi lấy mẫu không lặp lại sẽ nhỏ hơn so với lấy mẫu lặp lại. Trong trường hợp tỷ lệ mẫu không đáng kể và hệ số nhân gần bằng 1 thì có thể bỏ qua việc hiệu chỉnh.

Khẳng định rằng nói chung giá trị trung bình chỉ báo hoặc phần chia chung sẽ không vượt quá sai số lấy mẫu trung bình chỉ với một mức độ xác suất nhất định. Do đó, để mô tả sai số lấy mẫu, ngoài sai số trung bình, hãy tính lỗi lấy mẫu cận biên(Δ), gắn liền với mức độ xác suất đảm bảo điều đó.

Mức xác suất ( R) xác định giá trị độ lệch chuẩn hóa ( t), và ngược lại. Giá trị tđược đưa ra trong bảng phân phối bình thường xác suất. Sự kết hợp được sử dụng thường xuyên nhất tRđược cho trong bảng. 6.2.


Bảng 6.2

Giá trị độ lệch chuẩn hóa t tại các giá trị tương ứng của mức xác suất R

t 1,0 1,5 2,0 2,5 3,0 3,5
R 0,683 0,866 0,954 0,988 0,997 0,999

t- hệ số tin cậy, tùy thuộc vào xác suất có thể đảm bảo rằng sai số tối đa sẽ không vượt quá t- nhiều lỗi trung bình. Nó cho thấy có bao nhiêu sai số trung bình trong sai số cận biên. Do đó, nếu t= 1, thì với xác suất 0,683 có thể khẳng định rằng sự khác biệt giữa chỉ số mẫu và chỉ số chung sẽ không vượt quá một sai số trung bình.

Công thức tính sai số lấy mẫu tối đa được cho trong Bảng. 6.3.

Bảng 6.3.

Công thức tính sai số lấy mẫu tối đa cho giá trị trung bình và phần chia

Sau khi tính toán sai số mẫu tối đa, chúng tôi tìm thấy khoảng tin cậy cho các chỉ số chung. Xác suất được lấy khi tính sai số của đặc tính mẫu được gọi là độ tin cậy. Mức độ tin cậy xác suất 0,95 có nghĩa là chỉ có 5 trong số 100 trường hợp lỗi có thể vượt quá ranh giới được thiết lập; xác suất 0,954 - trong 46 trường hợp trên 1000 và với 0,999 - trong 1 trường hợp trên 1000.

Đối với tổn thất chung, các ranh giới có khả năng xảy ra nhất mà nó sẽ nằm trong đó, có tính đến sai số đại diện tối đa, sẽ có dạng:

.

Các ranh giới có khả năng nhất mà cổ phần chung sẽ nằm trong đó sẽ là:

.

Từ đây, trung bình chung , chia sẻ chung .

Cho trong bảng. 6.3. các công thức được sử dụng để xác định sai số lấy mẫu được thực hiện bằng các phương pháp hoàn toàn ngẫu nhiên và cơ học.

Với phương pháp lấy mẫu phân tầng, mẫu nhất thiết phải bao gồm đại diện của tất cả các nhóm và thường có cùng tỷ lệ như trong tổng thể chung. Vì vậy, sai số lấy mẫu trong trong trường hợp này phụ thuộc chủ yếu vào mức trung bình của các phương sai trong nhóm. Dựa trên quy tắc cộng phương sai, chúng ta có thể kết luận rằng sai số lấy mẫu của lấy mẫu phân tầng sẽ luôn nhỏ hơn sai số lấy mẫu ngẫu nhiên.

Với lựa chọn nối tiếp (theo cụm), thước đo độ biến thiên sẽ là độ phân tán giữa các nhóm.