Tiểu sử Đặc trưng Phân tích

Mẫu và phương pháp lấy mẫu. Mẫu đại diện là gì? Cỡ mẫu yêu cầu

Thực nghiệm được coi là một trong những phương tiện nghiên cứu chính quan hệ công chúng và các quá trình. Họ cung cấp thông tin đáng tin cậy, đầy đủ và mang tính đại diện.

Đặc thù của kỹ thuật

Những kinh nghiệm cung cấp kiến ​​thức ghi lại sự thật. Chúng góp phần thiết lập và khái quát hóa các tình huống thông qua việc đăng ký gián tiếp hoặc trực tiếp các sự kiện đặc trưng của các mối quan hệ, đối tượng và hiện tượng đang được nghiên cứu. Phương pháp thực nghiệm khác với phương pháp lý thuyết ở chỗ đối tượng phân tích là:

  1. Hành vi của các cá nhân và nhóm của họ.
  2. Sản phẩm hoạt động của con người.
  3. Hành động bằng lời nói của cá nhân, phán đoán, quan điểm, ý kiến ​​​​của họ.

Nghiên cứu mẫu

Nghiên cứu thực nghiệm luôn nhằm mục đích đạt được mục tiêu và thông tin chính xác, dữ liệu định lượng. Về vấn đề này, khi thực hiện cần đảm bảo tính đại diện của thông tin. Tương ứng, Ý nghĩa đặc biệt có cái đúng dân số mẫu. Cái nàyĐiều này có nghĩa là việc lựa chọn phải được thực hiện sao cho dữ liệu thu được từ một nhóm hẹp phản ánh các xu hướng xảy ra trong đại đa số người trả lời. Ví dụ: khi khảo sát 200-300 người, dữ liệu thu được có thể được ngoại suy cho tất cả dân số đô thị. Các chỉ số của dân số mẫu cho phép chúng tôi thực hiện một cách tiếp cận khác để nghiên cứu các quá trình kinh tế xã hội trong khu vực và trong cả nước nói chung.

Thuật ngữ

hiểu biết tốt hơn các vấn đề liên quan nghiên cứu mẫu, một số định nghĩa cần được làm rõ. Đơn vị quan sát là nguồn thông tin trực tiếp. Nó có thể là một cá nhân, một nhóm, một tài liệu, một tổ chức, v.v. Dân số nói chung là phức hợp của các đơn vị quan sát. Tất cả đều phải liên quan đến vấn đề đang được nghiên cứu. Phân tích trực tiếp tùy thuộc vào . Nghiên cứu được thực hiện theo các phương pháp thu thập thông tin đã phát triển. Để xác định tỷ lệ này trong toàn bộ dãy người trả lời, hãy sử dụng khái niệm “dân số mẫu”. Thuộc tính của nó là phản ánh các thông số chính tổng khối lượng con người được gọi là tính đại diện. Trong một số trường hợp không có kết quả phù hợp. Sau đó, họ nói về lỗi đại diện.

Đảm bảo tính đại diện

Các vấn đề liên quan đến nó sẽ được thảo luận chi tiết trong khuôn khổ thống kê. Các vấn đề rất phức tạp, vì một mặt, chúng ta đang nói về việc cung cấp một biểu diễn định lượng, mang lại dân số nói chung. Cái nàyđặc biệt có nghĩa là các nhóm người trả lời phải được đại diện với số lượng tối ưu. Số lượng phải đủ để thể hiện bình thường. Mặt khác, chúng tôi cũng muốn nói đến sự đại diện định tính. Nó giả định trước một thành phần chủ đề nhất định hình thành dân số mẫu. Cái nàyĐiều này có nghĩa là, chẳng hạn, chúng ta không thể nói về tính đại diện nếu chỉ có nam hay nữ, người già hay thanh niên được khảo sát. Nghiên cứu nên được thực hiện trong tất cả các nhóm được đại diện.

Đặc điểm mẫu

Thuật ngữ này được xem xét ở hai khía cạnh. Trước hết, nó được định nghĩa là một tập hợp các yếu tố từ một tập hợp chung những người có ý kiến ​​đang được nghiên cứu - đây là dân số mẫu. Cái này còn là quá trình tạo ra một nhóm đối tượng trả lời nhất định nhưng vẫn đảm bảo tính đại diện theo yêu cầu. Trong thực tế, có một số loại và loại lựa chọn. Hãy nhìn vào chúng.

Các loại

Có ba trong số họ:

  1. tự phát dân số mẫu. Cái này một tập hợp người trả lời được lựa chọn trên nguyên tắc tự nguyện. Đồng thời, nó đảm bảo khả năng tiếp cận của các đơn vị từ tổng số người dân vào nhóm cụ thể học. Lựa chọn tự phát được sử dụng khá thường xuyên trong thực tế. Ví dụ, trong các cuộc khảo sát trên báo chí, tại bưu điện. Tuy nhiên, kỹ thuật này có một nhược điểm đáng kể. Không thể thể hiện một cách định tính toàn bộ khối lượng mẫu chung. Kỹ thuật này được sử dụng với tính kinh tế. Trong một số khảo sát, lựa chọn này là lựa chọn duy nhất có thể thực hiện được.
  2. tự phát dân số mẫu. Cái này một trong những phương pháp chính được sử dụng trong học tập. BẰNG nguyên tắc then chốt Sự lựa chọn như vậy nhằm tạo cơ hội cho mỗi đơn vị quan sát tách khỏi khối lượng cá thể chung thành một nhóm hẹp. Nhiều kỹ thuật khác nhau được sử dụng cho việc này. Ví dụ, nó có thể là xổ số, lựa chọn máy móc, bảng Số ngẫu nhiên.
  3. Lấy mẫu phân tầng (hạn ngạch). Nó dựa trên việc hình thành một mô hình định tính của tổng số người được hỏi. Sau đó, các đơn vị được chọn dân số mẫu. Ví dụ: nó được thực hiện theo độ tuổi hoặc giới tính, theo phân khúc dân số, v.v.

Các loại

Hiện có các mẫu sau:

Ngoài ra

Các mẫu cũng có thể phụ thuộc hoặc độc lập. Trong trường hợp đầu tiên, quy trình thử nghiệm và kết quả thu được trong quá trình đó đối với một nhóm người trả lời có ảnh hưởng nhất địnhđến cái khác. Theo đó, các mẫu độc lập không cho thấy hiệu ứng như vậy. Tuy nhiên, ở đây cần lưu ý một điểm quan trọng. Một nhóm đối tượng được kiểm tra tâm lý hai lần (ngay cả khi nhằm mục đích nghiên cứu các phẩm chất, đặc điểm, dấu hiệu khác nhau) theo mặc định sẽ được coi là phụ thuộc.

Lựa chọn xác suất

Hãy xem xét một số loại mẫu:

  1. Ngẫu nhiên. Nó giả định tính đồng nhất của tổng thể, một xác suất có sẵn của tất cả các thành phần và sự hiện diện của một danh sách đầy đủ các phần tử. Thông thường, quá trình lựa chọn sử dụng bảng có số ngẫu nhiên.
  2. Cơ khí. Kiểu lấy mẫu ngẫu nhiên này liên quan đến việc sắp xếp theo một tiêu chí nhất định. Ví dụ: theo số điện thoại, theo thứ tự bảng chữ cái, theo ngày sinh, v.v. Thành phần đầu tiên được chọn ngẫu nhiên. Tiếp theo, mỗi phần tử k được chọn ở bước n. Quy mô của tổng dân số sẽ là N=k*n.
  3. Phân tầng. Mẫu này được sử dụng khi tổng thể không đồng nhất. Sau này được chia thành các tầng lớp (nhóm). Trong mỗi người trong số họ, việc lựa chọn được thực hiện một cách máy móc hoặc ngẫu nhiên.
  4. Nối tiếp. Việc lựa chọn các nhóm được thực hiện ngẫu nhiên. Bên trong chúng, các đồ vật được nghiên cứu với số lượng lớn.

Lựa chọn phi xác suất

Chúng liên quan đến việc lấy mẫu không theo nguyên tắc ngẫu nhiên mà theo các tiêu chí chủ quan: tính điển hình, tính sẵn có, tính đại diện ngang nhau, v.v. Các lựa chọn sau đây thuộc loại này:

sắc thái

Để đảm bảo tính đại diện, cần có danh sách các đơn vị dân cư chính xác và đầy đủ. Đối tượng quan sát thường là một người. Tốt hơn là chọn từ danh sách bằng cách đánh số đơn vị và sử dụng bảng có số ngẫu nhiên. Nhưng phương pháp bán ngẫu nhiên cũng được sử dụng khá thường xuyên. Nó liên quan đến việc chọn mọi phần tử n từ danh sách.

Những nhân tố ảnh hưởng

Thể tích của một quần thể là số đơn vị của nó. Theo các chuyên gia, nó không nhất thiết phải lớn. Không còn nghi ngờ gì nữa, số lượng người trả lời càng nhiều thì chính xác hơn là kết quả. Tuy nhiên, đồng thời, khối lượng lớn không phải lúc nào cũng đảm bảo thành công. Ví dụ, điều này xảy ra khi tổng số người trả lời không đồng nhất. Một quần thể sẽ được coi là đồng nhất nếu tham số được kiểm soát, chẳng hạn như trình độ đọc viết, được phân bổ đồng đều, nghĩa là không có khoảng trống hoặc sự ngưng tụ. Trong trường hợp này, chỉ cần phỏng vấn nhiều người là đủ. Dựa trên kết quả khảo sát, có thể kết luận rằng hầu hết người dân có trình độ học vấn bình thường. Từ đó, tính đại diện của thông tin bị ảnh hưởng không phải bởi các đặc điểm định lượng mà đặc tính chất lượng tổng hợp - đặc biệt là mức độ đồng nhất của nó.

Lỗi

Chúng biểu thị độ lệch của các tham số trung bình của dân số mẫu so với các giá trị của tổng khối lượng người trả lời. Trong thực tế, lỗi được xác định bằng cách so sánh. Khi khảo sát người lớn, thông tin từ các cuộc điều tra dân số, số liệu thống kê và kết quả của các cuộc khảo sát trước đây thường được sử dụng. Các tham số kiểm soát thường là sự so sánh các giá trị trung bình của các quần thể (chung và mẫu), xác định sai số theo đó và giảm độ lệch này được gọi là kiểm soát tính đại diện.

kết luận

Nghiên cứu mẫu là một cách thu thập dữ liệu về thái độ và hành vi của mọi người thông qua khảo sát các nhóm người trả lời được lựa chọn đặc biệt. Kỹ thuật này được coi là đáng tin cậy và kinh tế, mặc dù nó đòi hỏi một số kỹ thuật. Dân số mẫu đóng vai trò là cơ sở. Cô ấy hành động như chia sẻ nhất địnhđại chúng nhân dân. Việc lựa chọn được thực hiện bằng các kỹ thuật đặc biệt và nhằm mục đích thu thập thông tin về toàn bộ dân số. Ngược lại, đối tượng thứ hai được đại diện bởi tất cả các đối tượng công cộng có thể có hoặc nhóm đối tượng đó sẽ được nghiên cứu. Thường thì dân số quá lớn nên việc phỏng vấn từng người đại diện sẽ là một quá trình tốn kém và rườm rà. Do đó, một mô hình rút gọn của nó được sử dụng. Dân số mẫu bao gồm tất cả những người nhận được bảng câu hỏi, những người được gọi là người trả lời, trên thực tế, họ đóng vai trò là đối tượng nghiên cứu. Nói một cách đơn giản, nó được tạo thành từ nhiều người được khảo sát.

Phần kết luận

Mục tiêu của cuộc khảo sát được xác định bởi các danh mục cụ thể trong dân số. Đối với tỷ lệ cụ thể trong tổng số người, nó bao gồm các đối tượng được đưa vào các nhóm sử dụng các phép tính toán học. Để chọn các đơn vị, cần phải mô tả đối tượng trong quần thể ban đầu. Sau khi xác định được số lượng chủ thể thì xác định phương pháp hoặc phương pháp thành lập nhóm. Kết quả của cuộc khảo sát sẽ cho phép chúng tôi mô tả đặc điểm đang được nghiên cứu trong mối quan hệ với tất cả các đại diện của đại chúng nhân dân. Như thực tế cho thấy, hầu hết các nghiên cứu có chọn lọc hơn là toàn diện được thực hiện.

Về lý thuyết phương pháp lấy mẫuđã phát triển nhiều cách khác nhau lựa chọn và các loại mẫu để đảm bảo tính đại diện. Dưới phương pháp lựa chọn hiểu quy trình lựa chọn đơn vị từ dân số. Có hai phương pháp lựa chọn: lặp lại và không lặp lại. Tại lặp đi lặp lại Trong lấy mẫu, mỗi đơn vị được chọn ngẫu nhiên, sau khi được khảo sát, sẽ được đưa trở lại tổng thể chung và với lần chọn tiếp theo, có thể lại được đưa vào mẫu. Phương pháp lựa chọn này dựa trên sơ đồ “quả bóng trả lại”: xác suất được đưa vào mẫu cho mỗi đơn vị tổng thể không thay đổi bất kể số lượng đơn vị được chọn. Tại có thể lặp lại Trong lấy mẫu, mỗi đơn vị được chọn ngẫu nhiên sẽ không được trả lại cho tổng thể sau khi kiểm tra. Phương pháp lựa chọn này dựa trên sơ đồ “quả bóng không trả lại”: xác suất được đưa vào mẫu cho mỗi đơn vị của tổng thể nói chung sẽ tăng lên khi quá trình lựa chọn diễn ra.

Tùy thuộc vào phương pháp hình thành dân số mẫu, các phương pháp chính sau được phân biệt: các kiểu lấy mẫu:

thực sự ngẫu nhiên;

cơ khí;

điển hình (phân tầng, khoanh vùng);

nối tiếp (lồng nhau);

kết hợp;

nhiều giai đoạn;

nhiều pha;

thâm nhập vào nhau.

Thực tế lấy mẫu ngẫu nhiênđược hình thành theo đúng quy định nguyên tắc khoa học và quy tắc chọn ngẫu nhiên. Để có được một mẫu ngẫu nhiên, tổng thể chung được chia thành các đơn vị lấy mẫu và sau đó chọn đủ số lượng đơn vị theo thứ tự lặp lại ngẫu nhiên hoặc không lặp lại.

Thứ tự ngẫu nhiên giống như rút thăm. Trong thực tế, nó thường được sử dụng nhất khi sử dụng các bảng số ngẫu nhiên đặc biệt. Ví dụ: nếu 40 đơn vị được chọn từ quần thể chứa 1587 đơn vị thì 40 số có bốn chữ số nhỏ hơn 1587 sẽ được chọn từ bảng.

Trong trường hợp bản thân mẫu ngẫu nhiên được tổ chức dưới dạng mẫu lặp lại thì sai số chuẩn được tính theo công thức (6.1). Khi quỷ phương pháp lặp lại Công thức lựa chọn để tính sai số chuẩn sẽ là:


ở đâu 1 – N/ N– tỷ lệ đơn vị trong tổng thể chung không được đưa vào mẫu. Vì phân số này luôn nhỏ hơn đơn vị nên sai số trong phép chọn không lặp lại trong các điều kiện khác điều kiện bình đẳng luôn ít hơn khi lặp lại. Lựa chọn không lặp lại dễ tổ chức hơn so với lựa chọn lặp lại và nó được sử dụng thường xuyên hơn. Tuy nhiên, giá trị sai số chuẩn trong quá trình lấy mẫu không lặp lại có thể được xác định bằng cách sử dụng công thức đơn giản hơn (5.1). Việc thay thế như vậy có thể thực hiện được nếu tỷ lệ các đơn vị trong tổng thể chung không được đưa vào mẫu lớn và do đó giá trị gần bằng 1.

Việc hình thành một mẫu theo đúng các quy tắc chọn ngẫu nhiên trên thực tế là rất khó và đôi khi là không thể, vì khi sử dụng bảng số ngẫu nhiên, cần phải đánh số tất cả các đơn vị của tổng thể nói chung. Thông thường, dân số quá lớn nên việc thực hiện công việc sơ bộ như vậy là vô cùng khó khăn và không thực tế, vì vậy trong thực tế, các loại mẫu khác được sử dụng, mỗi loại không hoàn toàn ngẫu nhiên. Tuy nhiên, chúng được tổ chức theo cách đảm bảo xấp xỉ tối đa các điều kiện chọn ngẫu nhiên.

Khi sạch sẽ lấy mẫu cơ học toàn bộ quần thể chung của các đơn vị trước hết phải được trình bày dưới dạng danh sách các đơn vị lựa chọn, được biên soạn theo một thứ tự trung lập nào đó đối với đặc điểm đang được nghiên cứu, chẳng hạn như theo thứ tự bảng chữ cái. Sau đó danh sách các đơn vị lựa chọn được chia thành nhiều các phần bằng nhau, cần chọn bao nhiêu đơn vị. Tiếp theo, theo một quy tắc được thiết lập trước không liên quan đến sự biến đổi của đặc tính đang nghiên cứu, một đơn vị được chọn từ mỗi phần của danh sách. Kiểu lấy mẫu này không phải lúc nào cũng cung cấp tính chất ngẫu nhiên lựa chọn và mẫu thu được có thể bị sai lệch. Điều này được giải thích bởi thực tế là, thứ nhất, thứ tự của các đơn vị trong tổng thể nói chung có thể có yếu tố không ngẫu nhiên. Thứ hai, việc lấy mẫu từ từng bộ phận của tổng thể nếu điểm tham chiếu được thiết lập không chính xác cũng có thể dẫn đến sai số. Tuy nhiên, trên thực tế, việc tổ chức lấy mẫu cơ học dễ dàng hơn so với lấy mẫu ngẫu nhiên và khi tiến hành khảo sát mẫu, kiểu lấy mẫu này thường được sử dụng nhiều nhất. Sai số chuẩn trong lấy mẫu cơ học được xác định bằng công thức ngẫu nhiên thực tế lấy mẫu không lặp lại (6.2).

Mẫu điển hình (được khoanh vùng, phân tầng) có hai mục tiêu:

đảm bảo tính đại diện trong mẫu của các nhóm điển hình tương ứng của dân số nói chung theo các đặc điểm mà nhà nghiên cứu quan tâm;

tăng độ chính xác của kết quả khảo sát mẫu.

Với một mẫu điển hình, trước khi bắt đầu hình thành, tổng thể của các đơn vị được chia thành các nhóm điển hình. Đồng thời rất tâm điểmsự lựa chọn đúng đắn dấu hiệu nhóm Các nhóm điển hình được lựa chọn có thể chứa cùng hoặc số khác nhau các đơn vị lựa chọn Trong trường hợp đầu tiên, dân số mẫu được hình thành với tỷ lệ lựa chọn bằng nhau từ mỗi nhóm, trong trường hợp thứ hai - với tỷ lệ tỷ lệ thuận với tỷ lệ của nó trong dân số nói chung. Nếu mẫu được hình thành với tỷ lệ lựa chọn bằng nhau thì về cơ bản nó tương đương với chính chuỗi đó mẫu ngẫu nhiên từ các quần thể nói chung nhỏ hơn, mỗi quần thể là một nhóm điển hình. Việc lựa chọn từ mỗi nhóm được thực hiện một cách ngẫu nhiên (lặp lại hoặc không lặp lại) hoặc máy móc. Với một mẫu điển hình, cả hai đều có tỷ lệ lựa chọn bằng nhau và không đồng đều, có thể loại bỏ ảnh hưởng của sự biến đổi giữa các nhóm của đặc tính đang được nghiên cứu đến độ chính xác của kết quả, vì sự đại diện bắt buộc của từng nhóm điển hình trong quần thể mẫu được đảm bảo. Liệu sai số chuẩn của mẫu có phụ thuộc vào tổng phương sai không? 2, và từ giá trị trung bình của phương sai nhóm?Tôi 2 . Vì trung bình của phương sai nhóm luôn nhỏ hơn phương sai tổng và tất cả các yếu tố khác đều bằng nhau nên sai số chuẩn của một mẫu điển hình sẽ nhỏ hơn sai số chuẩn của chính mẫu ngẫu nhiên.

Khi xác định sai số chuẩn của một mẫu điển hình, người ta sử dụng các công thức sau:

Khi lặp lại phương pháp lựa chọn

Với phương pháp lựa chọn không lặp lại:

– giá trị trung bình của phương sai nhóm trong quần thể mẫu.

Lấy mẫu nối tiếp (cụm)- đây là kiểu hình thành quần thể mẫu khi không phải các đơn vị được khảo sát mà là các nhóm đơn vị (loạt, tổ) được chọn theo thứ tự ngẫu nhiên. Trong chuỗi (tổ) đã chọn, tất cả các đơn vị đều được kiểm tra. Việc lấy mẫu nối tiếp trên thực tế dễ tổ chức và tiến hành hơn so với lấy mẫu đơn vị riêng lẻ. Tuy nhiên, với kiểu lấy mẫu này, thứ nhất, tính đại diện của từng chuỗi không được đảm bảo và thứ hai, ảnh hưởng của sự biến đổi giữa các chuỗi của đặc tính được nghiên cứu đến kết quả khảo sát không được loại bỏ. Trong trường hợp sự thay đổi này là đáng kể, nó sẽ dẫn đến sự gia tăng lỗi ngẫu nhiên tính đại diện. Khi chọn loại mẫu, nhà nghiên cứu phải tính đến trường hợp này. Lỗi tiêu chuẩn lấy mẫu nối tiếpđược xác định bởi các công thức:

Với phương pháp lựa chọn lặp đi lặp lại -


là phương sai giữa các chuỗi của quần thể mẫu; r- số dãy được chọn;

Với phương pháp lựa chọn không lặp lại -


Ở đâu R– số lượng chuỗi trong dân số.

Trong thực tế, một số phương pháp và loại mẫu nhất định được sử dụng tùy thuộc vào mục đích và mục tiêu của khảo sát mẫu cũng như khả năng tổ chức và tiến hành khảo sát. Thông thường, sự kết hợp giữa các phương pháp lựa chọn và kiểu lấy mẫu được sử dụng. Những mẫu như vậy được gọi là kết hợp. Có thể kết hợp theo nhiều cách kết hợp khác nhau: lấy mẫu cơ học và lấy mẫu nối tiếp, lấy mẫu điển hình và cơ học, lấy mẫu nối tiếp và thực sự ngẫu nhiên, v.v. Lấy mẫu kết hợp được sử dụng để đảm bảo tính đại diện lớn nhất với chi phí nhân công và tiền bạc ít nhất cho việc tổ chức và tiến hành khảo sát.

Với mẫu kết hợp, sai số chuẩn của mẫu bao gồm các sai số ở từng giai đoạn và có thể được xác định bằng căn bậc hai của tổng bình phương sai số của các mẫu tương ứng. Vì vậy, nếu trong quá trình lấy mẫu kết hợp, các mẫu cơ học và mẫu điển hình được sử dụng kết hợp thì sai số chuẩn có thể được xác định theo công thức


ở đâu?1 và? 2 lỗi chuẩn mẫu cơ học và mẫu điển hình tương ứng.

Đặc thù chiết xuất nhiều giai đoạn thực tế là quần thể mẫu được hình thành dần dần, theo các giai đoạn lựa chọn. Ở giai đoạn đầu tiên, các đơn vị ở giai đoạn đầu tiên được chọn bằng phương pháp và kiểu lựa chọn được xác định trước. Ở giai đoạn thứ hai, từ mỗi đơn vị của giai đoạn đầu tiên có trong mẫu, các đơn vị của giai đoạn thứ hai được chọn, v.v. Số lượng giai đoạn có thể nhiều hơn hai. Ở giai đoạn cuối, một quần thể mẫu được hình thành, các đơn vị trong đó sẽ được khảo sát. Vì vậy, ví dụ, đối với một cuộc khảo sát mẫu về ngân sách hộ gia đình, ở giai đoạn đầu tiên, các đối tượng lãnh thổ của quốc gia được chọn, ở giai đoạn thứ hai - các huyện ở các vùng được chọn, ở giai đoạn thứ ba - ở mỗi khu vực. sự hình thành thành phố doanh nghiệp hoặc tổ chức được lựa chọn và cuối cùng, ở giai đoạn thứ tư, các gia đình được lựa chọn từ các doanh nghiệp được lựa chọn.

Như vậy, quần thể mẫu được hình thành ở giai đoạn cuối. Lấy mẫu nhiều giai đoạn linh hoạt hơn các loại khác, mặc dù nó thường tạo ra kết quả kém chính xác hơn so với mẫu một giai đoạn có cùng kích thước. Tuy nhiên, nó có một ưu điểm quan trọng, đó là khung lấy mẫu để lựa chọn nhiều giai đoạn phải được xây dựng ở mỗi giai đoạn chỉ cho những đơn vị có trong mẫu và điều này rất quan trọng, vì nó thường được cơ sở đã hoàn thành không có mẫu.

Sai số lấy mẫu chuẩn trong lấy mẫu nhiều giai đoạn cho các nhóm có cỡ khác nhau được xác định theo công thức


ở đâu?1, ?2, ?3 , ... – sai số chuẩn ở các giai đoạn khác nhau;

n1, n2, n3 , .. . - số lượng mẫu ở các giai đoạn lựa chọn tương ứng.

Nếu các nhóm có khối lượng không bằng nhau thì về mặt lý thuyết không thể sử dụng công thức này. Nhưng nếu tổng tỷ lệ lựa chọn ở tất cả các giai đoạn là không đổi thì trong thực tế việc tính toán sử dụng công thức này sẽ không dẫn đến sai lệch giá trị sai số.

Nước hoa lấy mẫu nhiều pha thực tế là trên cơ sở quần thể mẫu được hình thành ban đầu, một mẫu con được hình thành, từ mẫu con này, mẫu con tiếp theo được hình thành, v.v. Quần thể mẫu ban đầu đại diện cho giai đoạn đầu tiên, một mẫu con từ mẫu con đó đại diện cho giai đoạn thứ hai, v.v. Nên sử dụng lấy mẫu nhiều pha trong trường hợp Nếu:

cần có cỡ mẫu khác nhau để nghiên cứu các đặc điểm khác nhau;

độ biến thiên của các đặc tính nghiên cứu không giống nhau và độ chính xác yêu cầu cũng khác nhau;

thông tin ít chi tiết hơn phải được thu thập cho tất cả các đơn vị trong khung mẫu ban đầu (giai đoạn đầu tiên) và thông tin chi tiết hơn phải được thu thập cho các đơn vị ở từng giai đoạn tiếp theo.

Một trong những ưu điểm không thể nghi ngờ của việc lấy mẫu nhiều pha là thông tin thu được trong giai đoạn đầu tiên có thể được sử dụng làm thông tin thêm trong các giai đoạn tiếp theo, thông tin từ giai đoạn thứ hai - là thông tin bổ sung trong các giai đoạn tiếp theo, v.v. Việc sử dụng thông tin này làm tăng độ chính xác của kết quả khảo sát mẫu.

Khi tổ chức lấy mẫu nhiều pha, bạn có thể sử dụng kết hợp nhiều phương pháp và kiểu chọn lọc khác nhau (lấy mẫu điển hình với lấy mẫu cơ học, v.v.). Lựa chọn nhiều giai đoạn có thể được kết hợp với lựa chọn nhiều giai đoạn. Ở mỗi giai đoạn, việc lấy mẫu có thể là nhiều giai đoạn.

Sai số chuẩn trong lấy mẫu nhiều pha được tính riêng cho từng pha theo công thức của phương pháp lựa chọn và loại lấy mẫu mà quần thể mẫu của nó được hình thành.

Khai quật xen kẽ- hai hoặc nhiều mẫu độc lập từ cùng một quần thể, được thu thập theo cùng một cách và cùng loại. Nên sử dụng phương pháp lấy mẫu xen kẽ nếu cần thu được kết quả khảo sát mẫu sơ bộ trong thời gian ngắn. Lấy mẫu chéo có hiệu quả để đánh giá kết quả khảo sát. Nếu kết quả ở các mẫu độc lập giống nhau thì điều này cho thấy độ tin cậy của dữ liệu khảo sát mẫu. Các mẫu xen kẽ đôi khi có thể được sử dụng để kiểm tra công việc nhiều nhà nghiên cứu khác nhau, hướng dẫn mỗi người khảo sát các mẫu khác nhau.

Sai số chuẩn đối với các mẫu xuyên thấu được xác định theo cùng công thức như mẫu tỷ lệ điển hình (5.3). Các mẫu xen kẽ so với các loại khác đòi hỏi nhiều nhân công và tiền bạc hơn nên người nghiên cứu phải tính đến điều này khi thiết kế khảo sát mẫu.

Sai số tối đa đối với các phương pháp lựa chọn và kiểu lấy mẫu khác nhau được xác định theo công thức? = t?, ở đâu? là sai số chuẩn tương ứng.

Một trong những thành phần chính của một nghiên cứu được thiết kế tốt là xác định mẫu và mẫu đại diện là gì. Nó giống như ví dụ về chiếc bánh. Rốt cuộc, bạn không cần phải ăn hết món tráng miệng để hiểu được hương vị của nó? Một phần nhỏ là đủ.

Vì vậy, chiếc bánh là dân số (nghĩa là tất cả những người trả lời đủ điều kiện tham gia khảo sát). Nó có thể được thể hiện về mặt địa lý, ví dụ, chỉ những cư dân của khu vực Moscow. Giới tính - chỉ dành cho phụ nữ. Hoặc có giới hạn về độ tuổi - Người Nga trên 65 tuổi.

Tính toán dân số rất khó: bạn cần có số liệu từ các cuộc điều tra dân số hoặc điều tra đánh giá sơ bộ. Do đó, thông thường dân số nói chung được "ước tính" và từ con số kết quả họ tính toán dân số mẫu hoặc vật mẫu.

Mẫu đại diện là gì?

Vật mẫu– đây là số lượng người trả lời được xác định rõ ràng. Cấu trúc của nó phải trùng khớp nhất có thể với cấu trúc của dân số nói chung về các đặc điểm chính của chọn lọc.

Ví dụ: nếu người trả lời tiềm năng là toàn bộ dân số Nga, trong đó 54% là phụ nữ và 46% là nam giới, thì mẫu phải chứa chính xác những điều tương tự phần trăm. Nếu các tham số trùng nhau thì mẫu có thể được gọi là đại diện. Điều này có nghĩa là sự thiếu chính xác và sai sót trong nghiên cứu được giảm thiểu đến mức tối thiểu.

Cỡ mẫu được xác định có tính đến các yêu cầu về độ chính xác và tính kinh tế. Các yêu cầu này tỷ lệ nghịch với nhau: cỡ mẫu càng lớn thì kết quả càng chính xác. Hơn nữa, độ chính xác càng cao thì chi phí để thực hiện nghiên cứu càng cao. Và ngược lại, mẫu càng nhỏ thì chi phí càng ít, các đặc tính của tổng thể nói chung được tái tạo kém chính xác và ngẫu nhiên hơn.

Vì vậy, để tính toán khối lượng lựa chọn, các nhà xã hội học đã phát minh ra một công thức và tạo ra máy tính đặc biệt:

Xác suất tin cậylỗi tự tin

Các điều khoản làm gì " xác suất tin cậy" Và " lỗi tự tin"? Xác suất tin cậy là một chỉ số về độ chính xác của phép đo. Và lỗi tin cậy là lỗi có thể xảy ra kết quả nghiên cứu. Ví dụ: với dân số hơn 500,00 người (giả sử sống ở Novokuznetsk), mẫu sẽ là 384 người với xác suất tin cậy lỗi 95% và 5% HOẶC (tại khoảng tin cậy 95±5%).

Điều gì tiếp theo từ điều này? Khi tiến hành 100 nghiên cứu với mẫu như vậy (384 người), trong 95% trường hợp, câu trả lời thu được, theo quy luật thống kê, sẽ nằm trong khoảng ±5% so với câu trả lời ban đầu. Và chúng ta sẽ có được một mẫu đại diện với xác suất sai sót thống kê tối thiểu.

Sau khi tính toán cỡ mẫu, bạn có thể xem liệu có đủ số lượng người trả lời trong phiên bản demo của Bảng câu hỏi hay không. Bạn có thể tìm hiểu thêm về cách thực hiện khảo sát nhóm.

Kế hoạch:

1. Các vấn đề về thống kê toán học.

2. Các loại mẫu.

3. Các phương pháp tuyển chọn.

4. Phân phối thống kê của mẫu.

5. Hàm phân phối theo kinh nghiệm.

6. Đa giác và biểu đồ.

7. Đặc điểm số của chuỗi biến thể.

8. Ước tính thống kê các tham số phân phối.

9. Ước tính khoảng thời gian của các tham số phân phối.

1. Bài toán và phương pháp thống kê toán học

Thống kê toán học là một nhánh của toán học dành cho các phương pháp thu thập, phân tích và xử lý kết quả dữ liệu quan sát thống kê cho mục đích khoa học và thực tiễn.

Cần phải nghiên cứu một tập hợp các đối tượng đồng nhất về mặt chất lượng hoặc đặc tính định lượng, mô tả các đối tượng này. Ví dụ: nếu có một loạt các bộ phận, thì dấu hiệu định tính Tiêu chuẩn của bộ phận có thể dùng làm thước đo định lượng và kích thước được kiểm soát của bộ phận có thể dùng làm thước đo định lượng.

Đôi khi một nghiên cứu hoàn chỉnh được thực hiện, tức là. mỗi đối tượng được kiểm tra các đặc tính cần thiết. Trong thực tế, một cuộc khảo sát đầy đủ hiếm khi được sử dụng. Ví dụ, nếu dân số chứa rất con số lớn vật thể thì không thể tiến hành một cuộc khảo sát toàn diện về mặt vật lý. Nếu việc khảo sát một đối tượng gắn liền với việc nó bị phá hủy hoặc đòi hỏi chi phí vật chất lớn thì việc tiến hành một cuộc khảo sát hoàn chỉnh sẽ không có ý nghĩa gì. Trong những trường hợp như vậy, một số lượng hạn chế các đối tượng được chọn ngẫu nhiên từ toàn bộ quần thể (dân số mẫu) và được nghiên cứu.

Nhiệm vụ chính của thống kê toán học là nghiên cứu toàn bộ dân số bằng cách sử dụng dữ liệu mẫu, tùy thuộc vào mục tiêu, tức là. nghiên cứu các đặc tính xác suất của dân số: quy luật phân bố, các đặc tính số, v.v. cho làm con nuôi Tính quyết đoán trong quản lý trong điều kiện không chắc chắn.

2. Các loại mẫu

Dân số là tập hợp các đối tượng mà từ đó mẫu được tạo ra.

Dân số mẫu (mẫu) là tập hợp các đối tượng được chọn ngẫu nhiên.

Mật độ dân số là số lượng đối tượng trong bộ sưu tập này. Quy mô dân số được biểu thị bằng N, chọn lọc – n.

Ví dụ:

Nếu trong số 1000 phần 100 phần được chọn để kiểm tra thì khối lượng dân số nói chung N = 1000 và cỡ mẫu n = 100.

Có hai cách để chọn mẫu: sau khi một đối tượng được chọn và quan sát, nó có thể được trả lại cho quần thể hoặc không. Cái đó. mẫu được chia thành lặp lại và không lặp lại.

Lặp lạigọi điện vật mẫu, trong đó đối tượng đã chọn (trước khi chọn đối tượng tiếp theo) được trả về tổng thể.

lặp lạigọi điện vật mẫu, trong đó đối tượng được chọn không được trả lại cho quần thể.

Trong thực tế, việc lấy mẫu ngẫu nhiên lặp lại thường được sử dụng.

Để có thể đánh giá một cách đủ tin cậy về đặc điểm của tổng thể quan tâm dựa trên dữ liệu mẫu, điều cần thiết là các đối tượng mẫu phải thể hiện chính xác đặc điểm đó. Mẫu phải thể hiện chính xác tỷ lệ của tổng thể. Mẫu nên được người đại diện (đại diện).

Bằng sức mạnh của pháp luật số lượng lớn có thể lập luận rằng mẫu sẽ mang tính đại diện nếu nó được chọn ngẫu nhiên.

Nếu quy mô của quần thể đủ lớn và mẫu chỉ chiếm một phần nhỏ của quần thể này thì sự khác biệt giữa mẫu lặp lại và mẫu không lặp lại sẽ bị xóa bỏ; trong trường hợp giới hạn, khi xem xét một quần thể vô hạn và mẫu có kích thước hữu hạn thì sự khác biệt này sẽ biến mất.

Ví dụ:

Tạp chí Literary Review của Mỹ, sử dụng phương pháp thống kê, đã thực hiện một nghiên cứu về các dự báo liên quan đến kết quả của cuộc bầu cử tổng thống Mỹ sắp tới vào năm 1936. Những người tranh cử cho vị trí này là F.D. Roosevelt và A. M. Landon. Danh bạ điện thoại được lấy làm nguồn nghiên cứu cho người dân Mỹ nói chung. Trong số này, 4 triệu địa chỉ được chọn ngẫu nhiên, các biên tập viên của tạp chí đã gửi bưu thiếp yêu cầu họ bày tỏ thái độ đối với các ứng cử viên cho chức tổng thống. Sau khi xử lý kết quả khảo sát, tạp chí đã công bố một dự báo xã hội học rằng Landon sẽ giành chiến thắng trong cuộc bầu cử sắp tới với tỷ số cách biệt lớn. Và... tôi đã nhầm: Roosevelt đã thắng.
Ví dụ này có thể được coi là một ví dụ mẫu không đại diện. Thực tế là ở Hoa Kỳ vào nửa đầu thế kỷ 20, chỉ có bộ phận dân chúng giàu có ủng hộ quan điểm của Landon mới có điện thoại.

3. Phương pháp tuyển chọn

Trong thực tế, nhiều phương pháp lựa chọn khác nhau được sử dụng, có thể chia thành 2 loại:

1. Lựa chọn không yêu cầu chia quần thể thành các phần (a) ngẫu nhiên đơn giản không lặp lại; b) lặp lại ngẫu nhiên đơn giản).

2. Lựa chọn, trong đó dân số được chia thành nhiều phần. (MỘT) lựa chọn điển hình; b) lựa chọn cơ học; V) nối tiếp sự lựa chọn).

Ngẫu nhiên đơn giản họ gọi đây là sự lựa chọn, trong đó các đối tượng được trích xuất lần lượt từ toàn bộ tập hợp (ngẫu nhiên).

Đặc trưnggọi điện sự lựa chọn, trong đó các đối tượng được chọn không phải từ toàn bộ quần thể mà từ từng phần “điển hình” của nó. Ví dụ: nếu một bộ phận được sản xuất trên một số máy, thì việc lựa chọn không được thực hiện từ toàn bộ bộ bộ phận được sản xuất bởi tất cả các máy mà từ các sản phẩm của từng máy riêng biệt. Lựa chọn này được sử dụng khi đặc điểm đang được kiểm tra thay đổi đáng kể ở các bộ phận “điển hình” khác nhau của dân số nói chung.

Cơ khígọi điện sự lựa chọn, trong đó tổng thể nói chung được chia một cách “một cách máy móc” thành nhiều nhóm tùy theo số lượng đối tượng cần được đưa vào mẫu và một đối tượng được chọn từ mỗi nhóm. Ví dụ: nếu bạn cần chọn 20% số bộ phận do máy sản xuất thì cứ 5 bộ phận sẽ được chọn; nếu bạn cần chọn 5% số bộ phận - cứ sau 20 ngày, v.v. Đôi khi việc lựa chọn như vậy có thể không đảm bảo tính đại diện của mẫu (nếu cứ chọn con lăn mài thứ 20 và thay dao cắt ngay sau khi chọn thì tất cả các con lăn quay bằng dao cắt cùn sẽ được chọn).

nối tiếpgọi điện sự lựa chọn, trong đó các đối tượng được chọn từ tổng thể không phải từng đối tượng một mà theo “chuỗi”, đối tượng phải được khảo sát liên tục. Ví dụ: nếu sản phẩm được sản xuất bởi một nhóm lớn máy tự động thì sản phẩm của chỉ một số ít máy sẽ phải được kiểm tra toàn diện.

Trong thực tế, lựa chọn kết hợp thường được sử dụng, trong đó các phương pháp trên được kết hợp.

4. Phân phối thống kê của mẫu

Lấy một mẫu từ tổng thể chung và giá trị x 1–quan sát một lần, x 2 -n 2 lần,... x k - n k lần. n= n 1 +n 2 +...+n k – cỡ mẫu. Giá trị quan sátđược gọi là tùy chọn, và dãy các phương án viết theo thứ tự tăng dần là chuỗi biến thể. Số lượng quan sátđược gọi là tần số (tần số tuyệt đối) và mối quan hệ của chúng với cỡ mẫu- tần số tương đối hoặc xác suất thống kê.

Nếu số lượng biến thể lớn hoặc mẫu được lấy từ một quần thể liên tục thì chuỗi biến thểđược tổng hợp không phải từ các giá trị điểm riêng lẻ mà từ các khoảng giá trị trong tổng thể chung. Chuỗi biến thể như vậy được gọi là khoảng thời gian.Độ dài của các khoảng phải bằng nhau.

Phân phối mẫu thống kê được gọi là danh sách các tùy chọn và tần số tương ứng hoặc tần số tương đối của chúng.

Phân phối thống kê cũng có thể được chỉ định dưới dạng một chuỗi các khoảng và tần số tương ứng của chúng (tổng tần số nằm trong khoảng giá trị này)

Một chuỗi tần số biến đổi điểm có thể được biểu diễn bằng bảng:

x tôi
x 1
x 2

xk
và tôi
n 1
n 2

n k

Tương tự, người ta có thể tưởng tượng một chuỗi biến thiên điểm có tần số tương đối.

Hơn thế nữa:

Ví dụ:

Số chữ cái trong một số văn bản X hóa ra bằng 1000. Chữ cái đầu tiên gặp phải là “I”, thứ hai là một lá thư“i”, chữ thứ ba là chữ “a”, chữ thứ tư là “yu”. Sau đó là các chữ cái “o”, “e”, “u”, “e”, “s”.

Hãy viết ra vị trí chúng chiếm trong bảng chữ cái, lần lượt chúng ta có: 33, 10, 1, 32, 16, 6, 21, 31, 29.

Sau khi sắp xếp các số này theo thứ tự tăng dần, chúng ta có dãy biến thể: 1, 6, 10, 16, 21, 29, 31, 32, 33.

Tần suất xuất hiện của các chữ cái trong văn bản: “a” - 75, “e” - 87, “i” - 75, “o” - 110, “u” - 25, “s” - 8, “e” - 3 , “yu” "- 7, "Tôi" - 22.

Hãy tạo một chuỗi tần số biến đổi điểm:

Ví dụ:

Phân phối tần số lấy mẫu khối lượng được chỉ định n = 20.

Tạo một chuỗi biến đổi điểm có tần số tương đối.

x tôi

2

6

12

và tôi

3

10

7

Giải pháp:

Hãy tìm tần số tương đối:


x tôi

2

6

12

Wi

0,15

0,5

0,35

Khi xây dựng phân bố khoảng, có các quy tắc để chọn số khoảng hoặc kích thước của mỗi khoảng. Tiêu chí ở đây là tỷ lệ tối ưu: khi số lượng khoảng tăng lên, tính đại diện được cải thiện, nhưng khối lượng dữ liệu và thời gian xử lý dữ liệu sẽ tăng lên. Sự khác biệt x max - x min giữa giá trị lớn nhất và nhỏ nhất tùy chọn được gọi phạm vi mẫu.

Để đếm số khoảng k thường được sử dụng công thức thực nghiệm Sturgess (ngụ ý làm tròn đến số nguyên thuận tiện gần nhất): k = 1 + 3,322 log n.

Theo đó, kích thước của mỗi khoảng h có thể được tính bằng công thức:

5. Hàm phân phối theo kinh nghiệm

Hãy xem xét một số mẫu từ dân số nói chung. Cho biết phân bố tần số thống kê của đặc tính định lượng X. Chúng ta đưa ra ký hiệu: n x- số lượng quan sát trong đó quan sát được giá trị đặc trưng nhỏ hơn x; N Tổng số quan sát (cỡ mẫu). Tần suất tương đối của sự kiện X<х равна nx/n. Nếu x thay đổi thì tần số tương đối cũng thay đổi, tức là tần số tương đốinx /n- có hàm số x. Bởi vì nó được tìm thấy bằng thực nghiệm thì nó được gọi là thực nghiệm.

Hàm phân phối theo kinh nghiệm (hàm phân phối mẫu) gọi hàm, xác định cho mỗi x tần suất tương đối của sự kiện X<х.


số tùy chọn nhỏ hơn x ở đâu,

n - cỡ mẫu.

Ngược lại với hàm phân phối thực nghiệm của một mẫu, hàm phân phối F(x) của tổng thể được gọi là hàm phân phối lý thuyết.

Sự khác biệt giữa hàm phân bố thực nghiệm và lý thuyết là hàm lý thuyết F(x) xác định xác suất của sự kiện X F*(x) có xu hướng xác suất bằng xác suất F(x) của sự kiện này. Nghĩa là, với n lớn F*(x) và F(x) khác nhau một chút.

Cái đó. Nên sử dụng hàm phân phối thực nghiệm của mẫu để ước tính hàm phân phối lý thuyết (tích phân) của tổng thể nói chung.

F*(x) có tất cả các thuộc tính F(x).

1. Giá trị F*(x) thuộc khoảng.

2. F*(x) là hàm không giảm.

3. Nếu là phương án nhỏ nhất thì F*(x) = 0, với x < x 1 ; nếu x k là tùy chọn lớn nhất thì F*(x) = 1, với x > x k.

Những thứ kia. F*(x) dùng để ước tính F(x).

Nếu mẫu được cho bởi một chuỗi biến thiên thì hàm thực nghiệm có dạng:

Đồ thị của hàm thực nghiệm được gọi là tích lũy.

Ví dụ:

Vẽ đồ thị hàm thực nghiệm từ phân phối mẫu đã cho.


Giải pháp:

Cỡ mẫu n = 12 + 18 +30 = 60. Tùy chọn nhỏ nhất là 2, tức là. tại x < 2. Sự kiện X<6, (x 1 = 2) наблюдалось 12 раз, т.е. F*(x)=12/60=0,2 lúc 2 giờ < x < 6. Sự kiện X<10, (x 1 =2, x 2 = 6) наблюдалось 12 + 18 = 30 раз, т.е.F*(x)=30/60=0,5 при 6 < x < 10. Bởi vì x=10 là phương án lớn nhất thì F*(x) = 1 tại x>10. Hàm thực nghiệm mong muốn có dạng:

tích lũy:


Tích lũy giúp có thể hiểu thông tin được trình bày bằng đồ họa, ví dụ: trả lời các câu hỏi: “Xác định số lượng quan sát trong đó giá trị của thuộc tính nhỏ hơn 6 hoặc không nhỏ hơn 6. F*(6) =0,2 "Khi đó số lượng quan sát trong đó giá trị của đặc tính được quan sát nhỏ hơn 6 là 0,2* N = 0,2*60 = 12. Số lượng quan sát trong đó giá trị của đặc tính quan sát được ít nhất là 6 bằng (1-0,2)* n = 0,8*60 = 48.

Nếu một chuỗi biến thiên theo khoảng được đưa ra, thì để biên soạn hàm phân phối theo kinh nghiệm, các điểm giữa của các khoảng được tìm thấy và từ chúng, hàm phân phối theo kinh nghiệm thu được tương tự như chuỗi biến thiên điểm.

6. Đa giác và biểu đồ

Để rõ ràng, các biểu đồ phân phối thống kê khác nhau được xây dựng: đa thức và biểu đồ

Dải tần số -đây là một đường đứt nét, các đoạn nối các điểm ( x 1 ; n 1 ), ( x 2 ; n 2 ),…, ( x k ; n k ), đâu là các lựa chọn và tần số tương ứng.

Đa giác tần số tương đối -đây là một đường đứt nét, các đoạn nối các điểm ( x 1 ; w 1 ), ( x 2 ; w 2 ),…, ( x k ; w k ), trong đó x i là các tùy chọn, w i là tần số tương đối tương ứng với họ.

Ví dụ:

Xây dựng đa thức tần số tương đối từ phân bố lấy mẫu đã cho:

Giải pháp:

Trong trường hợp đặc tính liên tục, nên xây dựng biểu đồ, trong đó khoảng chứa tất cả các giá trị quan sát được của đặc tính được chia thành nhiều khoảng từng phần có độ dài h và cho mỗi khoảng một phần n i được tìm thấy - tổng tần số của các biến thể rơi vào khoảng thứ i. (Ví dụ: khi đo chiều cao hoặc cân nặng của một người, chúng ta đang xử lý thuộc tính liên tục).

Biểu đồ tần số-Đây là một hình bậc thang bao gồm các hình chữ nhật, các đáy của chúng là các khoảng một phần có chiều dài h và chiều cao bằng tỷ lệ (mật độ tần số).

Quảng trường Hình chữ nhật một phần thứ i bằng tổng tần số của biến thể khoảng thứ i, tức là Diện tích của biểu đồ tần số bằng tổng của tất cả các tần số, tức là. cỡ mẫu.

Ví dụ:

Kết quả của sự thay đổi điện áp (tính bằng volt) trong mạng điện được đưa ra. Tạo chuỗi biến thể, xây dựng đa giác và biểu đồ tần số nếu các giá trị điện áp như sau: 227, 215, 230, 232, 223, 220, 228, 222, 221, 226, 226, 215, 218, 220, 216, 220, 225, 212, 217, 220.

Giải pháp:

Hãy tạo một chuỗi biến thể. Ta có n = 20, x min = 212, x max = 232.

Hãy áp dụng công thức Sturgess để tính số khoảng.

Chuỗi biến thiên theo khoảng của tần số có dạng:


Mật độ tần số

212-21 6

0,75

21 6-22 0

0,75

220-224

1,75

224-228

228-232

0,75

Hãy xây dựng biểu đồ tần số:

Trước tiên hãy xây dựng một đa giác tần số bằng cách tìm điểm giữa của các khoảng:


Biểu đồ tần số tương đốiđược gọi là một hình bậc bao gồm các hình chữ nhật, các đáy của chúng là các đoạn có chiều dài h và chiều cao bằng tỷ số w Tôi/h (mật độ tần số tương đối).

Quảng trường Hình chữ nhật một phần thứ i bằng tần số tương đối của các biến thể rơi vào khoảng thứ i. Những thứ kia. diện tích biểu đồ của tần số tương đối bằng tổng của tất cả các tần số tương đối, tức là đơn vị.

7. Đặc điểm số của chuỗi biến thể

Hãy xem xét các đặc điểm chính của quần thể chung và mẫu.

Phổ thôngđược gọi là giá trị trung bình số học của các giá trị đặc trưng của tổng thể.

Đối với các giá trị khác nhau x 1, x 2, x 3, ..., x n. đặc trưng của tổng thể của khối N ta có:

Nếu các giá trị đặc tính có tần số tương ứng N 1 +N 2 +…+N k =N thì


Giá trị trung bình mẫuđược gọi là giá trị trung bình số học của các giá trị đặc trưng của quần thể mẫu.

Nếu các giá trị đặc trưng có tần số tương ứng n 1 +n 2 +…+n k = n thì


Ví dụ:

Tính giá trị trung bình mẫu của mẫu: x 1 = 51,12; x 2 = 51,07, x 3 = 52,95; x 4 = 52,93, x 5 = 51,1, x 6 = 52,98; x 7 = 52,29; x 8 = 51,23; x 9 = 51,07; x 10 = 51,04.

Giải pháp:

Phương sai chungđược gọi là giá trị trung bình số học của độ lệch bình phương của các giá trị đặc tính X của tổng thể so với giá trị trung bình chung.

Với các giá trị x 1 , x 2 , x 3 , ..., x N khác nhau của đặc tính tổng thể của khối N ta có:

Nếu các giá trị đặc tính có tần số tương ứng N 1 +N 2 +…+N k =N thì

Độ lệch chuẩn chung (tiêu chuẩn) gọi là căn bậc hai của phương sai tổng quát

Phương sai mẫuđược gọi là giá trị trung bình số học của độ lệch bình phương của các giá trị quan sát được của một đặc tính so với giá trị trung bình.

Với các giá trị x 1, x 2, x 3, ..., x n khác nhau của đặc trưng quần thể mẫu của tập n ta có:


Nếu các giá trị đặc trưng có tần số tương ứng n 1 +n 2 +…+n k = n thì


Độ lệch chuẩn mẫu (tiêu chuẩn)được gọi là căn bậc hai của phương sai mẫu.


Ví dụ:

Quần thể mẫu được xác định bởi bảng phân phối. Tìm phương sai mẫu.


Giải pháp:

Định lý: Phương sai bằng hiệu giữa bình phương trung bình của các giá trị thuộc tính và bình phương của giá trị trung bình tổng thể.

Ví dụ:

Tìm phương sai của phân phối này.



Giải pháp:

8. Ước tính thống kê các tham số phân phối

Hãy để dân số nói chung được nghiên cứu bằng cách sử dụng một mẫu nhất định. Trong trường hợp này, chỉ có thể nhận được giá trị gần đúng của tham số Q chưa biết, dùng làm ước tính của nó. Rõ ràng, ước tính có thể khác nhau giữa các mẫu.

Đánh giá thống kêHỏi* Tham số chưa biết của phân bố lý thuyết được gọi là hàm f, tùy thuộc vào các giá trị mẫu được quan sát. Nhiệm vụ ước tính thống kê các tham số chưa biết từ một mẫu là xây dựng một hàm từ dữ liệu quan sát thống kê có sẵn để đưa ra các giá trị gần đúng chính xác nhất của giá trị thực mà nhà nghiên cứu chưa biết, giá trị của các tham số này.

Ước tính thống kê được chia thành điểm và khoảng, tùy thuộc vào phương pháp trình bày của chúng (số lượng hoặc khoảng).

Một điểm là một ước tính thống kê tham số Q của phân bố lý thuyết được xác định bởi một giá trị của tham số Q *=f (x 1, x 2, ..., x n), trong đóx 1 , x 2 , ..., xn- kết quả quan sát thực nghiệm về đặc tính định lượng X của một mẫu nhất định.

Các ước tính tham số như vậy thu được từ các mẫu khác nhau thường khác nhau. Hiệu tuyệt đối /Q *-Q / được gọi là lỗi lấy mẫu (ước tính).

Để ước tính thống kê tạo ra kết quả đáng tin cậy về các tham số được ước tính, chúng phải khách quan, hiệu quả và nhất quán.

Ước tính điểm, kỳ vọng toán học bằng (không bằng) tham số ước tính được gọi là không dịch chuyển (đã dịch chuyển). M(Q *)=Q .

Chênh lệch M( Q*)-Q được gọi là sai lệch hoặc lỗi hệ thống. Đối với các ước tính không thiên vị, độ lệch là 0.

Hiệu quả đánh giá Q *, với cỡ mẫu n cho trước có phương sai nhỏ nhất có thể có: D phút(n = const). Công cụ ước tính hiệu quả có phương sai nhỏ nhất so với các công cụ ước tính không thiên vị và nhất quán khác.

Giàu cógọi đây là thống kê đánh giá Q*, mà đối với ncó xu hướng xác suất theo tham số ước tính Q , I E. với kích thước mẫu ngày càng tăng N ước tính có xu hướng xác suất đến giá trị thực của tham số Q.

Yêu cầu về tính nhất quán phải phù hợp với quy luật số lớn: thông tin ban đầu về đối tượng nghiên cứu càng nhiều thì kết quả càng chính xác. Nếu cỡ mẫu nhỏ thì ước lượng điểm của tham số có thể dẫn đến sai sót nghiêm trọng.

tôi thích nó Khối lượng mẫuN) có thể được coi là một tập hợp có thứ tựx 1 , x 2 , ..., xn các biến ngẫu nhiên được phân phối độc lập giống hệt nhau.

Phương tiện mẫu cho các cỡ mẫu khác nhau N từ cùng một quần thể sẽ khác nhau. Nghĩa là, giá trị trung bình mẫu có thể được coi là một biến ngẫu nhiên, có nghĩa là chúng ta có thể nói về sự phân bố của giá trị trung bình mẫu và các đặc tính số của nó.

Giá trị trung bình mẫu đáp ứng tất cả các yêu cầu áp đặt cho ước tính thống kê, tức là đưa ra ước tính khách quan, hiệu quả và nhất quán về giá trị trung bình chung.

Có thể chứng minh rằng. Do đó, phương sai mẫu là ước tính sai lệch của phương sai tổng thể, đánh giá thấp nó. Tức là với cỡ mẫu nhỏ sẽ tạo ra sai số hệ thống. Để có một ước tính nhất quán, không thiên vị, chỉ cần lấy giá trị, được gọi là phương sai đã hiệu chỉnh. Đó là

Trong thực tế, để ước lượng phương sai tổng quát, phương sai đã hiệu chỉnh được sử dụng tại N < 30. Trong các trường hợp khác ( n >30) độ lệch so với khó nhận thấy. Vì vậy, đối với các giá trị lớn N sai số offset có thể được bỏ qua.

Người ta cũng có thể chứng minh rằng tần số tương đốin i / n là ước tính xác suất không thiên vị và nhất quán P (X = x tôi ). Hàm phân phối theo kinh nghiệm F*(x ) là ước tính không thiên vị và nhất quán của hàm phân phối lý thuyết F(x)=P(X< x ).

Ví dụ:

Tìm các ước tính không thiên vị về giá trị kỳ vọng và phương sai từ bảng mẫu.

x tôi
và tôi

Giải pháp:

Cỡ mẫu n = 20.

Ước tính không thiên vị của kỳ vọng toán học là giá trị trung bình mẫu.


Để tính toán ước lượng phương sai không thiên vị, trước tiên chúng ta tìm phương sai mẫu:

Bây giờ hãy tìm ước tính khách quan:

9. Ước tính khoảng thời gian của các tham số phân phối

Khoảng thời gian là ước tính thống kê được xác định bởi hai giá trị số - phần cuối của khoảng thời gian đang nghiên cứu.

Con số> 0, trong đó | Q - Q *|< , đặc trưng cho độ chính xác của ước tính khoảng.

Đáng tin cậygọi điện khoảng thời gian , với một xác suất cho trướcbao gồm giá trị tham số không xác định Q . Bổ sung khoảng tin cậy cho tập hợp tất cả các giá trị có thể có của tham số Q gọi điện khu vực quan trọng. Nếu vùng tới hạn chỉ nằm ở một phía của khoảng tin cậy thì khoảng tin cậy được gọi là một bên: bên trái, nếu vùng tới hạn chỉ tồn tại ở bên trái và thuận tay phải nếu chỉ ở bên phải. Ngược lại, khoảng tin cậy được gọi là song phương.

Độ tin cậy, hoặc mức độ tin cậy, ước tính Q (sử dụng Q *) là xác suất để thỏa mãn bất đẳng thức sau: | Q - Q *|< .

Thông thường, xác suất tin cậy được đặt trước (0,95; 0,99; 0,999) và yêu cầu nó phải gần bằng một.

Xác suấtgọi điện xác suất xảy ra lỗi hoặc mức độ quan trọng.

Hãy | Q - Q *|< , Sau đó. Điều này có nghĩa là với xác suấtcó thể lập luận rằng giá trị thực của tham số Q thuộc về khoảng. Độ lệch càng nhỏ, ước tính càng chính xác.

Các ranh giới (kết thúc) của khoảng tin cậy được gọi là giới hạn tin cậy hoặc giới hạn tới hạn.

Các giá trị của giới hạn khoảng tin cậy phụ thuộc vào quy luật phân bố của tham số Hỏi*.

Giá trị sai lệchbằng một nửa độ rộng của khoảng tin cậy được gọi là độ chính xác của đánh giá.

Các phương pháp xây dựng khoảng tin cậy lần đầu tiên được phát triển bởi nhà thống kê người Mỹ Yu Neumann. Độ chính xác ước tính, xác suất tin cậy và cỡ mẫu n được kết nối với nhau. Do đó, biết giá trị cụ thể của hai đại lượng, bạn luôn có thể tính được đại lượng thứ ba.

Tìm khoảng tin cậy để ước tính kỳ vọng toán học của phân bố chuẩn nếu biết độ lệch chuẩn.

Hãy lấy một mẫu từ một tổng thể chung tuân theo quy luật phân phối chuẩn. Cho biết độ lệch chuẩn chung, nhưng kỳ vọng toán học của phân bố lý thuyết vẫn chưa được biết Một ().

Công thức sau đây là đúng:

Những thứ kia. theo một giá trị độ lệch nhất địnhcó thể được tìm thấy với xác suất bao nhiêu để giá trị trung bình tổng quát chưa biết thuộc về khoảng. Và ngược lại. Từ công thức, rõ ràng là khi tăng cỡ mẫu và giá trị xác suất tin cậy cố định, giá trị- giảm, tức là độ chính xác của đánh giá tăng lên. Với độ tin cậy ngày càng tăng (xác suất tin cậy), giá trị-tăng, tức là độ chính xác của đánh giá giảm.

Ví dụ:

Kết quả của các thử nghiệm, các giá trị sau thu được -25, 34, -20, 10, 21. Được biết, chúng tuân theo quy luật phân phối chuẩn với độ lệch chuẩn là 2. Tìm ước tính a* cho kỳ vọng toán học a. Hãy xây dựng khoảng tin cậy 90% cho nó.

Giải pháp:

Hãy tìm một ước tính khách quan

Sau đó


Khoảng tin cậy cho a là: 4 – 1,47< Một< 4+ 1,47 или 2,53 < a < 5, 47

Tìm khoảng tin cậy để ước tính kỳ vọng toán học của phân bố chuẩn nếu chưa biết độ lệch chuẩn.

Biết rằng dân số nói chung tuân theo quy luật phân phối chuẩn, trong đó a và. Độ chính xác của khoảng tin cậy bao trùm với độ tin cậygiá trị thực của tham số a, trong trường hợp này, được tính theo công thức:

, trong đó n là cỡ mẫu, , - Hệ số sinh viên (tìm từ giá trị cho trước) n và từ bảng “Các điểm quan trọng của phân phối Sinh viên”).

Ví dụ:

Kết quả của các thử nghiệm, các giá trị sau thu được -35, -32, -26, -35, -30, -17. Được biết, chúng tuân theo quy luật phân phối chuẩn. Tìm khoảng tin cậy cho kỳ vọng toán học a của tổng thể với xác suất tin cậy là 0,9.

Giải pháp:

Hãy tìm một ước tính khách quan.

Chúng ta sẽ tìm thấy.

Sau đó

Khoảng tin cậy sẽ có dạng(-29,2 - 5,62; -29,2 + 5,62) hoặc (-34,82; -23,58).

Tìm khoảng tin cậy cho phương sai và độ lệch chuẩn của phân phối chuẩn

Lấy một mẫu thể tích ngẫu nhiên từ một quần thể giá trị chung nhất định được phân phối theo luật thông thườngN < 30, trong đó phương sai mẫu được tính: sai lệchvà đã sửa câu 2. Sau đó, để tìm ước tính khoảng với độ tin cậy nhất địnhcho phương sai chungDđộ lệch chuẩn chungCác công thức sau đây được sử dụng.


hoặc,

Giá trị- được tìm thấy bằng cách sử dụng bảng các giá trị điểm tới hạnPhân phối Pearson.

Khoảng tin cậy cho phương sai được tìm thấy từ những bất đẳng thức này bằng cách bình phương tất cả các vế của bất đẳng thức.

Ví dụ:

Kiểm tra chất lượng 15 bu lông. Giả sử rằng sai số trong quá trình sản xuất tuân theo quy luật phân phối chuẩn và độ lệch chuẩn của mẫubằng 5 mm, xác định một cách đáng tin cậykhoảng tin cậy cho một tham số chưa biết

Chúng tôi biểu thị ranh giới của khoảng dưới dạng bất đẳng thức kép:

Các điểm cuối của khoảng tin cậy hai phía cho phương sai có thể được xác định mà không cần thực hiện các phép tính số học đối với mức độ tin cậy và cỡ mẫu nhất định bằng cách sử dụng bảng thích hợp (Giới hạn khoảng tin cậy cho phương sai tùy thuộc vào số bậc tự do và độ tin cậy) . Để làm điều này, các điểm cuối của khoảng thu được từ bảng được nhân với phương sai đã hiệu chỉnh s 2.

Ví dụ:

Hãy giải quyết vấn đề trước theo một cách khác.

Giải pháp:

Hãy tìm phương sai đã hiệu chỉnh:

Sử dụng bảng “Giới hạn khoảng tin cậy đối với độ phân tán tùy thuộc vào số bậc tự do và độ tin cậy”, chúng ta sẽ tìm được ranh giới của khoảng tin cậy đối với độ phân tán tạik=14 và: giới hạn dưới 0,513 và giới hạn trên 2,354.

Hãy nhân các ranh giới kết quả vớis 2 và trích rút nghiệm (vì chúng ta cần khoảng tin cậy không phải cho phương sai mà cho độ lệch chuẩn).

Như có thể thấy từ các ví dụ, độ lớn của khoảng tin cậy phụ thuộc vào phương pháp xây dựng nó và cho kết quả tương tự nhưng không bằng nhau.

Đối với các mẫu có kích thước đủ lớn (N>30) ranh giới của khoảng tin cậy đối với độ lệch chuẩn chung có thể được xác định bằng công thức: - một số nhất định được lập bảng và đưa ra trong bảng tham chiếu tương ứng.

Nếu 1- q<1, то формула имеет вид:

Ví dụ:

Hãy giải quyết vấn đề trước theo cách thứ ba.

Giải pháp:

Đã tìm thấy trước đâyS= 5,17. q(0,95; 15) = 0,46 – được tìm thấy từ bảng.

Sau đó:

quan sát có chọn lọcáp dụng khi sử dụng giám sát liên tục về mặt thể chất là không thể do một lượng lớn dữ liệu hoặc không khả thi về mặt kinh tế. Ví dụ, sự bất khả thi về mặt vật lý xảy ra khi nghiên cứu dòng hành khách, giá cả thị trường và ngân sách gia đình. Sự kém hiệu quả về mặt kinh tế xảy ra khi đánh giá chất lượng hàng hóa liên quan đến việc phá hủy chúng, chẳng hạn như nếm thử, kiểm tra độ bền của gạch, v.v.

Các đơn vị thống kê được chọn để quan sát là dân số mẫu hoặc vật mẫu và toàn bộ mảng của chúng - dân số nói chung(GS). trong đó số lượng đơn vị trong mẫu chứng tỏ N, và trong toàn bộ HS - N. Thái độ không/không gọi điện kích thước tương đối hoặc chia sẻ mẫu.

Chất lượng của kết quả quan sát mẫu phụ thuộc vào tính đại diện của mẫu, nghĩa là nó có tính đại diện như thế nào trong GS. Để đảm bảo tính đại diện của mẫu cần tuân thủ nguyên tắc lựa chọn ngẫu nhiên các đơn vị, giả định rằng việc đưa đơn vị HS vào mẫu không thể bị ảnh hưởng bởi bất kỳ yếu tố nào ngoài sự ngẫu nhiên.

tồn tại 4 cách chọn ngẫu nhiênđể lấy mẫu:

  1. Thực sự ngẫu nhiên lựa chọn hoặc “phương pháp xổ số”, khi số lượng thống kê được gán số sê-ri, được ghi trên một số đồ vật nhất định (ví dụ: thùng), sau đó được trộn trong một số vật chứa (ví dụ: trong túi) và được chọn ngẫu nhiên. Trong thực tế, phương pháp này được thực hiện bằng cách sử dụng bộ tạo số ngẫu nhiên hoặc bảng toán học của các số ngẫu nhiên.
  2. Cơ khí lựa chọn theo đó mỗi ( Không có)-giá trị của tổng thể. Ví dụ: nếu nó chứa 100.000 giá trị và bạn cần chọn 1.000 thì cứ 100.000/1000 = giá trị thứ 100 sẽ được đưa vào mẫu. Hơn nữa, nếu chúng không được xếp hạng thì người đầu tiên được chọn ngẫu nhiên từ một trăm người đầu tiên, và số lượng của những người còn lại sẽ cao hơn một trăm. Ví dụ: nếu đơn vị đầu tiên là số 19 thì đơn vị tiếp theo sẽ là số 119, sau đó là số 219, rồi số 319, v.v. Nếu các đơn vị dân số được xếp hạng thì số 50 được chọn trước, sau đó là số 150, sau đó là số 250, v.v.
  3. Việc lựa chọn các giá trị từ một mảng dữ liệu không đồng nhất được thực hiện phân tầng(phân tầng), khi dân số lần đầu tiên được chia thành các nhóm đồng nhất để áp dụng lựa chọn ngẫu nhiên hoặc cơ học.
  4. Phương pháp lấy mẫu đặc biệt nối tiếp lựa chọn, trong đó họ chọn ngẫu nhiên hoặc máy móc không phải các giá trị riêng lẻ mà là chuỗi của chúng (chuỗi từ số này đến số khác trong một hàng), trong đó việc quan sát liên tục được thực hiện.

Chất lượng quan sát mẫu cũng phụ thuộc vào loại mẫu: lặp đi lặp lại hoặc không thể lặp lại.
Tại lựa chọn lại Các giá trị thống kê hoặc chuỗi của chúng có trong mẫu sẽ được trả lại cho dân số chung sau khi sử dụng, có cơ hội được đưa vào mẫu mới. Hơn nữa, tất cả các giá trị trong dân số đều có cùng xác suất được đưa vào mẫu.
Lựa chọn lặp lại có nghĩa là các giá trị thống kê hoặc chuỗi của chúng có trong mẫu sẽ không quay trở lại tổng thể chung sau khi sử dụng và do đó, đối với các giá trị còn lại của giá trị sau, xác suất được đưa vào mẫu tiếp theo sẽ tăng lên.

Lấy mẫu không lặp lại cho kết quả chính xác hơn nên được sử dụng thường xuyên hơn. Nhưng có những tình huống không thể áp dụng nó (nghiên cứu luồng hành khách, nhu cầu của người tiêu dùng, v.v.) và sau đó việc lựa chọn lặp lại được thực hiện.

Lỗi lấy mẫu

Quần thể mẫu có thể được hình thành dựa trên đặc tính định lượng của các giá trị thống kê, cũng như trên đặc tính thay thế hoặc thuộc tính. Trong trường hợp đầu tiên, đặc điểm chung của mẫu là số lượng được biểu thị bằng , và trong giây - chia sẻ mẫuđại lượng được ký hiệu w. Trong dân số nói chung, tương ứng: trung bình chungchia sẻ chung p.

Sự khác biệt - và WRđược gọi là lỗi lấy mẫu, chia hết cho Lỗi đăng kýlỗi đại diện. Phần đầu tiên của lỗi lấy mẫu phát sinh do thông tin không đúng hoặc thiếu chính xác do chưa hiểu rõ bản chất của vấn đề, sự thiếu chú ý của nhà đăng ký khi điền phiếu, biểu mẫu,… Nó khá dễ dàng để phát hiện và loại bỏ. Phần thứ hai của lỗi phát sinh từ việc không tuân thủ nguyên tắc chọn ngẫu nhiên liên tục hoặc tự phát. Rất khó để phát hiện và loại bỏ, nó lớn hơn nhiều so với cái đầu tiên và do đó người ta chú ý chính đến nó.

Độ lớn của sai số lấy mẫu có thể khác nhau đối với các mẫu khác nhau từ cùng một quần thể, do đó trong thống kê nó được xác định sai số trung bình của việc lấy mẫu lặp lại và không lặp lại theo các công thức:

Lặp đi lặp lại;

- không lặp đi lặp lại;

Trong đó Dv là phương sai mẫu.

Ví dụ: trong một nhà máy có 1000 công nhân. Việc lấy mẫu ngẫu nhiên không lặp lại 5% đã được thực hiện để xác định thời gian làm việc trung bình của nhân viên. Kết quả quan sát mẫu được trình bày ở hai cột đầu tiên của bảng sau:

X , năm
(kinh nghiệm làm việc)

f , mọi người
(số lượng nhân viên trong mẫu)

X

X f

Trong cột thứ 3, trung điểm của các khoảng X được xác định (là nửa tổng của ranh giới dưới và trên của khoảng) và trong cột thứ 4 - tích của X AND f để tìm trung bình mẫu bằng cách sử dụng phép tính số học Công thức bình quân gia quyền:

143,0/50 = 2,86 (năm).

Hãy tính phương sai mẫu có trọng số:
= 105,520/50 = 2,110.

Bây giờ hãy tìm lỗi lấy mẫu không lặp lại trung bình:
= 0,200 (năm).

Từ các công thức tính sai số lấy mẫu trung bình, rõ ràng là sai số sẽ nhỏ hơn khi lấy mẫu không lặp lại và như đã được chứng minh trong lý thuyết xác suất, nó xảy ra với xác suất là 0,683 (nghĩa là nếu bạn lấy 1000 mẫu từ một tổng thể chung). thì trong 683 trong số đó sai số sẽ không vượt quá sai số lấy mẫu trung bình). Xác suất này (0,683) thấp nên ít được sử dụng cho các phép tính thực tế khi cần xác suất cao hơn. Để xác định lỗi lấy mẫu có xác suất cao hơn 0,683, hãy tính lỗi lấy mẫu cận biên:

Ở đâu t- hệ số tin cậy, tùy thuộc vào xác suất xác định được sai số lấy mẫu lớn nhất.

Giá trị hệ số tin cậy tđược tính toán cho các xác suất khác nhau và có sẵn trong các bảng đặc biệt (tích phân Laplace), trong đó các kết hợp sau được sử dụng rộng rãi trong thống kê:

Xác suất 0,683 0,866 0,950 0,954 0,988 0,990 0,997 0,999
t 1 1,5 1,96 2 2,5 2,58 3 3,5

Sau khi đặt mức xác suất cụ thể, hãy chọn giá trị tương ứng từ bảng t và xác định sai số lấy mẫu tối đa bằng công thức.
Trong trường hợp này, = 0,95 được sử dụng thường xuyên nhất và t= 1,96, nghĩa là họ tin rằng với xác suất 95% thì sai số lấy mẫu biên lớn hơn 1,96 lần so với mức trung bình. Xác suất này (0,95) được coi là tiêu chuẩn và được sử dụng theo mặc định trong tính toán.

Trong nghiên cứu của chúng tôi, chúng tôi xác định sai số lấy mẫu tối đa với xác suất tiêu chuẩn là 95% (từ đó chúng tôi lấy t= 1,96 cho xác suất 95%): = 1,96*0,200 = 0,392 (năm).

Sau khi tính sai số giới hạn, hãy tìm khoảng tin cậy của đặc điểm tổng thể chung. Khoảng như vậy cho giá trị trung bình chung có dạng
Nghĩa là, thời gian làm việc trung bình của công nhân toàn nhà máy nằm trong khoảng từ 2,468 đến 3,252 năm.

Xác định cỡ mẫu

Khi phát triển chương trình quan sát mẫu, đôi khi một giá trị cụ thể của sai số tối đa với mức xác suất được chỉ định. Cỡ mẫu tối thiểu đảm bảo độ chính xác được chỉ định vẫn chưa được biết. Nó có thể thu được từ các công thức tính sai số trung bình và sai số biên, tùy thuộc vào loại mẫu. Vì vậy, thay thế và vào và giải nó theo cỡ mẫu, chúng ta thu được các công thức sau:
để lấy mẫu lại N =
để lấy mẫu không lặp lại N = .

Ngoài ra, đối với các giá trị thống kê có đặc tính định lượng, cần phải biết phương sai mẫu, nhưng ngay cả điều này cũng không được biết khi bắt đầu tính toán. Vì thế nó được chấp nhận khoảng một trong những điều sau đây cách(theo thứ tự ưu tiên):

Khi nghiên cứu các đặc tính phi số, ngay cả khi không có thông tin gần đúng về tỷ lệ mẫu cũng được chấp nhận. w= 0,5, theo công thức phân tán chia sẻ tương ứng với độ phân tán mẫu tối đa Đv = 0,5*(1-0,5) = 0,25.