Tiểu sử Đặc trưng Phân tích

Công thức tính phương sai của biến ngẫu nhiên rời rạc. Kỳ vọng toán học và phương sai của một biến ngẫu nhiên

Phương sai trong thống kê được định nghĩa là giá trị trung bình độ lệch chuẩn các giá trị riêng của tính trạng được bình phương từ giá trị trung bình cộng. Một cách phổ biến để tính toán độ lệch bình phương của các tùy chọn so với giá trị trung bình và sau đó tính trung bình chúng.

Trong phân tích kinh tế và thống kê, thông thường để đánh giá sự biến động của một đặc điểm thường sử dụng độ lệch chuẩn, là căn bậc hai của phương sai.

(3)

Nó đặc trưng cho sự biến động tuyệt đối của các giá trị của thuộc tính biến số và được biểu thị bằng các đơn vị giống như các biến thể. Trong thống kê, việc so sánh sự thay đổi của các đối tượng địa lý thường trở nên cần thiết. Đối với những so sánh như vậy, một chỉ báo tương đối về sự thay đổi, hệ số biến thiên, được sử dụng.

Thuộc tính phân tán:

1) nếu bạn trừ bất kỳ số nào khỏi tất cả các tùy chọn, thì phương sai sẽ không thay đổi;

2) nếu tất cả các giá trị của phương sai được chia cho một số b, thì phương sai sẽ giảm b ^ 2 lần, tức là

3) nếu bạn tính toán hình vuông ở giữađộ lệch từ bất kỳ số nào có trung bình cộng không bằng nhau, thì nó sẽ lớn hơn phương sai. Trong trường hợp này, bằng một giá trị được xác định rõ ràng trên mỗi bình phương của sự khác biệt giữa giá trị trung bình của vị trí.

Phương sai có thể được định nghĩa là sự khác biệt giữa bình phương trung bình và bình phương trung bình.

17. Các biến thể nhóm và giữa các nhóm. Quy tắc cộng phương sai

Nếu dân số thống kê được chia thành các nhóm hoặc các bộ phận theo đặc điểm đang được nghiên cứu, thì đối với một quần thể như vậy, các loại sau phương sai: nhóm (riêng), trung bình của nhóm (riêng) và giữa các nhóm.

Tổng phương sai- phản ánh sự biến đổi của một tính trạng do tất cả các điều kiện và nguyên nhân hoạt động trong một tổng thể thống kê nhất định.

Phương sai nhóm- bằng độ lệch bình phương trung bình giá trị cá nhân một đối tượng địa lý trong một nhóm từ trung bình cộng của nhóm này, được gọi là trung bình nhóm. Trong trường hợp này, mức trung bình của nhóm không trùng với mức trung bình của toàn bộ dân số.

Phương sai nhóm chỉ phản ánh sự biến đổi của một tính trạng do các điều kiện và nguyên nhân hoạt động trong nhóm.

Phương sai nhóm trung bình- được định nghĩa là trung bình cộng có trọng số của các nhóm phân tán, với trọng số là thể tích của các nhóm.

Phương sai giữa các nhóm- bằng bình phương trung bình của độ lệch của nhóm có nghĩa là từ tổng trung bình.

Phương sai giữa các nhóm đặc trưng cho sự biến đổi của thuộc tính kết quả do thuộc tính nhóm.

Có một mối quan hệ nhất định giữa các loại phân tán được coi là: tổng độ phân tán bằng tổng của nhóm trung bình và phương sai giữa các nhóm.

Quan hệ này được gọi là quy tắc cộng phương sai.

18. Dãy số động và các yếu tố cấu thành nó. Các loại chuỗi động.

Hàng loạt thống kê- đây là những dữ liệu kỹ thuật số cho biết liệu một hiện tượng có thay đổi theo thời gian hay không gian hay không và giúp có thể so sánh thống kê các hiện tượng cả trong quá trình phát triển của chúng theo thời gian và trong đa dạng mẫu mã và các loại quy trình. Nhờ đó có thể phát hiện ra sự phụ thuộc lẫn nhau của các sự vật hiện tượng.

Quá trình phát triển vận động của các hiện tượng xã hội theo thời gian trong thống kê thường được gọi là động lực học. Để hiển thị các động thái, chuỗi động thái (theo thời gian, theo thời gian) được xây dựng, là chuỗi các giá trị thay đổi theo thời gian của một chỉ số thống kê (ví dụ: số người bị kết án trên 10 năm), nằm ở thứ tự thời gian. Các yếu tố cấu thành của chúng là các giá trị số của một chỉ số nhất định và các khoảng thời gian hoặc thời điểm mà chúng tham chiếu.

Đặc điểm quan trọng nhất của chuỗi thời gian- kích thước của chúng (khối lượng, giá trị) của hiện tượng này hoặc hiện tượng đó, đạt được trong một thời kỳ nhất định hoặc một thời điểm nhất định. Theo đó, độ lớn của các số hạng của chuỗi động lực học là cấp của nó. Phân biệt mức ban đầu, giữa và cuối cùng của chuỗi động. Cấp độ đầu tiên hiển thị giá trị của phần đầu tiên, phần cuối cùng - giá trị của phần tử cuối cùng của chuỗi. Cấp trungđại diện cho phạm vi biến thiên theo thứ tự thời gian trung bình và được tính toán tùy thuộc vào việc chuỗi thời gian là khoảng thời gian hay tức thời.

Một cái khác đặc điểm quan trọng loạt động- thời gian trôi qua từ lần quan sát đầu tiên đến lần quan sát cuối cùng, hoặc số lượng các lần quan sát đó.

Có nhiều loại chuỗi thời gian khác nhau, chúng có thể được phân loại theo các tiêu chí sau.

1) Tùy thuộc vào cách biểu thị mức độ, chuỗi động lực học được chia thành chuỗi các chỉ tiêu tuyệt đối và suy ra (giá trị tương đối và giá trị trung bình).

2) Tùy thuộc vào cách các mức độ của chuỗi biểu hiện trạng thái của hiện tượng tại một số thời điểm nhất định (đầu tháng, quý, năm, v.v.) hoặc giá trị của nó trong những khoảng thời gian nhất định (ví dụ, mỗi ngày, tháng, năm, v.v.) n.), phân biệt giữa chuỗi động lực thời điểm và khoảng thời gian, tương ứng. Chuỗi khoảnh khắc trong công việc phân tích của các cơ quan thực thi pháp luật được sử dụng tương đối hiếm.

Trong lý thuyết thống kê, động lực học còn được phân biệt theo một số đặc điểm phân loại khác: phụ thuộc vào khoảng cách giữa các cấp - với các cấp cách đều nhau và các cấp không bằng nhau về thời gian; tùy thuộc vào sự hiện diện của xu hướng chính của quá trình đang nghiên cứu - cố định và không cố định. Khi phân tích chuỗi thời gianđến từ cấp độ tiếp theo loạt bài được trình bày dưới dạng các thành phần:

Y t \ u003d TP + E (t)

trong đó TR là thành phần xác định xác định xu hướng thay đổi chung theo thời gian hoặc một xu hướng.

E (t) - thành phần ngẫu nhiên gây ra dao động mức.

Gia trị được ki vọng và độ phân tán - các đặc điểm số được sử dụng phổ biến nhất biến ngẫu nhiên. Chúng đặc trưng cho các tính năng quan trọng nhất của sự phân bố: vị trí và mức độ phân tán của nó. Trong nhiều vấn đề của thực tiễn, không thể có được một mô tả đầy đủ, đầy đủ về một biến ngẫu nhiên - quy luật phân phối - hoặc hoàn toàn không cần thiết, hoặc hoàn toàn không cần thiết. Trong những trường hợp này, chúng được giới hạn trong mô tả gần đúng của một biến ngẫu nhiên bằng cách sử dụng các đặc trưng số.

Kỳ vọng toán học thường được gọi đơn giản là giá trị trung bình của một biến ngẫu nhiên. Sự phân tán của một biến ngẫu nhiên là một đặc điểm của sự phân tán, phân tán của một biến ngẫu nhiên xung quanh kỳ vọng toán học của nó.

Kỳ vọng toán học của một biến ngẫu nhiên rời rạc

Hãy tiếp cận khái niệm kỳ vọng toán học, trước tiên hãy tiến hành từ việc giải thích cơ học về phân phối của một biến ngẫu nhiên rời rạc. Hãy để khối lượng đơn vị được phân phối giữa các điểm của trục x x1 , x 2 , ..., x N và mỗi điểm vật liệu có khối lượng tương ứng với nó từ P1 , P 2 , ..., P N. Yêu cầu phải chọn một điểm trên trục x, đặc trưng cho vị trí của toàn bộ hệ thống điểm vật liệu, có tính đến khối lượng của chúng. Đương nhiên lấy khối tâm của hệ các chất điểm làm điểm như vậy. Đây là giá trị trung bình có trọng số của biến ngẫu nhiên X, trong đó abscissa của mỗi điểm xtôi nhập với "trọng số" bằng xác suất tương ứng. Giá trị trung bình của biến ngẫu nhiên do đó thu được Xđược gọi là kỳ vọng toán học của nó.

Kỳ vọng toán học của một biến ngẫu nhiên rời rạc là tổng các tích của tất cả các giá trị có thể có của nó và xác suất của các giá trị này:

ví dụ 1 Một cuộc xổ số có thưởng đã được tổ chức. Có 1000 chiến thắng, 400 trong số đó là 10 rúp mỗi lần. 300 - 20 rúp mỗi 200 - 100 rúp mỗi cái. và 100 - 200 rúp mỗi loại. Gì kích thước trung bình tiền thắng cho ai đã mua một vé?

Quyết định. Chúng tôi nhận thấy lợi nhuận trung bình nếu tổng cộng tiền thắng cược, bằng 10 * 400 + 20 * 300 + 100 * 200 + 200 * 100 = 50.000 rúp, chia cho 1000 (tổng số tiền thắng cược). Sau đó, chúng tôi nhận được 50000/1000 = 50 rúp. Nhưng biểu thức để tính toán độ lợi trung bình cũng có thể được biểu diễn ở dạng sau:

Mặt khác, trong những điều kiện này, số tiền thắng cược là một biến ngẫu nhiên có thể nhận các giá trị 10, 20, 100 và 200 rúp. với các xác suất lần lượt bằng 0,4; 0,3; 0,2; 0,1. Do đó, lợi nhuận trung bình dự kiến bằng tổng các sản phẩm có kích thước của số tiền thắng cược bằng xác suất giành được chúng.

Ví dụ 2 Nhà xuất bản quyết định xuất bản sách mới. Anh ta sẽ bán cuốn sách với giá 280 rúp, trong đó 200 rúp sẽ được tặng cho anh ta, 50 cho hiệu sách và 30 cho tác giả. Bảng cung cấp thông tin về chi phí xuất bản một cuốn sách và khả năng bán được một số lượng bản sao nhất định của cuốn sách.

Tìm lợi nhuận kỳ vọng của nhà xuất bản.

Quyết định. Biến ngẫu nhiên "lợi nhuận" bằng chênh lệch giữa thu nhập từ việc bán hàng và chi phí. Ví dụ: nếu 500 bản của một cuốn sách được bán, thì thu nhập từ việc bán là 200 * 500 = 100.000 và chi phí xuất bản là 225.000 rúp. Do đó, nhà xuất bản phải đối mặt với khoản lỗ 125.000 rúp. Bảng sau đây tóm tắt các giá trị kỳ vọng của biến ngẫu nhiên - lợi nhuận:

Con sốLợi nhuận xtôi Xác suất Ptôi xtôi P tôi
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Toàn bộ: 1,00 25000

Do đó, chúng tôi có được kỳ vọng toán học về lợi nhuận của nhà xuất bản:

.

Ví dụ 3 Cơ hội trúng đích với một cú đánh P= 0,2. Xác định mức tiêu thụ của các quả đạn cung cấp kỳ vọng toán học về số lần bắn trúng bằng 5.

Quyết định. Từ cùng một công thức kỳ vọng mà chúng tôi đã sử dụng cho đến nay, chúng tôi thể hiện x- tiêu thụ vỏ:

.

Ví dụ 4 Xác định kỳ vọng toán học của một biến ngẫu nhiên x số lần bắn trúng với ba lần bắn, nếu xác suất bắn trúng của mỗi lần bắn P = 0,4 .

Gợi ý: tìm xác suất các giá trị của một biến ngẫu nhiên bằng Công thức Bernoulli .

Thuộc tính kỳ vọng

Xem xét các tính chất của kỳ vọng toán học.

Thuộc tính 1. Kỳ vọng toán học của một giá trị không đổi bằng với hằng số này:

Tài sản 2. Hệ số không đổi có thể được lấy ra khỏi dấu kỳ vọng:

Thuộc tính 3. Kỳ vọng toán học của tổng (sự khác biệt) của các biến ngẫu nhiên bằng tổng (sự khác biệt) của các kỳ vọng toán học của chúng:

Thuộc tính 4. Kỳ vọng toán học về tích của các biến ngẫu nhiên bằng tích của kỳ vọng toán học của chúng:

Tài sản 5. Nếu tất cả các giá trị của biến ngẫu nhiên X giảm (tăng) theo cùng một số Với, sau đó kỳ vọng toán học của nó sẽ giảm (tăng) theo cùng một con số:

Khi bạn không thể bị giới hạn chỉ trong kỳ vọng toán học

Trong hầu hết các trường hợp, chỉ kỳ vọng toán học không thể mô tả đầy đủ một biến ngẫu nhiên.

Để các biến ngẫu nhiên XYđược đưa ra bởi các luật phân phối sau:

Nghĩa X Xác suất
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Nghĩa Y Xác suất
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Kỳ vọng toán học của những đại lượng này là như nhau - bằng không:

Tuy nhiên, sự phân bố của chúng là khác nhau. Giá trị ngẫu nhiên X chỉ có thể nhận các giá trị khác một chút so với kỳ vọng toán học và biến ngẫu nhiên Y có thể nhận các giá trị sai lệch đáng kể so với kỳ vọng toán học. Một ví dụ tương tự: mức lương trung bình không làm cho chúng ta có thể đánh giá được trọng lượng riêng người lao động được trả lương cao và thấp. Nói cách khác, bằng kỳ vọng toán học, người ta không thể đánh giá những sai lệch nào so với nó, ít nhất là ở mức trung bình, là có thể. Để làm điều này, bạn cần tìm phương sai của một biến ngẫu nhiên.

Sự phân tán của một biến ngẫu nhiên rời rạc

sự phân tán biến ngẫu nhiên rời rạc Xđược gọi là kỳ vọng toán học của bình phương độ lệch của nó so với kỳ vọng toán học:

Độ lệch chuẩn của một biến ngẫu nhiên X triệu tập giá trị số học căn bậc hai các phương sai của nó:

.

Ví dụ 5 Tính phương sai và độ lệch chuẩn của các biến ngẫu nhiên XY, có luật phân phối được cho trong bảng trên.

Quyết định. Kỳ vọng toán học của các biến ngẫu nhiên XY, như đã tìm thấy ở trên, bằng không. Theo công thức phân tán cho E(X)=E(y) = 0 chúng tôi nhận được:

Khi đó độ lệch chuẩn của các biến ngẫu nhiên XY cấu tạo

.

Do đó, với cùng kỳ vọng toán học, phương sai của biến ngẫu nhiên X rất nhỏ và ngẫu nhiên Y- có ý nghĩa. Đây là hệ quả của sự khác biệt trong phân bố của chúng.

Ví dụ 6 Chủ đầu tư có 4 dự án đầu tư thay thế. Bảng tóm tắt dữ liệu về lợi nhuận kỳ vọng trong các dự án này với xác suất tương ứng.

Dự án 1Dự án 2Dự án 3Dự án 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Tìm cho mỗi phương án thay thế kỳ vọng toán học, phương sai và độ lệch chuẩn.

Quyết định. Hãy để chúng tôi chỉ ra cách tính những đại lượng này cho phương án thứ 3:

Bảng tóm tắt các giá trị tìm được cho tất cả các lựa chọn thay thế.

Tất cả các lựa chọn thay thế đều có cùng kỳ vọng toán học. Điều này có nghĩa là về lâu dài mọi người đều có thu nhập như nhau. Độ lệch chuẩn có thể được hiểu là thước đo rủi ro - độ lệch chuẩn càng lớn thì rủi ro đầu tư càng lớn. Một nhà đầu tư không sẵn sàng chấp nhận nhiều rủi ro sẽ chọn dự án 1 vì nó có ít rủi ro nhất độ lệch chuẩn(0). Nếu nhà đầu tư thích rủi ro và lợi nhuận cao trong thời gian ngắn, thì anh ta sẽ chọn dự án có độ lệch chuẩn lớn nhất - dự án 4.

Thuộc tính phân tán

Hãy để chúng tôi trình bày các tính chất của sự phân tán.

Thuộc tính 1.Độ phân tán của một giá trị không đổi bằng không:

Tài sản 2. Hệ số hằng số có thể được lấy ra khỏi dấu hiệu phân tán bằng cách bình phương nó:

.

Thuộc tính 3. Phương sai của một biến ngẫu nhiên bằng kỳ vọng toán học của bình phương giá trị này, từ đó bình phương của kỳ vọng toán học của chính giá trị đó bị trừ đi:

,

ở đâu .

Thuộc tính 4. Phương sai của tổng (hiệu) của các biến ngẫu nhiên bằng tổng (hiệu) của các phương sai của chúng:

Ví dụ 7 Người ta biết rằng một biến ngẫu nhiên rời rạc X chỉ nhận hai giá trị: −3 và 7. Ngoài ra, kỳ vọng toán học đã biết: E(X) = 4. Tìm phương sai của một biến ngẫu nhiên rời rạc.

Quyết định. Biểu thị bởi P xác suất mà một biến ngẫu nhiên nhận một giá trị x1 = −3 . Khi đó xác suất của giá trị x2 = 7 sẽ là 1 - P. Hãy suy ra phương trình cho kỳ vọng toán học:

E(X) = x 1 P + x 2 (1 − P) = −3P + 7(1 − P) = 4 ,

nơi chúng tôi nhận được các xác suất: P= 0,3 và 1 - P = 0,7 .

Quy luật phân phối của một biến ngẫu nhiên:

X −3 7
P 0,3 0,7

Chúng tôi tính toán phương sai của biến ngẫu nhiên này bằng công thức từ thuộc tính 3 của phương sai:

D(X) = 2,7 + 34,3 − 16 = 21 .

Tự tìm kỳ vọng toán học của một biến ngẫu nhiên, rồi xem lời giải

Ví dụ 8 Biến ngẫu nhiên rời rạc X chỉ nhận hai giá trị. Nó nhận giá trị lớn hơn của 3 với xác suất là 0,4. Ngoài ra, phương sai của biến ngẫu nhiên đã biết D(X) = 6. Tìm kỳ vọng toán học của một biến ngẫu nhiên.

Ví dụ 9 Một bình đựng 6 viên bi trắng và 4 bi đen. 3 quả bóng được lấy ra từ bình. Số quả bóng trắng trong số các quả bóng được rút ra là một biến ngẫu nhiên rời rạc X. Tìm kỳ vọng toán học và phương sai của biến ngẫu nhiên này.

Quyết định. Giá trị ngẫu nhiên X có thể nhận các giá trị 0, 1, 2, 3. Các xác suất tương ứng có thể được tính từ quy tắc nhân các xác suất. Quy luật phân phối của một biến ngẫu nhiên:

X 0 1 2 3
P 1/30 3/10 1/2 1/6

Do đó, kỳ vọng toán học của biến ngẫu nhiên này:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Phương sai của một biến ngẫu nhiên đã cho là:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Kỳ vọng toán học và sự phân tán của một biến ngẫu nhiên liên tục

Đối với một biến ngẫu nhiên liên tục, cách giải thích cơ học của kỳ vọng toán học sẽ giữ nguyên ý nghĩa: khối tâm của một đơn vị khối lượng phân bố liên tục trên trục x với mật độ f(x). Ngược lại với một biến ngẫu nhiên rời rạc, mà đối số hàm xtôi thay đổi đột ngột, đối với một biến ngẫu nhiên liên tục, đối số thay đổi liên tục. Nhưng kỳ vọng toán học của một biến ngẫu nhiên liên tục cũng liên quan đến giá trị trung bình của nó.

Để tìm kỳ vọng toán học và phương sai của một biến ngẫu nhiên liên tục, bạn cần tìm các tích phân xác định . Nếu hàm mật độ của một biến ngẫu nhiên liên tục được đưa ra, thì nó sẽ nhập trực tiếp vào tích phân. Nếu một hàm phân phối xác suất được đưa ra, thì bằng cách phân biệt nó, bạn cần tìm hàm mật độ.

Giá trị trung bình cộng của tất cả các giá trị có thể có của một biến ngẫu nhiên liên tục được gọi là kỳ vọng toán học, ký hiệu là hoặc.

Nếu dân số được chia thành các nhóm theo đặc điểm đang nghiên cứu thì các kiểu phân tán sau có thể được tính cho quần thể này: tổng số, nhóm (nội nhóm), trung bình nhóm (trung bình trong nhóm), giữa các nhóm.

Ban đầu, nó tính toán hệ số xác định, cho biết phần nào biến thể chung của tính trạng được nghiên cứu là sự biến đổi giữa các nhóm, tức là do phân nhóm:

Tỷ lệ tương quan thực nghiệm đặc trưng cho sự chặt chẽ của mối liên hệ giữa các dấu hiệu phân nhóm (giai thừa) và hiệu quả.

Tỷ lệ tương quan thực nghiệm có thể nhận các giá trị từ 0 đến 1.

Để đánh giá mức độ chặt chẽ của mối quan hệ dựa trên tỷ lệ tương quan thực nghiệm, bạn có thể sử dụng quan hệ Chaddock:

Ví dụ 4 Sau đây là số liệu về tình hình thực hiện công việc của các tổ chức thiết kế và khảo sát hình dạng khác nhau bất động sản:

Định nghĩa:

1) tổng phương sai;

2) phân tán nhóm;

3) giá trị trung bình của các nhóm phân tán;

4) sự phân tán giữa các nhóm;

5) tổng phương sai dựa trên quy tắc cộng các phương sai;


6) hệ số xác định và tương quan thực nghiệm.

Rút ra kết luận của riêng bạn.

Quyết định:

1. Xác định khối lượng trung bình thực hiện công việc của doanh nghiệp thuộc hai hình thức sở hữu:

Tính tổng phương sai:

2. Xác định giá trị trung bình của nhóm:

triệu rúp;

mln chà.

Phương sai nhóm:

;

3. Tính giá trị trung bình của các phương sai của nhóm:

4. Xác định phương sai giữa các nhóm:

5. Tính tổng phương sai dựa trên quy tắc thêm phương sai:

6. Xác định hệ số xác định:

.

Như vậy, khối lượng công việc do các tổ chức thiết kế, khảo sát thực hiện bằng 22% phụ thuộc vào hình thức sở hữu của doanh nghiệp.

Tỷ lệ tương quan thực nghiệm được tính theo công thức

.

Giá trị của chỉ tiêu tính toán cho thấy mức độ phụ thuộc của khối lượng công việc vào hình thức sở hữu của doanh nghiệp là nhỏ.

Ví dụ 5 Theo kết quả của cuộc khảo sát kỷ luật công nghệ các địa điểm sản xuất đã nhận được các dữ liệu sau:

Xác định hệ số xác định

Sự phân tánbiến ngẫu nhiên- một thước đo về sự phân tán của một biến ngẫu nhiên, đó là cô ấy sai lệch từ kỳ vọng toán học. Trong thống kê, ký hiệu (sigma bình phương) thường được sử dụng để biểu thị phương sai. Căn bậc hai của phương sai được gọi là độ lệch chuẩn hoặc độ chênh lệch chuẩn. Độ lệch chuẩn được đo bằng các đơn vị giống như chính biến ngẫu nhiên và phương sai được đo bằng các bình phương của đơn vị đó.

Mặc dù rất thuận tiện khi chỉ sử dụng một giá trị (chẳng hạn như giá trị trung bình hoặc chế độ và giá trị trung vị) để ước tính toàn bộ mẫu, nhưng cách tiếp cận này có thể dễ dàng dẫn đến kết luận sai. Lý do cho tình trạng này không nằm ở bản thân giá trị, mà thực tế là một giá trị không phản ánh sự lan truyền của các giá trị dữ liệu theo bất kỳ cách nào.

Ví dụ, trong mẫu:

mức trung bình là 5.

Tuy nhiên, không có phần tử nào trong mẫu có giá trị bằng 5. Bạn có thể cần biết mỗi phần tử của mẫu gần với giá trị trung bình của nó như thế nào. Hay nói cách khác, bạn cần biết phương sai của các giá trị. Biết mức độ dữ liệu đã thay đổi, bạn có thể diễn giải tốt hơn nghĩa là, Trung bìnhthời trang. Mức độ thay đổi của các giá trị mẫu được xác định bằng cách tính phương sai và độ lệch chuẩn của chúng.



Phương sai và căn bậc hai của phương sai, được gọi là độ lệch chuẩn, đặc trưng cho độ lệch trung bình so với giá trị trung bình của mẫu. Trong số hai đại lượng này giá trị cao nhất Nó có độ lệch chuẩn. Giá trị này có thể được biểu thị bằng khoảng cách trung bình mà tại đó các phần tử tính từ phần tử giữa của mẫu.

Sự phân tán rất khó để giải thích một cách có ý nghĩa. Tuy nhiên, căn bậc hai của giá trị này là độ lệch chuẩn và có lợi cho việc giải thích.

Độ lệch chuẩn được tính bằng cách xác định phương sai trước tiên và sau đó tính căn bậc hai của phương sai.

Ví dụ, đối với mảng dữ liệu được hiển thị trong hình, các giá trị sau:

Bức tranh 1

Ở đây, giá trị trung bình của các chênh lệch bình phương là 717,43. Để có được độ lệch chuẩn, chỉ cần lấy căn bậc hai của số này.

Kết quả sẽ là khoảng 26,78.

Cần nhớ rằng độ lệch chuẩn được hiểu là khoảng cách trung bình mà tại đó các phần tử tính từ giá trị trung bình của mẫu.

Độ lệch chuẩn cho thấy giá trị trung bình mô tả toàn bộ mẫu tốt như thế nào.

Giả sử bạn là trưởng bộ phận sản xuất lắp ráp PC. Báo cáo hàng quý cho biết sản lượng của quý trước là 2500 máy tính cá nhân. Nó xấu hay tốt? Bạn đã yêu cầu (hoặc đã có cột này trong báo cáo) để hiển thị độ lệch chuẩn cho dữ liệu này trong báo cáo. Ví dụ, con số độ lệch chuẩn là 2000. Với tư cách là trưởng bộ phận, bạn sẽ thấy rõ rằng dây chuyền sản xuất yêu cầu quản lý tốt hơn(sai lệch quá lớn về số lượng PC được lắp ráp).

Hãy nhớ: khi size lớn Nếu độ lệch chuẩn quá thấp, dữ liệu sẽ bị phân tán rộng rãi xung quanh giá trị trung bình và nếu độ lệch chuẩn thấp, chúng sẽ được nhóm lại gần với giá trị trung bình.

Bốn hàm thống kê VAR (), VAR (), STDEV () và STDEV () được thiết kế để tính toán phương sai và độ lệch chuẩn của các số trong một phạm vi ô. Trước khi tính toán phương sai và độ lệch chuẩn của một tập hợp dữ liệu, cần phải xác định xem dữ liệu đó đại diện cho tổng thể chung hay một mẫu của dân số. Trong trường hợp lấy mẫu từ tổng thể chung, các hàm VARP () và STDEV () nên được sử dụng và trong trường hợp tổng thể chung, các hàm VARP () và STDEV () nên được sử dụng:

Dân số Hàm số

VARP ()

STDLONG ()
Mẫu vật

VARI ()

STDEV ()

Độ phân tán (cũng như độ lệch chuẩn), như chúng tôi đã lưu ý, cho biết mức độ mà các giá trị bao gồm trong tập dữ liệu bị phân tán xung quanh giá trị trung bình số học.

Một giá trị nhỏ của phương sai hoặc độ lệch chuẩn cho biết rằng tất cả dữ liệu đều tập trung xung quanh giá trị trung bình số học và tầm quan trọng lớn các giá trị này - dữ liệu nằm rải rác trên nhiều giá trị.

Phương sai khá khó để giải thích một cách có ý nghĩa (giá trị nhỏ, giá trị lớn nghĩa là gì?). Màn biểu diễn Nhiệm vụ 3 sẽ cho phép bạn hiển thị trực quan trên biểu đồ ý nghĩa của phương sai đối với tập dữ liệu.

Nhiệm vụ

· Bài tập 1.

· 2.1. Đưa ra các khái niệm: phương sai và độ lệch chuẩn; ký hiệu tượng trưng của họ xử lý thống kê dữ liệu.

· 2.2. Vẽ trang tính phù hợp với Hình 1 và thực hiện các phép tính cần thiết.

· 2.3. Đưa ra các công thức cơ bản được sử dụng trong các phép tính

· 2.4. Giải thích tất cả các ký hiệu (,,)

· 2,5. giải thích giá trị thực tiễn các khái niệm về phương sai và độ lệch chuẩn.

Nhiệm vụ 2.

1.1. Đưa ra các khái niệm: tổng thể chung và mẫu; kỳ vọng toán học và trung bình cộng của ký hiệu tượng trưng của chúng trong xử lý dữ liệu thống kê.

1.2. Phù hợp với hình 2, vẽ một trang tính và thực hiện các phép tính.

1.3. Đưa ra các công thức cơ bản được sử dụng trong tính toán (đối với dân số chung và mẫu).

Hình 2

1.4. Giải thích tại sao có thể nhận được các giá trị trung bình cộng như vậy trong các mẫu 46,43 và 48,78 (xem tệp Phụ lục). Đi đến kết luận.

Nhiệm vụ 3.

Có hai mẫu với một bộ dữ liệu khác nhau, nhưng trung bình của chúng sẽ giống nhau:

Hình 3

3.1. Vẽ trang tính phù hợp với hình 3 và thực hiện các phép tính cần thiết.

3.2. Đưa ra các công thức tính toán cơ bản.

3.3. Xây dựng đồ thị phù hợp với hình 4, 5.

3.4. Giải thích các phụ thuộc kết quả.

3.5. Thực hiện các phép tính tương tự cho hai mẫu này.

Mẫu ban đầu 11119999

Chọn các giá trị của mẫu thứ hai sao cho trung bình cộng của mẫu thứ hai giống nhau, ví dụ:

Tự chọn các giá trị cho mẫu thứ hai. Sắp xếp các phép tính và vẽ biểu đồ như hình 3, 4, 5. Chỉ ra các công thức chính được sử dụng trong các phép tính.

Rút ra kết luận thích hợp.

Tất cả các nhiệm vụ nên được trình bày dưới dạng một báo cáo với tất cả các số liệu, đồ thị, công thức cần thiết và giải thích ngắn gọn.

Lưu ý: việc xây dựng đồ thị phải được giải thích bằng các số liệu và giải thích ngắn gọn.

Phạm vi biến đổi (hoặc phạm vi biến thể) - là sự khác biệt giữa giá trị tối đa và giá trị tối thiểu ký tên:

Trong ví dụ của chúng tôi, phạm vi biến động của sản lượng ca của công nhân là: ở lữ đoàn thứ nhất R = 105-95 = 10 con, ở lữ đoàn thứ hai R = 125-75 = 50 con. (Gấp 5 lần). Điều này cho thấy rằng sản lượng của lữ đoàn 1 “ổn định” hơn, nhưng lữ đoàn thứ hai có nhiều dự trữ hơn để tăng sản lượng, bởi vì. nếu tất cả công nhân đạt sản lượng tối đa cho lữ đoàn này, nó có thể sản xuất 3 * 125 = 375 bộ phận, và ở lữ đoàn 1 chỉ có 105 * 3 = 315 bộ phận.
Nếu một Giá trị cực đoan các tính trạng không phải là điển hình cho quần thể, sau đó các phạm vi phần tư hoặc phần thập phân được sử dụng. Phạm vi phần tư RQ = Q3-Q1 bao gồm 50% dân số, phạm vi phân tách đầu tiên RD1 = D9-D1 bao gồm 80% dữ liệu, phạm vi phân tách thứ hai RD2 = D8-D2 bao gồm 60%.
Nhược điểm của chỉ báo phạm vi biến đổi là, nhưng giá trị của nó không phản ánh tất cả các biến động của thuộc tính.
Chỉ số tổng quát đơn giản nhất phản ánh tất cả những biến động của một đặc điểm là có nghĩa là độ lệch tuyến tính, là trung bình cộng của độ lệch tuyệt đối của các tùy chọn riêng lẻ so với giá trị trung bình của chúng:

,
cho dữ liệu được nhóm
,
trong đó хi là giá trị của đối tượng trong loạt rời rạc hoặc giữa khoảng trong một phân phối khoảng.
Trong các công thức trên, sự khác biệt về tử số được tính theo môđun, nếu không, theo thuộc tính của trung bình cộng, tử số sẽ luôn bằng không. Do đó, độ lệch tuyến tính trung bình ít được sử dụng trong thực hành thống kê, chỉ trong trường hợp tổng hợp các chỉ tiêu mà không tính đến dấu kinh tế. Với sự trợ giúp của nó, ví dụ, thành phần của người lao động, lợi nhuận của sản xuất và kim ngạch ngoại thương được phân tích.
Phương sai của tính năng là bình phương trung bình của độ lệch của biến thể so với giá trị trung bình của chúng:
phương sai đơn giản
,
phương sai trọng số
.
Công thức tính phương sai có thể được đơn giản hóa:

Do đó, phương sai bằng hiệu giữa trung bình của các bình phương của biến thể và bình phương của trung bình của biến của tổng thể:
.
Tuy nhiên, do tổng các độ lệch bình phương, phương sai đưa ra một ý tưởng sai lệch về độ lệch, vì vậy giá trị trung bình được tính từ nó. độ lệch chuẩn, cho biết mức độ trung bình của các biến thể cụ thể của thuộc tính so với giá trị trung bình của chúng. Được tính bằng cách lấy căn bậc hai của phương sai:
cho dữ liệu chưa được phân nhóm
,
cho chuỗi biến thể

Thế nào ít giá trị hơnđộ phân tán và độ lệch chuẩn, dân số càng đồng nhất thì độ tin cậy (điển hình) càng cao. giá trị trung bình.
Trung bình tuyến tính và Trung bình độ lệch chuẩn- Các số được đặt tên, nghĩa là chúng được biểu thị bằng đơn vị đo của thuộc tính, giống nhau về nội dung và gần giống về ý nghĩa.
đếm chỉ số tuyệt đối các biến thể được khuyến nghị sử dụng bảng.
Bảng 3 - Tính toán các đặc điểm của sự thay đổi (trên ví dụ về thời kỳ dữ liệu về sản lượng ca của các nhóm công việc)


Số lượng công nhân

Điểm giữa khoảng thời gian,

Giá trị ước tính

Toàn bộ:

Sản lượng ca làm việc bình quân của công nhân:

Độ lệch tuyến tính trung bình:

Phân tán đầu ra:

Độ lệch chuẩn của sản lượng của từng công nhân so với sản lượng trung bình:
.

1 Tính toán độ phân tán theo phương pháp mômen

Việc tính toán phương sai được kết hợp với các phép tính phức tạp (đặc biệt nếu giá trị trung bình được biểu thị một số lượng lớn với nhiều chữ số thập phân). Các phép tính có thể được đơn giản hóa bằng cách sử dụng công thức đơn giản hóa và các thuộc tính phân tán.
Sự phân tán có các tính chất sau:

  1. nếu tất cả các giá trị của thuộc tính được giảm hoặc tăng theo cùng một giá trị A, thì phương sai sẽ không giảm từ điều này:

,

, sau đó hoặc
Sử dụng các tính chất của phương sai và trước tiên giảm tất cả các biến thể của tổng thể theo giá trị A, sau đó chia cho giá trị của khoảng h, chúng ta thu được công thức tính phương sai trong chuỗi biến thiên với ở những khoảng thời gian bằng nhau cách của khoảnh khắc:
,
đâu là độ phân tán được tính theo phương pháp mômen;
h là giá trị của khoảng thời gian của chuỗi biến thiên;
- giá trị biến thể mới (đã chuyển đổi);
NHƯNG- liên tục, được sử dụng làm khoảng giữa của khoảng có tần số cao nhất; hoặc một tùy chọn có tần số cao nhất;
là bình phương của thời điểm của bậc đầu tiên;
là một thời điểm của lệnh thứ hai.
Hãy tính phương sai theo phương pháp mô men dựa trên dữ liệu về sản lượng ca của đội làm việc.
Bảng 4 - Tính toán độ phân tán theo phương pháp mômen


Các nhóm công nhân sản xuất, chiếc.

Số lượng công nhân

Giữa khoảng

Giá trị ước tính

Quy trình tính toán:


  1. tính toán phương sai:

2 Tính toán phương sai của một đối tượng địa lý thay thế

Trong số những dấu hiệu được thống kê nghiên cứu, có những dấu hiệu chỉ mang hai ý nghĩa loại trừ lẫn nhau. Đây là những dấu hiệu thay thế. Họ được đưa ra hai giá trị định lượng: tùy chọn 1 và 0. Tần suất của tùy chọn 1, được ký hiệu là p, là tỷ lệ các đơn vị có một thuộc tính nhất định. Sự khác biệt 1-p = q là tần suất của các phương án 0. Do đó,


xi

Trung bình cộng của đối tượng địa lý thay thế
, vì p + q = 1.

Phương sai của tính năng
, tại vì 1-p = q
Do đó, phương sai của một đặc điểm thay thế bằng tích của tỷ lệ các đơn vị có đặc điểm đã cho và tỷ lệ các đơn vị không có đặc điểm đó.
Nếu các giá trị 1 và 0 có tần suất như nhau, tức là p = q, thì phương sai đạt cực đại pq = 0,25.
Phương sai tính năng thay thế được sử dụng trong khảo sát mẫu chẳng hạn như chất lượng sản phẩm.

3 Sự phân tán giữa các nhóm. Quy tắc cộng phương sai

Sự phân tán, không giống như các đặc điểm khác của sự biến đổi, là số lượng phụ gia. Tức là, trong tổng thể, được chia thành các nhóm theo tiêu chí yếu tố X , phương sai kết quả y có thể được phân tách thành phương sai trong mỗi nhóm (trong nhóm) và phương sai giữa các nhóm (giữa nhóm). Sau đó, cùng với việc nghiên cứu sự biến đổi của các tính trạng trong toàn bộ quần thể, có thể nghiên cứu sự biến động trong mỗi nhóm, cũng như giữa các nhóm này.

Tổng phương saiđo lường sự biến đổi của một tính trạng tại trên toàn bộ dân số dưới tác động của tất cả các yếu tố gây ra sự biến đổi (sai lệch) này. Nó bằng bình phương trung bình của độ lệch của các giá trị riêng lẻ của thuộc tính tại của giá trị trung bình tổng thể và có thể được tính dưới dạng phương sai đơn giản hoặc phương sai có trọng số.
Phương sai giữa các nhómđặc trưng cho sự thay đổi của tính năng hiệu quả tại, do ảnh hưởng của yếu tố dấu hiệu X cơ bản của nhóm. Nó đặc trưng cho sự biến thiên của trung bình của nhóm và bằng bình phương trung bình của độ lệch của nhóm có nghĩa là từ tổng trung bình:
,
trung bình cộng của nhóm thứ i ở đâu;
- số đơn vị trong nhóm thứ i (tần số của nhóm thứ i);
- chung dân số trung bình.
Phương sai nội nhóm phản ánh sự biến đổi ngẫu nhiên, tức là phần biến thể gây ra bởi ảnh hưởng của các yếu tố chưa được tính toán và không phụ thuộc vào yếu tố thuộc tính cơ bản của nhóm. Nó đặc trưng cho sự biến đổi giá trị cá nhân so với giá trị trung bình của nhóm, bằng bình phương trung bình của độ lệch của các giá trị riêng lẻ của thuộc tính tại trong một nhóm từ trung bình cộng của nhóm này (trung bình nhóm) và được tính như một phương sai đơn giản hoặc có trọng số cho mỗi nhóm:
hoặc ,
đâu là số đơn vị trong nhóm.
Dựa trên các phương sai nội bộ của mỗi nhóm, có thể xác định trung bình tổng thể của các phương sai trong nhóm:
.
Mối quan hệ giữa ba phương sai được gọi là quy tắc cộng phương sai, theo đó tổng phương sai bằng tổng phương sai giữa các nhóm và trung bình của các phương sai trong nhóm:

Ví dụ. Khi nghiên cứu ảnh hưởng của loại thuế quan (trình độ) của người lao động đến mức năng suất lao động của họ, người ta thu được các số liệu sau.
Bảng 5 - Phân bổ công nhân theo sản lượng trung bình hàng giờ.



p / p

Công nhân loại 4

Công nhân loại 5

Tập thể dục
công nhân, chiếc.,

Tập thể dục
công nhân, chiếc.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

TẠI ví dụ này người lao động được chia thành hai nhóm theo một tiêu chí yếu tố X- bằng cấp, được đặc trưng bởi cấp bậc của họ. Đặc điểm hiệu quả - sản xuất - thay đổi cả dưới ảnh hưởng của nó (biến đổi giữa các nhóm) và do các yếu tố ngẫu nhiên khác (biến đổi trong nhóm). Thách thức là đo lường các biến thể này bằng cách sử dụng ba phương sai: tổng, giữa nhóm và trong nhóm. Hệ số xác định theo kinh nghiệm cho thấy tỷ lệ biến thiên của đặc điểm kết quả tại dưới ảnh hưởng của một dấu hiệu nhân tố X. Phần còn lại của tổng biến thể tại gây ra bởi sự thay đổi của các yếu tố khác.
Trong ví dụ, hệ số xác định theo kinh nghiệm là:
hoặc 66,7%,
Điều này có nghĩa là 66,7% sự biến động năng suất lao động của người lao động là do chênh lệch về trình độ, và 33,3% là do ảnh hưởng của các yếu tố khác.
Mối quan hệ tương quan thực nghiệm cho thấy mối quan hệ chặt chẽ giữa các tính năng nhóm và hiệu quả. Nó được tính bằng căn bậc hai của hệ số xác định thực nghiệm:

Tỷ lệ tương quan thực nghiệm cũng có thể nhận các giá trị từ 0 đến 1.
Nếu không có kết nối, thì = 0. Trong trường hợp này, = 0, nghĩa là các nhóm bằng nhau và không có sự thay đổi giữa các nhóm. Điều này có nghĩa là dấu hiệu phân nhóm - yếu tố không ảnh hưởng đến sự hình thành của biến thể chung.
Nếu mối quan hệ là hàm thì = 1. Trong trường hợp này, phương sai của nhóm có nghĩa là tổng phương sai(), nghĩa là không có biến thể trong nhóm. Điều này có nghĩa là đặc điểm nhóm hoàn toàn xác định sự biến đổi của đối tượng địa lý kết quả đang được nghiên cứu.
Giá trị của tỷ lệ tương quan càng gần một thì càng gần, gần với sự phụ thuộc hàm, mối quan hệ giữa các đối tượng địa lý.
Để đánh giá định tính mức độ gần gũi của mối liên hệ giữa các dấu hiệu, các quan hệ Chaddock được sử dụng.

Trong ví dụ , cái chỉ ra rằng đóng kết nối giữa năng suất của người lao động và trình độ của họ.