Tiểu sử Đặc điểm Phân tích

Trung vị của dữ liệu mẫu. Xác định chế độ và trung vị bằng phương pháp đồ thị

Trung bình cấu trúc (vị trí)- đây là những giá trị trung bình chiếm một vị trí (vị trí) nhất định trong một chuỗi biến thể được xếp hạng.

Thời trang(Mo) là giá trị của đối tượng địa lý thường xuyên được tìm thấy nhất trong quần thể nghiên cứu.

chuỗi biến thể rời rạc thời trang sẽ là giá trị của các lựa chọn với tần số cao nhất

Thí dụ. Xác định chế độ từ dữ liệu có sẵn (Bảng 7.5).

Bảng 7.5 - Phân phối giày nữ được bán trong một cửa hàng giày N, Tháng 2 năm 2013

Theo Bảng. 5 cho thấy rằng tần số cao nhất fmax= 28, nó tương ứng với giá trị của đối tượng địa lý x= 37 kích thước. Do đó, Mo= 37 cỡ giày, tức là đó là kích thước giày này có nhu cầu lớn nhất, thường được mua giày cỡ 37 nhất.

TẠI xác định đầu tiên khoảng cách giữa các phương thức, I E. chứa chế độ - khoảng thời gian có tần số cao nhất (trong trường hợp phân phối khoảng thời gian với ở những khoảng thời gian bằng nhau, trong trường hợp các khoảng không bằng nhau - theo mật độ cao nhất).

Chế độ được coi là khoảng giữa của khoảng phương thức. Giá trị chế độ cụ thể cho chuỗi khoảng thời gian được xác định theo công thức:

ở đâu x Mo là giới hạn dưới của khoảng phương thức;

tôi Mo là giá trị của khoảng phương thức;

fMo là tần số của khoảng phương thức;

fMo-1 là tần số của khoảng trước phương thức;

f Mo +1 là tần số của khoảng thời gian tuân theo phương thức.

Thí dụ. Xác định chế độ từ dữ liệu có sẵn (Bảng 7.6).

Bảng 7.6 - Phân bổ nhân viên theo thời gian phục vụ

Theo Bảng. 6 cho thấy rằng tần số cao nhất fmax= 35, nó tương ứng với khoảng thời gian: 6-8 năm (khoảng phương thức). Chúng tôi định nghĩa thời trang theo công thức:

nhiều năm.

Do đó, Mo= 6,8 năm, tức là Hầu hết nhân viên có 6,8 năm kinh nghiệm.

Tên của đường trung bình được lấy từ hình học, trong đó nó dùng để chỉ đoạn nối một trong các đỉnh của tam giác với trung tuyến phía đối diện và chia cạnh của tam giác thành hai phần bằng nhau.

Trung bình(Tôi) là giá trị của đối tượng địa lý nằm ở giữa tập hợp dao động. Mặt khác, giá trị trung bình là giá trị chia số lượng của một chuỗi biến thể có thứ tự thành hai phần bằng nhau - một phần có giá trị của thuộc tính thay đổi nhỏ hơn biến thể trung bình và phần kia có giá trị lớn.

loạt xếp hạng(tức là đã đặt hàng - tích hợp sẵn thứ tự tăng dần hoặc giảm dần giá trị cá nhân ký tên) với một số lẻ thành viên ( n = lẻ) trung vị là biến thể nằm ở trung tâm của hàng. Số thứ tự của trung vị ( N Tôi) được định nghĩa như sau:

N Tôi = (n+1)/ 2.

Thí dụ. Trong dãy 51 thành viên, số trung vị là (51 + 1) / 2 = 26, tức là trung vị là tùy chọn thứ 26 trong chuỗi.

Đối với một chuỗi được xếp hạng có số lượng thành viên chẵn ( n = chẵn) - trung vị sẽ là trung bình cộng của hai giá trị của thuộc tính nằm ở giữa hàng. Số sê-ri của hai biến thể trung tâm được xác định như sau:

N Tôi 1 = n / 2; N Tôi 2 = (n / 2)+ 1.

Thí dụ. Khi n = 50; N Me1 = 50/2 = 25; N Me2= (50/2) +1 = 26, tức là trung vị là giá trị trung bình của các tùy chọn ở hàng thứ 25 và 26 theo thứ tự.

TẠI rời rạc loạt biến thể trung vị được tìm thấy bằng tần số tích lũy tương ứng với số thứ tự của trung vị hoặc vượt quá tần số đó lần đầu tiên. Nếu không, theo tần số tích lũy bằng hoặc lần đầu tiên vượt quá một nửa tổng tất cả các tần số của chuỗi.

Thí dụ. Xác định giá trị trung bình từ dữ liệu có sẵn (Bảng 7.7).

Bảng 7.7 - Phân phối giày nữ bán trong một cửa hàng giày N, Tháng 2 năm 2013

Theo Bảng. 7 xác định số seri trung gian: N Tôi = ( 67+1)/2=34.

Thời trang. Trung bình. Cách tính toán chúng (trang 1/2)

Tần suất tích lũy vượt quá giá trị này lần đầu tiên S= 41, nó tương ứng với giá trị của đối tượng địa lý x= 37 kích thước. Do đó, Tôi= 37 cỡ giày, tức là một nửa số đôi được mua nhỏ hơn cỡ 37, và nửa còn lại được mua lớn hơn.

Trong ví dụ này, chế độ và giá trị trung bình giống nhau, nhưng chúng có thể giống nhau hoặc không.

TẠI chuỗi biến thiên khoảng thời gian tần số tích lũy được xác định, theo dữ liệu tần số tích lũy được tìm thấy khoảng trung bình- khoảng thời gian mà tần số tích lũy bằng một nửa hoặc lần đầu tiên vượt quá một nửa tổng số tần số. Công thức xác định giá trị trung bình trong chuỗi khoảng thời gian của phân phối có lần xem tiếp theo:

.

ở đâu x Tôi là giới hạn dưới của khoảng trung vị;

tôi tôi là giá trị của khoảng trung vị;

fi là tổng các tần số của chuỗi;

S Tôi-1 là tổng các tần số tích lũy của khoảng trước trung vị;

f Tôi là tần số của khoảng trung vị.

Thí dụ. Xác định giá trị trung vị từ dữ liệu có sẵn (Bảng 7.8).

Bảng 7.8 - Phân bổ nhân viên theo thời gian phục vụ

Theo Bảng. 8 xác định số thứ tự của trung vị: NMe = 100/ 2 = 50. Tần suất tích lũy vượt quá giá trị này lần đầu tiên S= 82, nó tương ứng với khoảng thời gian 6-8 năm (khoảng thời gian trung vị). Trong ví dụ này, khoảng phương thức và khoảng trung vị giống nhau, nhưng chúng có thể giống nhau hoặc không. Hãy xác định giá trị trung bình theo công thức:

năm

Do đó, Tôi= 6,2 năm, tức là một nửa số nhân viên có ít hơn 6,2 năm kinh nghiệm và nửa còn lại có nhiều hơn.

Chế độ và trung vị được sử dụng rộng rãi trong các lĩnh vực khác nhau của nền kinh tế. Như vậy, việc tính toán năng suất lao động theo phương thức, chi phí phương thức, v.v. cho phép nhà kinh tế đánh giá mức độ phổ biến hiện tại của chúng. Đặc điểm này nên được sử dụng để tiết lộ mức dự trữ của nền kinh tế của chúng ta. Vấn đề thời trang để giải quyết các vấn đề thực tế. Vì vậy, khi lập kế hoạch sản xuất hàng loạt quần áo và giày dép, kích thước của sản phẩm được thiết lập, nhu cầu lớn nhất (kích thước phương thức). Chế độ này có thể được sử dụng như một đặc tính gần đúng của mức độ của đặc điểm được nghiên cứu thay vì giá trị trung bình số học nếu phân bố tần số gần đối xứng và có một đỉnh không phẳng.

Giá trị trung bình nên được sử dụng làm giá trị trung bình trong các trường hợp không đủ tin cậy về tính đồng nhất của dân số đang nghiên cứu. Trung vị bị ảnh hưởng không quá nhiều bởi bản thân các giá trị cũng như số trường hợp ở cấp độ này hay cấp độ khác. Cũng cần lưu ý rằng giá trị trung bình luôn cụ thể (đối với một số lượng lớn các quan sát hoặc trong trường hợp một số thành viên lẻ của quần thể), bởi vì Dưới Tôi một phần tử thực thực tế nào đó của tổng thể được ngụ ý, trong khi giá trị trung bình số học thường nhận một giá trị mà không đơn vị nào của tổng thể có thể nhận được.

Tài sản chính Tôi trong đó tổng độ lệch tuyệt đối của các giá trị tính trạng từ giá trị trung bình nhỏ hơn bất kỳ giá trị nào khác: . Tài sản này Tôi có thể được sử dụng, ví dụ, khi xác định vị trí xây dựng của các tòa nhà công cộng, vì Tôi xác định điểm có khoảng cách nhỏ nhất, ví dụ như trường mầm non từ nơi ở của cha mẹ, người dân địa phương từ rạp chiếu phim, khi thiết kế trạm dừng xe điện và xe điện, v.v.

Trong hệ thống các chỉ số cơ cấu, các phương án chiếm một vị trí nhất định trong chuỗi biến thể được xếp hạng (hàng thứ tư, thứ năm, thứ mười, thứ hai mươi lăm, v.v.) đóng vai trò là chỉ số đánh giá các đặc điểm của hình thức phân phối. Tương tự, với việc tìm giá trị trung bình trong chuỗi biến phân, bạn có thể tìm giá trị của đối tượng cho bất kỳ đơn vị nào của chuỗi được xếp hạng theo thứ tự.

Tứ phân vị- các giá trị thuộc tính chia dân số phạm vi thành bốn phần bằng nhau. Phân biệt phần tư thấp hơn ( Q1), trung bình ( Quý 2) và trên ( Q 3). Phần tư phía dưới phân tách 1/4 dân số có giá trị thấp nhất của thuộc tính, phần tư phía trên phân tách 1/4 dân số bằng giá trị cao nhất dấu hiệu. Điều này có nghĩa là 25% đơn vị dân số sẽ có giá trị nhỏ hơn Q1; 25% đơn vị sẽ được kết thúc giữa Q1Quý 2; 25% - giữa Quý 2Q 3; 25% còn lại hoạt động tốt hơn Q 3. Phần tư giữa ( Quý 2) là trung vị .

Để tính toán phần tư cho chuỗi khoảng thời gian, các công thức sau được sử dụng:

;

.

ở đâu xQ1- giới hạn dưới của khoảng có chứa phần tư thấp hơn (khoảng được xác định theo tần suất tích lũy, lần đầu tiên vượt quá 25%);

x Q3- giới hạn dưới của khoảng có chứa phần tư trên (khoảng được xác định bởi tần suất tích lũy, lần đầu tiên vượt quá 75%);

S Q 1-1 là tần số tích lũy của khoảng trước khoảng chứa phần tư thấp hơn;

S Q 3-1 là tần số tích lũy của khoảng trước khoảng chứa phần tư trên;

fQ1 là tần số của khoảng chứa phần tư thấp hơn;

fQ3 là tần số của khoảng chứa phần tư trên.

Deciles là các giá trị biến thể chia chuỗi được xếp hạng cho mười các phần bằng nhau: Decile thứ nhất ( d1) chia dân số 1/10 thành 9/10, phân vị thứ 2 ( d2) - theo tỷ lệ 2/10 đến 8/10, v.v. Các phân vị được tính theo cùng một cách với trung vị và tứ phân vị:

;

.

Việc sử dụng các đặc điểm trên trong phân tích chuỗi phân bố biến thiên cho phép người ta mô tả sâu sắc và chi tiết các đặc điểm của quần thể đang nghiên cứu.

XEM THÊM:

Trung bình cấu trúc

Cùng với các phương tiện sức mạnh sử dụng rộng rãi trung bình cơ cấu đã nhận.

Cấu trúc của các tổng hợp thống kê là khác nhau. Đồng thời, sự phân bố các đơn vị của quần thể càng đối xứng thì thành phần của nó càng có chất lượng theo tính trạng được nghiên cứu thì giá trị trung bình của tính trạng đó càng tốt, càng chắc chắn càng đặc trưng cho hiện tượng được nghiên cứu. Nhưng đối với các trường hợp lệch nhọn (không đối xứng) của chuỗi phân phối, giá trị trung bình số học không còn điển hình nữa. Ví dụ, kích thước trung bình tiền gửi trong các ngân hàng tiết kiệm không được quan tâm đặc biệt, vì phần lớn các khoản tiền gửi dưới mức này và mức trung bình bị ảnh hưởng đáng kể bởi các khoản tiền gửi lớn, ít và không phải là điển hình cho số lượng tiền gửi lớn.

Thời trang (thống kê)

Trong những trường hợp như vậy, thống kê sử dụng một hệ thống khác - hệ thống trung bình cấu trúc phụ trợ. Chúng bao gồm chế độ, trung vị, cũng như tứ, ngũ phân vị, decels, phần trăm.

Thời trang (Mo)- giá trị chung nhất của đặc điểm và trong một chuỗi biến thể rời rạc - đây là biến thể có tần số cao nhất.

Trong thực hành thống kê, thời trang được sử dụng trong nghiên cứu thu nhập của dân cư, nhu cầu tiêu dùng, đăng ký giá cả và phân tích một số chỉ tiêu kinh tế kỹ thuật của doanh nghiệp.

TẠI trường hợp cá nhân nó là phương thức quan tâm, không phải trung bình số học. Đôi khi nó được sử dụng thay cho giá trị trung bình số học, chẳng hạn, để mô tả cấu trúc của chuỗi phân phối.

Thứ tự mà chế độ được xác định phụ thuộc vào loại chuỗi phân phối. Nếu thuộc tính biến được trình bày dưới dạng một chuỗi rời rạc, thì không cần tính toán để xác định chế độ. Trong một chuỗi như vậy, chế độ sẽ là giá trị của đối tượng địa lý có tần số cao nhất.

Nếu giá trị của thuộc tính được trình bày dưới dạng chuỗi biến thiên khoảng thời gian với các khoảng thời gian bằng nhau, thì chế độ được xác định bằng cách tính toán sử dụng công thức:

ở đâu X Mo là giới hạn dưới của khoảng phương thức,

tôi Mo là giá trị của khoảng phương thức,

f Mo , f Mo-1 , f Mo + 1 lần lượt là tần số của các khoảng phương thức, tiền phương thức (trước) và hậu phương thức (sau phương thức).

Trung vị (Tôi) là giá trị của đặc điểm, nằm ở giữa chuỗi biến thể phạm vi, trong đó giá trị cá nhân các tính năng (tùy chọn) được sắp xếp theo thứ tự tăng dần hoặc giảm dần (theo thứ hạng).

Giá trị trung bình nên được sử dụng làm giá trị trung bình trong các trường hợp không đủ tin cậy về tính đồng nhất của dân số đang nghiên cứu. Trung bình tìm thấy ứng dụng trong các hoạt động tiếp thị. Ví dụ, vị trí của thang máy, nhà máy rượu chính, nhà máy đóng hộp, tổng khoảng cách từ các nhà cung cấp nguyên liệu thô phải là nhỏ nhất.

Trung bình, giống như chế độ, được xác định theo những cách khác nhau. Nó phụ thuộc vào cấu trúc của chuỗi phân phối.
Để xác định giá trị trung bình trong chuỗi biến phân rời rạc:

1) tìm số sê-ri của nó bằng công thức

N Tôi =
2) xây dựng một loạt các tần số tích lũy

3) tìm tần số tích lũy, bằng hoặc vượt quá số thứ tự của trung vị

4) của biến thể tương ứng với tần số tích lũy đã cho là giá trị trung vị.

Nếu số phần tử của một dãy rời rạc là số lẻ thì trung vị ở giữa dãy và chia dãy này thành hai phần bằng nhau theo số phần tử của dãy. Số thứ tự của trung vị trong trường hợp này được tính theo công thức:

NMe = (f + 1) 2,

ở đâu f số lượng thành viên của chuỗi.

Trong chuỗi khoảng thời gian, khoảng thời gian trung vị được xác định đầu tiên. Đối với điều này, cũng như trong hàng rời rạc, tính số thứ tự của trung vị. Tần số tích lũy, bằng số trung vị hoặc tần số đầu tiên vượt quá tần số đó, tương ứng với khoảng trung vị trong chuỗi biến thiên khoảng. Hãy biểu thị tần số tích lũy này là S Me. Giá trị trung bình được tính trực tiếp bằng công thức:

,
đâu là giới hạn dưới của khoảng trung bình

- giá trị của khoảng trung bình

là tần số tích lũy của khoảng thời gian trước trung vị

- tần số của khoảng thời gian trung vị

Định nghĩa đồ họa của chế độ và trung vị
Chế độ và trung vị trong một chuỗi khoảng thời gian có thể được xác định bằng đồ thị.

Chế độ được xác định từ biểu đồ của phân phối. Đối với điều này, hình chữ nhật cao nhất được chọn, trong trường hợp này phương thức. Sau đó, chúng tôi kết nối đỉnh bên phải của hình chữ nhật phương thức với bên phải góc trên cùng hình chữ nhật trước đó. Và đỉnh bên trái của hình chữ nhật phương thức nằm với góc trên bên trái của hình chữ nhật tiếp theo. Hơn nữa, từ giao điểm của chúng, một đường vuông góc được hạ xuống trục abscissa. Cơ số của giao điểm của các đường này sẽ là chế độ phân phối (Hình 1). Trung vị được tính từ tích lũy (Hình 2). Để xác định nó, từ một điểm trên thang tần số tích lũy (tần số) tương ứng với 50%, một đường thẳng được vẽ song song với trục abscissa cho đến khi nó giao với tích lũy. Sau đó, từ giao điểm của đường thẳng xác định với tích lũy, một đường vuông góc được hạ xuống trục abscissa. Cơ sở của giao điểm là trung tuyến.

Các chỉ tiêu về sự biến động trong số liệu thống kê.

Trong quá trình Phân tích thống kê một tình huống có thể nảy sinh khi các giá trị của các giá trị trung bình trùng nhau và các quần thể trên cơ sở đó được tính toán bao gồm các đơn vị có giá trị đặc trưng khác nhau khá rõ rệt. Trong trường hợp này, các chỉ số của sự thay đổi được tính toán.

Mục lục: tải xuống -> Sotrudniki
tải xuống -> N. L. Ivanova M. F. Lukanina
download -> Bài giảng dành cho chuyên gia mầm non và phụ huynh "Phòng chống hành vi hung hăng trẻ mẫu giáo "
tải xuống -> Tâm lý thích ứng chuyên nghiệp tính cách
tải xuống -> Bộ Giáo dục và Khoa học Vùng Kemerovo Trung tâm Cổ sinh và Tâm lý Khu vực Kemerovo
tải xuống -> dịch vụ liên bang Cơ quan Kiểm soát Ma túy Liên bang Nga đối với Vùng Kemerovo
Sotrudniki -> Cung Cộng hòa Chuvash spo "chetk" của Bộ Giáo dục Chuvashia
lượt tải xuống -> Tính năng hỗ trợ tâm lý và sư phạm cho sự phát triển của trẻ mầm non
tải xuống -> Mishina M. M. Sự phát triển tư duy phụ thuộc vào việc tham gia vào các mối quan hệ gia đình, dòng tộc
Sotrudniki -> Hình thành phẩm chất nghề nghiệp quan trọng ở học sinh khuyết tật trí tuệ theo nghề

KIỂM TRA

Về chủ đề: "Chế độ. Trung vị. Phương pháp tính toán chúng"

Giới thiệu

Giá trị trung bình và các chỉ số biến thiên liên quan đóng một vai trò rất quan trọng trong thống kê, điều này là do đối tượng nghiên cứu của nó. Đó là lý do tại sao chủ đề này là một trong những trọng tâm của khóa học.

Giá trị trung bình là một chỉ tiêu khái quát rất phổ biến trong thống kê. Điều này được giải thích bởi thực tế là chỉ với sự trợ giúp của giá trị trung bình, người ta mới có thể mô tả đặc điểm của quần thể theo một thuộc tính thay đổi về mặt định lượng. Giá trị trung bình trong thống kê, một đặc tính tổng quát của một tập hợp các hiện tượng giống nhau theo một số đặc tính khác nhau về mặt định lượng được gọi là. Giá trị trung bình cho thấy mức độ của thuộc tính này, liên quan đến đơn vị dân số.

Nghiên cứu các hiện tượng xã hội và cố gắng xác định đặc điểm của chúng, các tính năng điển hình trong các điều kiện cụ thể về địa điểm và thời gian, các nhà thống kê sử dụng rộng rãi các giá trị trung bình. Với sự trợ giúp của giá trị trung bình, các quần thể khác nhau có thể được so sánh với nhau theo các đặc điểm khác nhau.

Giá trị trung bình được sử dụng trong thống kê thuộc loại trung bình công suất. Trong số các trung bình công suất, trung bình số học thường được sử dụng nhất, ít thường xuyên hơn trung bình hài; giá trị trung bình hài chỉ được sử dụng khi tính toán tốc độ trung bình của động lực học và bình phương trung bình - chỉ khi tính toán các chỉ số biến thiên.

Trung bình cộng là thương số của phép chia tổng các lựa chọn cho số của chúng. Nó được sử dụng trong trường hợp khối lượng của một thuộc tính biến cho toàn bộ tập hợp được hình thành dưới dạng tổng các giá trị thuộc tính cho các đơn vị riêng lẻ của nó. Trung bình cộng là loại trung bình phổ biến nhất, vì nó tương ứng với bản chất của các hiện tượng xã hội, trong đó khối lượng các dấu hiệu khác nhau trong tổng thể thường được hình thành chính xác bằng tổng các giá trị của thuộc tính trong các đơn vị riêng lẻ của dân số.

Theo thuộc tính xác định của nó, giá trị trung bình hài nên được sử dụng khi tổng khối lượng của đối tượng địa lý được hình thành dưới dạng tổng giá trị tương hỗ quyền mua. Nó được sử dụng khi, tùy thuộc vào vật liệu có sẵn, trọng lượng không cần phải nhân mà được chia thành các tùy chọn hoặc bằng giá trị nghịch đảo của chúng. Giá trị trung bình điều hòa trong những trường hợp này là nghịch đảo của giá trị trung bình cộng của các giá trị tương hỗ của thuộc tính.

Giá trị trung bình hài nên được sử dụng trong những trường hợp đó khi các trọng số không phải là đơn vị của tổng thể - các sóng mang của đối tượng địa lý, mà là sản phẩm của các đơn vị này và giá trị của đối tượng địa lý.

1. Định nghĩa chế độ và trung vị trong thống kê

Trung bình cộng và trung bình điều hòa là những đặc trưng tổng hợp của quần thể theo một thuộc tính biến đổi này hay khác nhau. Các đặc điểm mô tả phụ trợ của việc phân phối một thuộc tính biến là chế độ và giá trị trung vị.

Trong thống kê, thời trang là giá trị của một đặc điểm (biến thể) thường được tìm thấy nhất trong một quần thể nhất định. Trong chuỗi biến thể, đây sẽ là biến thể có tần suất xuất hiện cao nhất.

Giá trị trung bình trong thống kê được gọi là biến thể, nằm ở giữa chuỗi biến thể. Đường trung bình chia dãy thành một nửa, trên cả hai mặt của nó (lên và xuống) có cùng một số đơn vị dân số.

Chế độ và trung vị, trái ngược với trung bình hàm mũ, là các đặc điểm cụ thể, giá trị của chúng là bất kỳ biến thể cụ thể nào trong chuỗi biến thể.

Chế độ được sử dụng trong các trường hợp cần mô tả giá trị xuất hiện thường xuyên nhất của một đối tượng địa lý.

5.5 Chế độ và trung vị. Tính toán của chúng trong chuỗi biến thiên khoảng và rời rạc

Ví dụ: nếu bạn cần để tìm ra kích thước phổ biến nhất tiền công tại doanh nghiệp, giá thị trường mà nó đã được bán số lớn nhất hàng hóa, cỡ giày được người tiêu dùng yêu cầu nhiều nhất, v.v., trong những trường hợp này, phải dùng đến thời trang.

Giá trị trung bình thú vị ở chỗ nó cho thấy giới hạn định lượng của giá trị của đặc tính biến, đã đạt được bởi một nửa số thành viên của tổng thể. Hãy để mức lương trung bình của nhân viên ngân hàng lên tới 650.000 rúp. mỗi tháng. Đặc điểm này có thể được bổ sung nếu chúng ta nói rằng một nửa số công nhân nhận được mức lương 700.000 rúp. và cao hơn, tức là chúng ta hãy lấy trung vị. Phương thức và trung vị là những đặc điểm điển hình trong trường hợp các quần thể là đồng nhất và có số lượng lớn.

Tìm Chế độ và Trung vị trong Chuỗi Biến thể Rời rạc

Tìm chế độ và giá trị trung vị trong một chuỗi biến phân, trong đó các giá trị thuộc tính được cho bởi các số nhất định, không khó lắm. Hãy xem xét bảng 1. với sự phân bố của các gia đình theo số trẻ em.

Bảng 1. Phân bố số gia đình theo số con

Rõ ràng, trong ví dụ này, thời trang sẽ là thời trang dành cho gia đình có hai trẻ em, vì giá trị tùy chọn này tương ứng với số lượng lớn nhất các gia đình. Có thể có những bản phân phối mà ở đó tất cả các biến thể đều có tần suất như nhau, trong trường hợp đó thì không có tính thời trang, hay nói cách khác, tất cả các biến thể có thể được coi là phương thức như nhau. Trong các trường hợp khác, không phải một mà là hai tùy chọn có thể là tần suất cao nhất. Sau đó, sẽ có hai chế độ, phân phối sẽ là hai phương thức. Sự phân bố hai chân có thể chỉ ra sự không đồng nhất về chất của quần thể theo tính trạng đang nghiên cứu.

Để tìm giá trị trung bình trong một chuỗi biến thể rời rạc, bạn cần chia tổng các tần số làm đôi và thêm ½ vào kết quả. Vì vậy, trong phân phối 185 gia đình theo số trẻ em, trung vị sẽ là: 185/2 + ½ = 93, tức là Tùy chọn thứ 93, chia hàng đã sắp xếp thành một nửa. Ý nghĩa của tùy chọn thứ 93 là gì? Để tìm ra, bạn cần phải tích lũy tần số, bắt đầu từ các tùy chọn nhỏ nhất. Tổng tần số của phương án thứ nhất và thứ hai là 40. Rõ ràng là không có phương án 93 nào ở đây. Nếu chúng ta thêm tần suất của tùy chọn thứ 3 vào 40, thì chúng ta nhận được tổng bằng 40 + 75 = 115. Do đó, tùy chọn thứ 93 tương ứng với giá trị thứ ba của thuộc tính biến và trung vị sẽ là một gia đình có hai con. .

Chế độ và trung vị trong ví dụ này phù hợp. Nếu chúng ta có tổng các tần số chẵn (ví dụ: 184), thì áp dụng công thức trên, chúng ta nhận được số các tùy chọn trung vị, 184/2 + ½ = 92,5. Vì không có tùy chọn phân số, kết quả chỉ ra rằng trung vị nằm giữa 92 và 93 tùy chọn.

3. Tính toán chế độ và trung vị trong chuỗi biến thiên khoảng thời gian

Bản chất mô tả của chế độ và trung vị là do thực tế là chúng không bù đắp cho các sai lệch cá nhân. Họ luôn luôn phù hợp biến thể nhất định. Do đó, chế độ và giá trị trung vị không yêu cầu tính toán để tìm chúng nếu tất cả các giá trị của thuộc tính đã biết. Tuy nhiên, trong chuỗi biến thiên theo khoảng, các phép tính được sử dụng để tìm giá trị gần đúng của chế độ và giá trị trung vị trong một khoảng nhất định.

Để tính toán giá trị nhất định của giá trị phương thức của thuộc tính nằm trong khoảng thời gian, công thức sau được sử dụng:

M o \ u003d X Mo + i Mo * (f Mo - f Mo-1) / ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

Trong đó X Mo là giới hạn nhỏ nhất của khoảng phương thức;

i Mo là giá trị của khoảng phương thức;

fMo là tần số của khoảng phương thức;

f Mo-1 - tần số của khoảng trước phương thức;

f Mo + 1 là tần số của khoảng thời gian tuân theo phương thức.

Chúng tôi sẽ hiển thị tính toán của chế độ bằng cách sử dụng ví dụ được đưa ra trong Bảng 2.

Bảng 2. Phân bố công nhân của xí nghiệp theo việc thực hiện các tiêu chuẩn sản xuất

Để tìm phương thức, trước tiên chúng ta xác định khoảng phương thức của chuỗi đã cho. Có thể thấy từ ví dụ rằng tần số cao nhất tương ứng với khoảng mà biến thể nằm trong khoảng từ 100 đến 105. Đây là khoảng phương thức. Giá trị của khoảng phương thức là 5.

Thay thế Giá trị kiểu số từ bảng 2. vào công thức trên, ta nhận được:

M o \ u003d 100 + 5 * (104-12) / ((104 - 12) + (104 - 98)) \ u003d 108,8

Ý nghĩa của công thức này như sau: giá trị của phần đó của khoảng phương thức, phải được thêm vào ranh giới nhỏ nhất của nó, được xác định tùy thuộc vào độ lớn của tần số của khoảng trước và sau đó. Trong trường hợp này, chúng tôi thêm 8,8 thành 100, tức là hơn một nửa khoảng thời gian, vì tần số của khoảng trước nhỏ hơn tần số của khoảng sau.

Hãy tính số trung vị bây giờ. Để tìm trung vị trong chuỗi biến thiên khoảng, trước tiên chúng ta xác định khoảng mà nó nằm (khoảng trung vị). Khoảng thời gian như vậy sẽ là khoảng thời gian có tần số tích lũy bằng hoặc lớn hơn một nửa tổng các tần số. Các tần số tích lũy được hình thành bằng cách tổng hợp dần dần các tần số, bắt đầu từ khoảng thời gian từ giá trị nhỏ nhất dấu hiệu. Một nửa tổng các tần số chúng ta có là 250 (500: 2). Do đó, theo bảng 3. khoảng trung vị sẽ là khoảng có giá trị tiền lương từ 350.000 rúp. lên đến 400.000 rúp.

Bảng 3. Tính số trung vị trong chuỗi biến thiên khoảng

Trước khoảng thời gian này, tổng các tần số tích lũy là 160. Vì vậy, để có được giá trị của trung vị, cần phải thêm 90 đơn vị khác (250 - 160).

Khi xác định giá trị của trung vị, giả thiết rằng giá trị của các đơn vị trong các ranh giới của khoảng được phân phối đồng đều. Do đó, nếu 115 đơn vị trong khoảng này được phân phối đều trong một khoảng bằng 50, thì 90 đơn vị sẽ tương ứng với giá trị sau:

Thời trang trong thống kê

Trung vị (thống kê)

Trung vị (thống kê), Trong thống kê toán học- một số đặc trưng cho mẫu (ví dụ, một tập hợp các số). Nếu tất cả các phần tử trong mẫu khác nhau, thì trung vị là số của mẫu sao cho đúng một nửa số phần tử trong mẫu lớn hơn nó và nửa còn lại nhỏ hơn nó.

Trong nhiều hơn nữa trường hợp chung Giá trị trung bình có thể được tìm thấy bằng cách sắp xếp các phần tử của mẫu theo thứ tự tăng dần hoặc giảm dần và lấy phần tử ở giữa. Ví dụ: mẫu (11, 9, 3, 5, 5) sau khi sắp xếp thứ tự chuyển thành (3, 5, 5, 9, 11) và trung vị của nó là số 5. ​​Nếu mẫu có số phần tử chẵn thì trung vị có thể không được xác định duy nhất: đối với dữ liệu số, nửa tổng của hai giá trị liền kề thường được sử dụng nhất (nghĩa là trung vị của tập hợp (1, 3, 5, 7) được lấy bằng 4).

Nói cách khác, giá trị trung bình trong thống kê là giá trị chia chuỗi thành một nửa theo cách mà ở cả hai phía của nó (lên hoặc xuống) Cùng một sốđơn vị của dân số này. Do tính chất này, chỉ số này có một số tên khác: phân vị thứ 50 hoặc phân vị 0,5.

Giá trị trung bình được sử dụng thay cho giá trị trung bình số học khi các biến thể cực trị của chuỗi được xếp hạng (nhỏ nhất và lớn nhất) so với phần còn lại trở nên quá lớn hoặc quá nhỏ.

Hàm MEDIAN đo xu hướng trung tâm, là trung tâm của một bộ số trong phân phối thống kê. Có ba cách phổ biến nhất để xác định xu hướng trung tâm:

  • Bần tiện- trung bình cộng, được tính bằng cách cộng một tập hợp các số, sau đó chia tổng thu được cho số của chúng.
    Ví dụ, trung bình cộng của các số 2, 3, 3, 5, 7 và 10 là 5, là kết quả của phép chia tổng của chúng, được 30, cho số của chúng, được 6.
  • Trung bình- một số là trung vị của một tập hợp các số: một nửa số có giá trị lớn hơn trung vị và một nửa số nhỏ hơn.
    Ví dụ, trung vị của các số 2, 3, 3, 5, 7 và 10 là 4.
  • Thời trang là con số xảy ra thường xuyên nhất trong bộ đã cho những con số.

    Ví dụ, chế độ cho các số 2, 3, 3, 5, 7 và 10 là 3.

Để đặc trưng cho chuỗi phân phối (cấu trúc của chuỗi biến thiên), cùng với giá trị trung bình, cái gọi là. trung bình cấu trúc: thời trangTrung bình. Chế độ và trung vị được sử dụng phổ biến nhất trong thực tế kinh tế.

Thời trang- biến thể thường được tìm thấy nhất trong chuỗi phân bố (trong quần thể này).

TẠI rời rạc trong chuỗi biến phân, chế độ được xác định bởi tần số cao nhất. Giả sử rằng hàng hóa A được bán tại thành phố bởi 9 công ty với giá sau đây tính bằng rúp:

44; 43; 44; 45; 43; 46; 42; 46, 43. Vì giá phổ biến nhất là 43 rúp, nó sẽ là phương thức.

Khi mô tả đặc điểm nhóm xã hội dân số theo mức thu nhập nên sử dụng giá trị phương thức hơn là giá trị trung bình. Mức trung bình sẽ đánh giá thấp một số chỉ số và đánh giá quá cao những chỉ số khác - do đó tính trung bình (bằng nhau) thu nhập của tất cả các bộ phận dân số.

TẠI khoảng thời gian trong chuỗi biến phân, chế độ được xác định gần đúng bằng công thức:

    ХМ0 - giới hạn dưới của khoảng phương thức;

    h Mo - giá trị (bước, độ rộng) của khoảng phương thức;

    f 1 - tần số cục bộ của khoảng trước phương thức;

    f 2 - tần số cục bộ của khoảng phương thức;

    f 3 - tần số cục bộ của khoảng thời gian tuân theo phương thức.

Phân bố dân cư theo mức thu nhập bình quân đầu người hàng tháng

Khoảng 1000-3000 trong phân phối này sẽ là phương thức, bởi vì nó có tần số cao nhất (f = 35,5). Sau đó, theo công thức trên, chế độ sẽ bằng:

Trên biểu đồ (biểu đồ phân bố), chế độ được xác định như sau: tần số cục bộ được vẽ dọc theo trục y và các khoảng hoặc tâm khoảng được vẽ dọc theo abscissa. Thanh cao nhất được chọn, tương ứng với giá trị của đối tượng có tần suất cao nhất trong chuỗi phân phối.

Thời trang dùng để giải quyết một số vấn đề thực tế. Vì vậy, ví dụ, khi nghiên cứu doanh thu của thị trường, phương thức giá được lấy, để nghiên cứu nhu cầu về giày dép, quần áo, kích thước phương thức của giày dép và quần áo được sử dụng.

Trung bình- Đây là giá trị số của tính trạng cho đơn vị của quần thể nằm ở giữa dãy được xếp hạng (được xây dựng theo thứ tự tăng dần hoặc giảm dần của các giá trị của tính trạng đang được nghiên cứu). Trung bìnhđôi khi được gọi tùy chọn giữa, tại vì nó chia dân số thành hai phần bằng nhau theo cách sao cho ở cả hai phía của nó có cùng số đơn vị dân số. Nếu tất cả các đơn vị của một chuỗi đều được gán số sê-ri, thì số thứ tự của trung vị sẽ được xác định theo công thức (n + 1): 2 đối với chuỗi, trong đó n - số lẻ. Nếu một hàng với thậm chí số lượng đơn vị, sau đó Trung bình sẽ là giá trị trung bình giữa hai phương án liền kề, được xác định theo công thức: n: 2, (n + 1): 2, (n: 2) +1.

Trong chuỗi biến phân rời rạc với một số đơn vị dân số lẻ, đây là một giá trị số cụ thể ở giữa chuỗi.

Việc tìm trung vị trong chuỗi biến thiên khoảng yêu cầu xác định sơ bộ khoảng thời gian mà trung vị nằm, tức là Trung bình khoảng thời gian- khoảng này được đặc trưng bởi thực tế là tần số tích lũy (tích lũy) của nó bằng một nửa tổng hoặc vượt quá một nửa tổng của tất cả các tần số của chuỗi.

    X Me - giới hạn dưới của khoảng trung vị

    h Me - giá trị của khoảng trung vị;

    S Me-1 - tổng các tần số tích lũy của khoảng trước khoảng trung vị;

    f Me là tần số địa phương của khoảng trung vị.

Theo bảng, chúng tôi xác định giá trị trung vị thu nhập bình quân đầu người. Để làm điều này, bạn cần xác định khoảng nào sẽ là trung vị. Chúng tôi sử dụng công thức cho số đơn vị trung bình của chuỗi, tức là ở giữa:

Giá trị phân số của N (luôn có số hạng chẵn) bằng 50,5% cho biết phần giữa của dãy số nằm trong khoảng từ 50% đến 51%, tức là trong khoảng thứ ba. Nói cách khác: trung vị là khoảng, lần đầu tiên chiếm hơn một nửa tổng tần số tích lũy. Do đó trung bình:

Để xác định bằng đồ thị khoảng thời gian mà trung vị nằm, các tần số tích lũy được vẽ dọc theo trục y, và tâm của các khoảng được vẽ dọc theo abscissa. Từ điểm trên trục hoành độ, tương ứng với 50,5% tổng tần số tích lũy, một đường thẳng được vẽ song song với trục abscissa cho đến khi nó giao với tích lũy. Từ giao điểm, một đường vuông góc được hạ xuống trục abscissa.

Tỷ lệ giữa phương thức, trung vị và trung bình cộng cho biết bản chất của sự phân bố của tính trạng trong tổng thể, cho phép chúng ta đánh giá tính bất đối xứng của nó. Nếu M0

Từ tỷ lệ của các chỉ số này, có thể kết luận rằng có sự bất cân xứng về mặt phân bố dân cư theo mức thu nhập bình quân đầu người bằng tiền:

Phần tư- đây là phần thứ tư của tổng thể, nó được xác định là trung vị, chỉ tổng các tần số phải chia cho 4 và khi xác định khoảng phần tư, tần số tích lũy phải lớn hơn hoặc bằng một phần tư của tổng các tần số của quần thể.

Decile Chia dân số thành mười phần bằng nhau. Nó được xác định theo cách tương tự như phần tư, chỉ có tổng các tần số phải được chia cho 10.

Cùng với các giá trị trung bình, trung bình cấu trúc được tính toán như các đặc điểm thống kê của chuỗi phân phối biến thiên - thời trangTrung bình.
Thời trang(Mo) đại diện cho giá trị của đối tượng được nghiên cứu, được lặp lại với tần suất cao nhất, tức là chế độ là giá trị của đối tượng địa lý thường xuyên xảy ra nhất.
Trung bình(Tôi) là giá trị của đối tượng địa lý nằm ở giữa dân số được xếp hạng (theo thứ tự), tức là trung vị - giá trị trung tâm của chuỗi biến thiên.
Thuộc tính chính của giá trị trung bình là tổng độ lệch tuyệt đối của các giá trị thuộc tính so với giá trị trung bình nhỏ hơn bất kỳ giá trị nào khác ∑ | x i - Me | = min.

Xác định Chế độ và Trung vị từ Dữ liệu Chưa được Nhóm

Xem xét xác định chế độ và giá trị trung bình từ dữ liệu chưa được phân nhóm. Giả sử đội công nhân gồm 9 người có mức lương như sau: 4 3 4 5 3 3 6 2 6. Vì đội này có nhiều công nhân nhất thuộc loại thứ 3, nên loại thuế quan này sẽ là phương thức. Mo = 3.
Để xác định số trung vị cần xếp: 2 3 3 3 4 4 5 6 6. Trung tâm trong loạt bài này là công nhân của loại thứ 4, do đó, loại này sẽ là trung vị. Nếu chuỗi được xếp hạng bao gồm một số đơn vị chẵn, thì giá trị trung vị được xác định là giá trị trung bình của hai giá trị trung tâm.
Nếu phương thức phản ánh biến thể phổ biến nhất của giá trị thuộc tính, thì giá trị trung bình trên thực tế thực hiện các chức năng của giá trị trung bình đối với một quần thể không đồng nhất không tuân theo quy luật phân phối chuẩn. Hãy để chúng tôi minh họa ý nghĩa nhận thức của nó bằng ví dụ sau.
Giả sử chúng ta cần mô tả thu nhập trung bình của một nhóm người gồm 100 người, trong đó 99 người có thu nhập trong khoảng từ $ 100 đến $ 200 mỗi tháng và thu nhập hàng tháng của nhóm người sau là $ 50.000 (Bảng 1).
Bảng 1 - Thu nhập hàng tháng của nhóm người được nghiên cứu. Nếu chúng ta sử dụng giá trị trung bình số học, chúng ta nhận được thu nhập trung bình khoảng 600 - 700 đô la, điều này có rất ít điểm tương đồng với thu nhập của bộ phận chính trong nhóm. Giá trị trung bình, trong trường hợp này bằng Me = 163 đô la, sẽ cho phép chúng ta đưa ra mô tả khách quan về mức thu nhập của 99% nhóm người này.
Xem xét định nghĩa của chế độ và trung vị theo dữ liệu được nhóm (chuỗi phân phối).
Giả sử việc phân bổ công nhân của toàn bộ xí nghiệp theo biểu thuế có dạng như sau (Bảng 2).
Bảng 2 - Phân bổ công nhân của xí nghiệp theo biểu thuế

Tính toán chế độ và giá trị trung bình cho một chuỗi rời rạc

Tính toán chế độ và giá trị trung bình cho một chuỗi khoảng thời gian

Tính toán chế độ và giá trị trung bình cho một chuỗi biến thể

Xác định chế độ từ một loạt biến thể rời rạc

Chuỗi giá trị tính năng được xây dựng trước đó, được sắp xếp theo giá trị, được sử dụng. Nếu cỡ mẫu là số lẻ, lấy giá trị trung tâm; nếu kích thước mẫu là chẵn, chúng tôi lấy trung bình cộng của hai giá trị trung tâm.
Xác định chế độ từ một loạt biến thể rời rạc: loại thuế quan thứ 5 có tần suất cao nhất (60 người), do đó, nó mang tính phương thức. Mo = 5.
Để xác định giá trị trung bình của thuộc tính, số đơn vị trung vị của chuỗi (N Me) được tìm thấy bằng cách sử dụng công thức sau:, với n là thể tích của tập hợp.
Trong trường hợp của chúng ta: .
Giá trị phân số kết quả, luôn xảy ra với một số đơn vị dân số chẵn, chỉ ra rằng giá trị trung bình chính xác là từ 95 đến 96 công nhân. Cần xác định xem những công nhân có số thứ tự này thuộc nhóm nào. Điều này có thể được thực hiện bằng cách tính toán các tần số tích lũy. Không có công nhân nào có những con số này trong nhóm thứ nhất, nơi chỉ có 12 người và họ không thuộc nhóm thứ hai (12 + 48 = 60). Công nhân thứ 95 và 96 thuộc nhóm thứ ba (12 + 48 + 56 = 116), do đó, mức lương thứ 4 là mức trung bình.

Tính toán chế độ và trung vị trong một chuỗi khoảng thời gian

Không giống như chuỗi biến phân rời rạc, việc xác định chế độ và giá trị trung bình từ chuỗi khoảng thời gian yêu cầu tính toán nhất định dựa trên các công thức sau:
, (5.6)
ở đâu x0- giới hạn dưới của khoảng phương thức (khoảng có tần số cao nhất được gọi là phương thức);
tôi là giá trị của khoảng phương thức;
fMo là tần số của khoảng phương thức;
fMo-1 là tần số của khoảng trước phương thức;
f Mo +1 là tần số của khoảng thời gian tuân theo phương thức.
(5.7)
ở đâu x0- giới hạn dưới của khoảng trung vị (trung vị là khoảng đầu tiên, tần số tích lũy vượt quá một nửa tổng số tần số);
tôi là giá trị của khoảng trung vị;
S Tôi-1- khoảng tích lũy trước khoảng thời gian trung bình;
f Tôi là tần số của khoảng trung vị.
Chúng tôi minh họa ứng dụng của các công thức này bằng cách sử dụng dữ liệu trong Bảng. 3.
Khoảng có ranh giới 60 - 80 trong phân phối này sẽ là phương thức, bởi vì nó có tần số cao nhất. Sử dụng công thức (5.6), chúng tôi xác định chế độ:

Để thiết lập khoảng trung vị, cần phải xác định tần số tích lũy của mỗi khoảng tiếp theo cho đến khi nó vượt quá một nửa tổng các tần số tích lũy (trong trường hợp của chúng tôi là 50%) (Bảng 5.11).
Người ta thấy rằng trung vị là khoảng có ranh giới từ 100 - 120 nghìn rúp. Bây giờ chúng tôi xác định trung vị:

Bảng 3 - Phân bố dân số của Liên bang Nga theo mức thu nhập tiền mặt danh nghĩa bình quân đầu người vào tháng 3 năm 1994
Các nhóm theo mức thu nhập bình quân đầu người hàng tháng, nghìn rúpTỷ lệ dân số,%
lên đến 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Hơn 3007,7
Tổng cộng100,0

Bảng 4 - Định nghĩa khoảng trung vị
Do đó, giá trị trung bình cộng, phương thức và trung vị có thể được sử dụng như một đặc tính tổng quát của các giá trị của một thuộc tính nhất định cho các đơn vị của một tập hợp được xếp hạng.
Đặc điểm chính của trung tâm phân phối là giá trị trung bình số học, được đặc trưng bởi thực tế là tất cả các độ lệch so với nó (dương và âm) đều cộng lại bằng không. Điều điển hình cho giá trị trung bình là tổng độ lệch so với nó trong môđun là nhỏ nhất và chế độ là giá trị của đối tượng thường xuyên xảy ra nhất.
Tỷ lệ giữa phương thức, trung vị và trung bình cộng cho biết bản chất của sự phân bố của tính trạng trong tổng thể, cho phép chúng ta đánh giá tính bất đối xứng của nó. Trong phân phối đối xứng, cả ba đặc điểm đều giống nhau. Chênh lệch giữa chế độ và giá trị trung bình số học càng lớn thì chuỗi càng không đối xứng. Đối với các chuỗi có độ lệch vừa phải, sự khác biệt giữa phương thức và giá trị trung bình cộng xấp xỉ ba lần sự khác biệt giữa giá trị trung bình và giá trị trung bình, tức là:
| Mo – `x | = 3 | Tôi –`x |.

Xác định chế độ và trung vị bằng phương pháp đồ thị

Chế độ và trung vị trong một chuỗi khoảng thời gian có thể được xác định bằng đồ thị. Chế độ được xác định từ biểu đồ của phân phối. Để làm điều này, hình chữ nhật cao nhất được chọn, trong trường hợp này là phương thức. Sau đó, chúng tôi kết nối đỉnh bên phải của hình chữ nhật phương thức với góc trên bên phải của hình chữ nhật trước đó. Và đỉnh bên trái của hình chữ nhật phương thức nằm với góc trên bên trái của hình chữ nhật tiếp theo. Từ giao điểm của chúng, chúng tôi hạ thấp vuông góc với trục abscissa. Cơ số của giao điểm của các đường này sẽ là chế độ phân phối (Hình 5.3).


Cơm. 5.3. Định nghĩa đồ họa về thời trang bằng biểu đồ.


Cơm. 5.4. Đồ thị xác định giá trị trung bình bằng cách tích lũy
Để xác định trung vị từ một điểm trên thang tần số tích lũy (tần suất) tương ứng với 50%, một đường thẳng được vẽ song song với trục abscissa đến giao điểm với tích lũy. Sau đó, từ giao điểm, một đường vuông góc được hạ xuống trục abscissa. Cơ sở của giao điểm là trung tuyến.

Phần tư, Phần phân chia, Phần trăm

Tương tự, với việc tìm giá trị trung bình trong chuỗi phân phối biến thiên, bạn có thể tìm giá trị của một đối tượng cho bất kỳ đơn vị nào của chuỗi được xếp hạng theo thứ tự. Vì vậy, ví dụ: bạn có thể tìm giá trị của một đối tượng địa lý trong các đơn vị chia chuỗi thành bốn phần bằng nhau, thành 10 hoặc 100 phần. Những giá trị này được gọi là "tứ phân vị", "thập phân", "phân vị".
Phần tư là giá trị của một đối tượng địa lý chia dân số trong phạm vi thành 4 phần bằng nhau.
Phân biệt giữa phần tư phía dưới (Q 1), phần này phân tách ¼ tập hợp có giá trị thấp nhất của thuộc tính và phần tư trên (Q 3), phần này cắt bỏ phần ¼ có giá trị cao nhất của thuộc tính . Điều này có nghĩa là 25% đơn vị dân số sẽ nhỏ hơn Q 1; 25% đơn vị sẽ được bao quanh giữa Q 1 và Q 2; 25% - giữa Q 2 và Q 3, và 25% còn lại cao hơn Q 3. Phần tư giữa của Q 2 là trung vị.
Để tính toán các phần tư theo chuỗi biến thiên khoảng, các công thức sau được sử dụng:
, ,
ở đâu x Q 1- giới hạn dưới của khoảng có chứa phần tư thấp hơn (khoảng được xác định theo tần suất tích lũy, lần đầu tiên vượt quá 25%);
x Q 3- giới hạn dưới của khoảng có chứa phần tư trên (khoảng được xác định bởi tần suất tích lũy, lần đầu tiên vượt quá 75%);
tôi- giá trị khoảng thời gian;
S Q 1-1 là tần số tích lũy của khoảng trước khoảng chứa phần tư thấp hơn;
S Q 3-1 là tần số tích lũy của khoảng trước khoảng chứa phần tư trên;
f Q 1 là tần số của khoảng chứa phần tư thấp hơn;
f Q 3 là tần số của khoảng chứa phần tư trên.
Xem xét tính toán của phần tư dưới và phần tư trên theo Bảng. 5.10. Phần tư thấp hơn nằm trong khoảng 60 - 80, tần suất tích lũy là 33,5%. Phần tư trên nằm trong khoảng 160 - 180 với tần suất tích lũy là 75,8%. Với suy nghĩ này, chúng tôi nhận được:
,
.
Ngoài các phần tư, các số phân vị có thể được xác định trong các cấp phân phối biến thiên - các tùy chọn chia chuỗi biến phân được xếp hạng thành mười phần bằng nhau. Thập phân đầu tiên (d 1) chia dân số 1/10 thành 9/10, thập phân thứ hai (d 1) 2/10 thành 8/10, v.v.
Chúng được tính theo công thức:
, .
Giá trị tính năng chia chuỗi thành một trăm phần được gọi là phân vị. Tỷ lệ của trung vị, phần tư, phần thập phân và phần trăm được thể hiện trong Hình. 5.5.

Trung bình cộng (sau đây gọi là giá trị trung bình) có lẽ là tham số thống kê phổ biến nhất. Khái niệm này được sử dụng ở khắp mọi nơi - từ câu nói "nhiệt độ trung bình trong bệnh viện" cho đến các công trình khoa học nghiêm túc. Tuy nhiên, kỳ lạ thay, mức trung bình là một khái niệm phức tạp, thường gây hiểu lầm, thay vì đưa ra sự rõ ràng và rõ ràng.

Nếu chúng ta nói về công việc khoa học, thì phân tích dữ liệu thống kê được sử dụng trong hầu hết các ngành khoa học ứng dụng, ngay cả trong khoa học nhân văn (ví dụ, tâm lý học). Giá trị trung bình được tính cho các đối tượng được đo trên cái gọi là thang đo liên tục. Những dấu hiệu đó, chẳng hạn như nồng độ của các chất trong huyết thanh, chiều cao, cân nặng, tuổi tác. Trung bình cộng có thể dễ dàng tính toán và được dạy ở trường trung học. Tuy nhiên (theo các quy định của thống kê toán học), giá trị trung bình là thước đo thích hợp cho xu hướng trung tâm trong mẫu chỉ trong trường hợp phân phối chuẩn (Gaussian) của thuộc tính (Hình 1). Cơm. 1. Phân phối chuẩn (Gaussian) của một đối tượng trong mẫu. Trung bình (M) và trung vị (Me) giống nhau

Trong trường hợp phân phối sai lệch so với quy luật thông thường, việc sử dụng giá trị trung bình là không chính xác, vì nó quá nhạy cảm với cái gọi là “giá trị ngoại lệ” - không đặc trưng cho mẫu đang nghiên cứu, quá lớn hoặc quá nhỏ ( Hình 2). Trong trường hợp này, một tham số khác, giá trị trung bình, nên được sử dụng để mô tả xu hướng trung tâm trong mẫu. Giá trị trung bình là giá trị của đối tượng địa lý, ở bên phải và bên trái có số lượng quan sát bằng nhau (50% mỗi đối tượng). Tham số này (không giống như giá trị trung bình) chống lại "giá trị ngoại lai". Cũng lưu ý rằng trung vị cũng có thể được sử dụng trong trường hợp phân phối chuẩn, trong trường hợp này trung vị giống với giá trị trung bình.

Cơm. 2. Sự phân bố của đối tượng địa lý trong mẫu khác với bình thường. Trung bình (m) và trung vị (ME) không khớp

Để tìm hiểu xem liệu phân bố của một đối tượng trong mẫu có bình thường (Gaussian) hay không, tức là, để tìm ra tham số nào nên được sử dụng (giá trị trung bình hoặc trung vị), cần có các thử nghiệm thống kê đặc biệt.

Hãy lấy một ví dụ. Tốc độ lắng hồng cầu ở nhóm bệnh nhân viêm phổi gần đây là 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Giá trị trung bình của mẫu này là 17,8, trung vị là 12. Phân bố. (theo thử nghiệm Shapiro-Wilk) không bình thường (Hình 3) nên phải sử dụng trung vị. Cơm. 3. Ví dụ

Thật kỳ lạ, nhưng trong một số lĩnh vực của nền kinh tế, một người quan sát bên ngoài không thể nhận thấy ít nhất một số dấu vết về việc áp dụng chính xác thống kê toán học. Vì vậy, chúng tôi liên tục được thông báo về mức lương trung bình (ví dụ, trong các viện nghiên cứu), và những con số này thường gây ngạc nhiên không chỉ cho nhân viên bình thường, mà cả các trưởng bộ phận (bây giờ được gọi là “quản lý cấp trung”). Chúng tôi rất ngạc nhiên khi mức lương trung bình ở Moscow là 40 nghìn rúp, nhưng tất nhiên, chúng tôi hiểu rằng chúng tôi đã bị "tính bình quân" với các nhà tài phiệt. Đây là một ví dụ từ cuộc đời của các nhà khoa học: lương của nhân viên phòng thí nghiệm (nghìn rúp) là 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Giá trị trung bình là 17,8, giá trị trung bình là 12. Đồng ý rằng đây là những con số khác nhau!

Tất nhiên, không thể loại trừ việc bưng bít các thuộc tính của mức trung bình là sự ranh mãnh, vì ban lãnh đạo luôn có lợi hơn khi trình bày tình hình với mức lương của nhân viên tốt hơn thực tế.

Không phải đã đến lúc cộng đồng khoa học kêu gọi các nhà lãnh đạo của chúng ta dừng việc lạm dụng thống kê toán học sao?

Olga Rebrova,
doc. em yêu. Khoa học, Phó chủ tịch
IPO "Hiệp hội các chuyên gia y học dựa trên bằng chứng"

Trung bình- đây là giá trị đối tượng chia chuỗi phân phối đã xếp hạng thành hai phần bằng nhau - với giá trị đối tượng nhỏ hơn giá trị trung bình và với giá trị đối tượng lớn hơn giá trị trung bình. Để tìm giá trị trung bình, bạn cần tìm giá trị của đối tượng địa lý nằm ở giữa chuỗi có thứ tự.

Xem giải pháp cho vấn đề tìm chế độ và trung vị Bạn có thể

Trong chuỗi được xếp hạng, dữ liệu chưa được nhóm cho tìm đường trung bìnhđược giảm xuống để tìm số thứ tự của trung vị. Giá trị trung bình có thể được tính bằng công thức sau:

trong đó Xm là giới hạn dưới của khoảng trung vị;
im - khoảng trung vị;
Sme là tổng số quan sát được tích lũy trước khi bắt đầu khoảng thời gian trung vị;
fme là số lần quan sát trong khoảng thời gian trung bình.

thuộc tính trung bình

  1. Giá trị trung bình không phụ thuộc vào các giá trị đó của thuộc tính nằm ở cả hai phía của nó.
  2. Các phép toán phân tích với trung vị rất hạn chế, vì vậy khi kết hợp hai phân phối với trung vị đã biết, không thể dự đoán trước giá trị của trung vị của phân phối mới.
  3. Trung bình có tài sản tối thiểu. Bản chất của nó nằm ở chỗ tổng độ lệch tuyệt đối của các giá trị x so với giá trị trung vị là giá trị nhỏ nhất so với độ lệch của X so với bất kỳ giá trị nào khác

Định nghĩa đồ họa của trung vị

Để xác định phương tiện bằng phương pháp đồ họa sử dụng các tần số tích lũy, trên đó đường cong tích lũy được xây dựng. Các đỉnh của đồ thị tương ứng với các tần số tích lũy được nối với nhau bằng các đoạn thẳng. Chia đôi hoành độ cuối cùng, tương ứng với tổng tần số và vẽ đường vuông góc của giao điểm với đường cong tích lũy với nó, tìm hoành độ của giá trị mong muốn của trung vị.

Định nghĩa thời trang trong thống kê

Thời trang - giá trị tính năng, có tần suất cao nhất trong chuỗi phân phối thống kê.

Định nghĩa về thời trangđược tạo ra theo những cách khác nhau và điều này phụ thuộc vào việc biến được trình bày dưới dạng chuỗi rời rạc hay chuỗi khoảng.

Tìm kiếm thời trang và trung vị được thực hiện bằng cách đơn giản là xem qua cột tần số. Trong cột này, hãy tìm số lớn nhất đặc trưng cho tần số cao nhất. Nó tương ứng với một giá trị nhất định của thuộc tính, đó là chế độ. Trong chuỗi biến thiên khoảng, biến thể trung tâm của khoảng có tần số cao nhất được coi là chế độ. Trong loạt bài phân phối này chế độ được tính bằng công thức:

trong đó XMo là giới hạn dưới của khoảng phương thức;
imo - khoảng cách giữa các phương thức;
fm0, fm0-1, fm0 + 1 là các tần số trong khoảng modal, trước và sau modal.

Khoảng phương thức được xác định bởi tần số cao nhất.

Thời trang được sử dụng rộng rãi trong thực hành thống kê để phân tích nhu cầu tiêu dùng, đăng ký giá cả, v.v.

Mối quan hệ giữa trung bình cộng, trung vị và chế độ

Đối với một chuỗi phân phối đối xứng đơn phương thức, trung vị và chế độ là như nhau. Đối với phân bố không đối xứng, chúng không trùng nhau.

K. Pearson, dựa trên sự liên kết của nhiều loại đường cong, đã xác định rằng đối với các phân phối không đối xứng vừa phải, các mối quan hệ gần đúng sau đây giữa trung bình cộng, trung vị và chế độ là hợp lệ: