Tiểu sử Đặc điểm Phân tích

Tìm đường trung bình. Trung bình hay trung vị? Giá trị trung bình và giá trị trung bình

Chế độ và trung vị- một loại giá trị trung bình đặc biệt được sử dụng để nghiên cứu cấu trúc của chuỗi biến thiên. Chúng đôi khi được gọi là trung bình cấu trúc, trái ngược với các mức trung bình theo quy luật quyền lực đã được thảo luận trước đây.

Thời trang- đây là giá trị của thuộc tính (biến thể), thường được tìm thấy nhiều nhất trong tập hợp này, tức là có tần số cao nhất.

Thời trang có ứng dụng thực tế rất lớn, trong một số trường hợp chỉ có thời trang mới có thể đặc trưng cho các hiện tượng xã hội.

Trung bình là biến thể nằm giữa chuỗi biến thể có thứ tự.

Giá trị trung bình cho thấy giới hạn định lượng của giá trị của đặc trưng biến số đạt được bằng một nửa số đơn vị dân số. Nên sử dụng giá trị trung bình cùng với giá trị trung bình hoặc thay vì giá trị trung bình nếu có các khoảng mở trong chuỗi biến thể, bởi vì việc tính toán trung vị không yêu cầu thiết lập có điều kiện các ranh giới của các khoảng mở, và do đó việc thiếu thông tin về chúng không ảnh hưởng đến độ chính xác của việc tính toán trung vị.

Trung vị cũng được sử dụng khi các chỉ số được sử dụng làm trọng số không xác định. Giá trị trung bình được sử dụng thay cho giá trị trung bình số học trong các phương pháp thống kê về kiểm soát chất lượng sản phẩm. Tổng độ lệch tuyệt đối của các lựa chọn so với giá trị trung bình nhỏ hơn bất kỳ số nào khác.

Xem xét việc tính toán chế độ và giá trị trung vị trong một chuỗi biến phân rời rạc :

Xác định chế độ và trung vị.

Thời trang Mo = 4 năm, vì giá trị này tương ứng với tần số cao nhất f = 5.

Những thứ kia. Hầu hết các công nhân có 4 năm kinh nghiệm.

Để tính giá trị trung bình, trước tiên chúng ta tìm một nửa tổng các tần số. Nếu tổng các tần số là một số lẻ, thì trước tiên chúng ta cộng một tần số vào tổng này, rồi chia đôi:

Trung vị sẽ là tùy chọn thứ tám.

Để tìm tùy chọn nào sẽ là số thứ tám, chúng ta sẽ tích lũy các tần số cho đến khi chúng ta nhận được tổng các tần số bằng hoặc lớn hơn một nửa tổng của tất cả các tần số. Tùy chọn tương ứng sẽ là trung vị.

Tôi = 4 năm.

Những thứ kia. một nửa số công nhân có ít hơn bốn năm kinh nghiệm, một nửa nhiều hơn.

Nếu tổng các tần số tích lũy so với một tùy chọn bằng một nửa tổng các tần số, thì giá trị trung vị được xác định là trung bình cộng của tùy chọn này và tùy chọn tiếp theo.

Tính toán chế độ và giá trị trung bình trong một chuỗi biến thiên khoảng thời gian

Chế độ trong chuỗi biến thiên khoảng thời gian được tính bằng công thức

ở đâu X М0- đường viền ban đầu của khoảng phương thức,

hm 0 là giá trị của khoảng phương thức,

fm 0 , fm 0-1 , fm 0+1 - tần số của khoảng phương thức, tương ứng, trước phương thức và sau đó.

Phương thức Khoảng có tần số cao nhất được gọi là.

ví dụ 1

Nhóm theo kinh nghiệm

Số lượng công nhân, người

Tần số tích lũy

Xác định chế độ và trung vị.

Khoảng phương thức, bởi vì nó tương ứng với tần số cao nhất f = 35. Khi đó:

Hm 0 =6, fm 0 =35

THỰC HÀNH # 4 .

Tính toán các đặc điểm cấu tạo của chuỗi biến phân.

Học sinh phải:

biết:

- phạm vi và phương pháp tính toán trung bình kết cấu;

có thể:

- tính toán trung bình cơ cấu;

- hình thành một kết luận dựa trên các kết quả thu được.

Nguyên tắc

Trong thống kê, phương thức và giá trị trung vị được tính toán, có liên quan đến trung bình cơ cấu, vì vậy giá trị nào phụ thuộc vào các tòa nhà tổng hợp thống kê.

tính toán thời trang

Thời trang giá trị của đối tượng địa lý (biến thể) được gọi, thường xuyên hơn tất cả xảy ra trong quần thể nghiên cứu. Trong một chuỗi phân phối rời rạc, chế độ sẽ là biến thể có tần suất cao nhất.

Ví dụ: Việc phân phối giày nữ được bán theo kích cỡ được đặc trưng như sau:

Cỡ giày

Số lượng đôi đã bán

Trong loạt phân phối này, chế độ có kích thước 37, tức là Kích thước Mo = 37.

Đối với một chuỗi phân phối khoảng thời gian, chế độ được xác định theo công thức:

ở đâu X Mo - giới hạn dưới của khoảng phương thức;

hMo - giá trị của khoảng phương thức;

fMo là tần số của khoảng phương thức;

fMo -1 fMo +1 - tần số khoảng thời gian, tương ứng

đứng trước phương thức và theo sau nó.

Ví dụ: Sự phân bố của người lao động theo thời gian làm việc được đặc trưng bởi dữ liệu sau.

Kinh nghiệm làm việc, nhiều năm

lên đến 2

8-10

10 trở lên

Số lượng công nhân, cá nhân.

Xác định chế độ của chuỗi khoảng thời gian của phân phối.

Chế độ của chuỗi khoảng thời gian là

Thời trang luôn có phần mơ hồ; nó phụ thuộc vào quy mô của các nhóm và vị trí chính xác của ranh giới nhóm. Thời trang được sử dụng rộng rãi trong thực tế thương mại khi nghiên cứu nhu cầu của người tiêu dùng, khi đăng ký giá cả, v.v.

Tính toán trung vị

Trung bình trong thống kê được gọi là một biến thể nằm ở giữa một chuỗi dữ liệu có thứ tự và chia tổng thể thống kê thành hai phần bằng nhau để một nửa giá trị nhỏ hơn giá trị trung bình và nửa còn lại lớn hơn nó. Để xác định giá trị trung bình, cần phải xây dựng một chuỗi được xếp hạng, tức là chuỗi theo thứ tự tăng dần hoặc giảm dần giá trị cá nhân dấu hiệu.

Trong một loạt có thứ tự rời rạc với số phần tử lẻ, trung vị sẽ là biến thể nằm ở trung tâm của loạt.

Ví dụ: Kinh nghiệm của năm công nhân là 2, 4, 7, 9 và 10 năm. Trong chuỗi này, trung bình là 7 năm, tức là Tôi = 7 năm

Nếu một chuỗi có thứ tự rời rạc bao gồm một số phần tử chẵn, thì trung vị sẽ là trung bình cộng của hai lựa chọn liền kề ở trung tâm của chuỗi.

Ví dụ: Kinh nghiệm làm việc của sáu công nhân là 1, 3, 4, 5, 10 và 11 năm. Có hai tùy chọn trong hàng này, đứng ở giữa hàng. Đây là các phương án 4 và 5. Trung bình cộng của các giá trị này sẽ là giá trị trung bình của chuỗi

Để xác định giá trị trung bình cho dữ liệu được nhóm, các tần số tích lũy phải được đọc.

Ví dụ:Dựa trên dữ liệu có sẵn, chúng tôi xác định cỡ giày trung bình

Cỡ giày

Số lượng đôi đã bán

Tổng các tần số tích lũy

8+19=27

27+34=61

61+108=169

Tổng cộng

Để xác định số trung vị, cần tính tổng các tần số tích lũy của chuỗi. Sự tích lũy của tổng số tiếp tục cho đến khi tổng tần số tích lũy vượt quá một nửa tổng các tần số của chuỗi. Trong ví dụ của chúng tôi, tổng các tần số là 300, một nửa của nó - 150. Tổng các tần số được tích lũy hóa ra là 169. Biến thể tương ứng với tổng này, tức là 37 là giá trị trung bình của chuỗi.

Nếu tổng các tần số tích lũy so với một trong các tùy chọn bằng chính xác một nửa tổng các tần số của chuỗi, thì giá trị trung vị được xác định là trung bình cộng của tùy chọn này và tùy chọn tiếp theo.

Ví dụ: Dựa trên dữ liệu có sẵn, chúng tôi xác định mức lương trung bình của người lao động

Hàng tháng tiền công, nghìn rúp.

Số lượng công nhân, cá nhân.

Tổng các tần số tích lũy

14,0

14,2

2+6=8

16,0

8+12=20

16,8

18,0

Tổng cộng:

Trung vị sẽ là:

Giá trị trung bình của chuỗi biến thiên theo khoảng của phân bố được xác định theo công thức:

Ở đâu x tôi là giới hạn dưới của khoảng trung vị;

h Tôi là giá trị của khoảng trung vị;

f- tổng các tần số của chuỗi;

f Tôi là tần số của khoảng trung vị;

Ví dụ:Dựa trên dữ liệu có sẵn về phân bố doanh nghiệp theo số lượng nhân công sản xuất và công nghiệp, hãy tính giá trị trung bình trong chuỗi biến thiên khoảng thời gian

Số lượng doanh nghiệp

Tổng các tần số tích lũy

100-200

200-300

1+3=4

300-400

4+7=11

400-500

11+30=41

500-600

600-700

700-800

Tổng cộng:

Đầu tiên chúng ta hãy xác định khoảng trung vị. TẠI ví dụ này tổng các tần số tích lũy vượt quá một nửa tổng tất cả các giá trị của chuỗi tương ứng với khoảng 400-500. Đây là khoảng trung bình, tức là khoảng chứa trung vị của dãy số. Hãy xác định ý nghĩa của nó

Nếu tổng các tần số tích lũy so với một trong các khoảng thời gian bằng chính xác một nửa tổng các tần số của chuỗi, thì giá trị trung bình được xác định theo công thức:

ở đâu N- số lượng đơn vị trong quần thể.

Ví dụ:Dựa trên dữ liệu có sẵn về phân bố doanh nghiệp theo số lượng nhân công sản xuất và công nghiệp, hãy tính giá trị trung bình trong chuỗi biến thiên khoảng thời gian

Các nhóm doanh nghiệp theo số lượng PPP, cá nhân.

Số lượng doanh nghiệp

Tổng các tần số tích lũy

100-200

200-300

1+3=4

300-400

4+6=10

400-500

10+30=40

500-600

40+20=60

600-700

700-800

Tổng cộng:

Mọi người

Chế độ và trung vị trong chuỗi khoảng thời gian có thể là xác định bằng đồ thị:

thời trang trong hàng rời rạc- theo đa giác phân phối, chế độ trong chuỗi khoảng thời gian - theo biểu đồ phân phối và trung vị - theo tích lũy.

Chế độ của chuỗi phân phối khoảng thời gian được xác định bởi biểu đồ phân phối xác định theo cách sau đây. Đối với điều này, hình chữ nhật cao nhất được chọn, trong trường hợp này phương thức. Sau đó, chúng tôi kết nối đỉnh bên phải của hình chữ nhật phương thức với bên phải góc trên cùng hình chữ nhật trước đó. Và đỉnh bên trái của hình chữ nhật phương thức nằm với góc trên bên trái của hình chữ nhật tiếp theo. Hơn nữa, từ giao điểm của chúng, một đường vuông góc được hạ xuống trục abscissa. Cơ số của giao điểm của các đường này sẽ là chế độ phân phối.

Giá trị trung bình được tính từ tích lũy. Để xác định nó, từ một điểm trên thang tần số tích lũy (tần số), tương ứng với 50%, một đường thẳng được vẽ, song song với trục abscissa, cho đến khi nó giao với đường tích lũy. Sau đó, từ giao điểm của đường thẳng xác định với tích lũy, một đường vuông góc được hạ xuống trục abscissa. Cơ sở của giao điểm là trung tuyến.

Ngoài chế độ và giá trị trung vị, các biến khác có thể được xác định trong chuỗi biến thể. đặc điểm cấu trúc- lượng tử. Các lượng tử nhằm mục đích nghiên cứu sâu hơn về cấu trúc của chuỗi phân phối.

lượng tử- đây là giá trị của một đối tượng địa lý chiếm một vị trí nhất định trong quần thể được sắp xếp theo đối tượng địa lý này. Có các loại lượng tử sau:

- tứ phân vị là các giá trị thuộc tính phân chia tập hợp có thứ tự thành bốn phần bằng nhau;

- deciles - các giá trị thuộc tính chia tập hợp có thứ tự cho mười các phần bằng nhau;

- phần trăm - các giá trị thuộc tính chia tập có thứ tự thành một trăm phần bằng nhau.

Do đó, để mô tả vị trí của tâm của chuỗi phân phối, có thể sử dụng 3 chỉ số: bần tiện tính năng, chế độ, trung vị. Khi chọn loại và hình thức của một chỉ số cụ thể của trung tâm phân phối, cần phải thực hiện theo các khuyến nghị sau:

- đối với các quá trình kinh tế - xã hội bền vững, giá trị trung bình số học được sử dụng làm chỉ số trung tâm. Các quá trình như vậy được đặc trưng bởi các phân bố đối xứng, trong đó;

- đối với các quá trình không ổn định, vị trí của trung tâm phân phối được đặc trưng bởi Mo hoặc Tôi. Đối với các quá trình không đối xứng, đặc tính ưa thích của trung tâm phân phối là trung vị, vì nó chiếm một vị trí giữa giá trị trung bình số học và chế độ.

Cùng với các giá trị trung bình như đặc điểm thống kê của chuỗi phân phối biến thiên, trung bình cấu trúc được tính: thời trangTrung bình.
Thời trang(Mo) đại diện cho giá trị của đối tượng được nghiên cứu, được lặp lại với tần suất cao nhất, tức là chế độ là giá trị của đối tượng địa lý thường xuyên xảy ra nhất.
Trung bình(Tôi) là giá trị của đối tượng địa lý nằm ở giữa dân số được xếp hạng (theo thứ tự), tức là trung vị - giá trị trung tâm của chuỗi biến thiên.
Thuộc tính chính của giá trị trung bình là tổng độ lệch tuyệt đối của các giá trị thuộc tính so với giá trị trung bình nhỏ hơn bất kỳ giá trị nào khác ∑ | x i - Me | = min.

Xác định Chế độ và Trung vị từ Dữ liệu Chưa được Nhóm

Xem xét xác định chế độ và giá trị trung bình từ dữ liệu chưa được phân nhóm. Giả sử đội công nhân gồm 9 người có mức lương như sau: 4 3 4 5 3 3 6 2 6. Vì đội này có nhiều công nhân nhất thuộc loại thứ 3, nên loại thuế quan này sẽ là phương thức. Mo = 3.
Để xác định số trung vị cần xếp: 2 3 3 3 4 4 5 6 6. Trung tâm trong loạt bài này là công nhân của loại thứ 4, do đó, loại này sẽ là trung vị. Nếu chuỗi được xếp hạng bao gồm một số đơn vị chẵn, thì giá trị trung vị được xác định là giá trị trung bình của hai giá trị trung tâm.
Nếu chế độ phản ánh biến thể phổ biến nhất của giá trị của đối tượng địa lý, thì giá trị trung bình trên thực tế thực hiện các chức năng của giá trị trung bình cho một giá trị không đồng nhất, không cấp dưới luật bình thường sự phân bố dân cư. Hãy để chúng tôi minh họa ý nghĩa nhận thức của nó bằng ví dụ sau.
Giả sử chúng ta cần mô tả thu nhập trung bình của một nhóm người gồm 100 người, trong đó 99 người có thu nhập trong khoảng từ $ 100 đến $ 200 mỗi tháng và thu nhập hàng tháng của nhóm người sau là $ 50.000 (Bảng 1).
Bảng 1 - Thu nhập hàng tháng của nhóm người được nghiên cứu. Nếu chúng ta sử dụng giá trị trung bình số học, chúng ta nhận được thu nhập trung bình khoảng 600 - 700 đô la, điều này có rất ít điểm tương đồng với thu nhập của bộ phận chính trong nhóm. Trung vị, trong trường hợp này là Me = 163 đô la, sẽ cho phép chúng ta mô tả khách quan về mức thu nhập của 99% nhóm người này.
Xem xét định nghĩa của chế độ và trung vị theo dữ liệu được nhóm (chuỗi phân phối).
Giả sử việc phân phối công nhân của toàn bộ xí nghiệp theo biểu thuế có lần xem tiếp theo(Ban 2).
Bảng 2 - Phân bổ công nhân của xí nghiệp theo biểu thuế

Tính toán chế độ và giá trị trung bình cho một chuỗi rời rạc

Tính toán chế độ và giá trị trung bình cho một chuỗi khoảng thời gian

Tính toán chế độ và giá trị trung bình cho một chuỗi biến thể

Xác định chế độ từ một loạt biến thể rời rạc

Chuỗi giá trị tính năng được xây dựng trước đó, được sắp xếp theo giá trị, được sử dụng. Nếu cỡ mẫu là số lẻ, lấy giá trị trung tâm; nếu kích thước mẫu là chẵn, chúng tôi lấy trung bình cộng của hai giá trị trung tâm.
Xác định chế độ từ một loạt biến thể rời rạc: tần số cao nhất(60 người) có loại thuế quan thứ 5, do đó, nó là phương thức. Mo = 5.
Để xác định giá trị trung bình của thuộc tính, số đơn vị trung vị của chuỗi (N Me) được tìm thấy bằng cách sử dụng công thức sau:, với n là thể tích của tổng thể.
Trong trường hợp của chúng ta: .
Nhận giá trị phân số, luôn xảy ra đối với một số đơn vị dân số chẵn, chỉ ra rằng điểm giữa chính xác là từ 95 đến 96 công nhân. Cần phải xác định xem nhóm công nhân nào có số seri. Điều này có thể được thực hiện bằng cách tính toán các tần số tích lũy. Không có công nhân nào có những con số này trong nhóm thứ nhất, nơi chỉ có 12 người và họ không thuộc nhóm thứ hai (12 + 48 = 60). Công nhân thứ 95 và 96 thuộc nhóm thứ ba (12 + 48 + 56 = 116), do đó, mức lương thứ 4 là mức trung bình.

Tính toán chế độ và trung vị trong một chuỗi khoảng thời gian

Không giống như chuỗi biến phân rời rạc, việc xác định chế độ và giá trị trung bình từ chuỗi khoảng thời gian yêu cầu tính toán nhất định dựa trên các công thức sau:
, (5.6)
ở đâu x0- giới hạn dưới của khoảng phương thức (khoảng có tần số cao nhất được gọi là phương thức);
tôi là giá trị của khoảng phương thức;
fMo là tần số của khoảng phương thức;
f Mo-1 là tần số của khoảng trước phương thức;
f Mo +1 là tần số của khoảng thời gian tuân theo phương thức.
(5.7)
ở đâu x0- giới hạn dưới của khoảng trung vị (trung vị là khoảng đầu tiên, tần số tích lũy của khoảng này vượt quá một nửa tổng cộng tần số);
tôi là giá trị của khoảng trung vị;
S Tôi-1- khoảng tích lũy trước khoảng thời gian trung bình;
f Tôi là tần số của khoảng trung vị.
Chúng tôi minh họa ứng dụng của các công thức này bằng cách sử dụng dữ liệu trong Bảng. 3.
Khoảng có ranh giới 60 - 80 trong phân phối này sẽ là phương thức, bởi vì nó có tần số cao nhất. Sử dụng công thức (5.6), chúng tôi xác định chế độ:

Để thiết lập khoảng trung vị, cần phải xác định tần số tích lũy của mỗi khoảng tiếp theo cho đến khi nó vượt quá một nửa tổng các tần số tích lũy (trong trường hợp của chúng tôi là 50%) (Bảng 5.11).
Người ta thấy rằng trung vị là khoảng có ranh giới từ 100 - 120 nghìn rúp. Bây giờ chúng tôi xác định trung vị:

Bảng 3 - Phân bố dân số của Liên bang Nga theo mức thu nhập tiền mặt danh nghĩa bình quân đầu người vào tháng 3 năm 1994
Các nhóm theo mức thu nhập bình quân đầu người hàng tháng, nghìn rúpTỷ lệ dân số,%
lên đến 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Trên 3007,7
Tổng cộng100,0

Bảng 4 - Định nghĩa khoảng trung vị
Do đó, giá trị trung bình cộng, phương thức và trung vị có thể được sử dụng như một đặc tính tổng quát của các giá trị của một thuộc tính nhất định cho các đơn vị của một tập hợp được xếp hạng.
Đặc điểm chính của trung tâm phân phối là giá trị trung bình số học, được đặc trưng bởi thực tế là tất cả các độ lệch so với nó (dương và âm) đều cộng lại bằng không. Điều điển hình cho giá trị trung bình là tổng độ lệch so với nó trong môđun là nhỏ nhất và chế độ là giá trị của đối tượng thường xuyên xảy ra nhất.
Tỷ lệ giữa phương thức, trung vị và trung bình cộng cho biết bản chất của sự phân bố của tính trạng trong tổng thể, cho phép chúng ta đánh giá tính bất đối xứng của nó. Trong phân phối đối xứng, cả ba đặc điểm đều giống nhau. Chênh lệch giữa chế độ và giá trị trung bình số học càng lớn thì chuỗi càng không đối xứng. Đối với các chuỗi có độ lệch vừa phải, sự khác biệt giữa phương thức và giá trị trung bình cộng xấp xỉ ba lần sự khác biệt giữa giá trị trung bình và giá trị trung bình, tức là:
| Mo – `x | = 3 | Tôi –`x |.

Xác định chế độ và trung vị bằng phương pháp đồ thị

Chế độ và trung vị trong một chuỗi khoảng thời gian có thể được xác định bằng đồ thị. Chế độ được xác định từ biểu đồ của phân phối. Để làm điều này, hình chữ nhật cao nhất được chọn, trong trường hợp này là phương thức. Sau đó, chúng tôi kết nối đỉnh bên phải của hình chữ nhật phương thức với góc trên bên phải của hình chữ nhật trước đó. Và đỉnh bên trái của hình chữ nhật phương thức nằm với góc trên bên trái của hình chữ nhật tiếp theo. Từ giao điểm của chúng, chúng tôi hạ thấp vuông góc với trục abscissa. Cơ số của giao điểm của các đường này sẽ là chế độ phân phối (Hình 5.3).


Cơm. 5.3. Định nghĩa đồ họa chế độ biểu đồ.


Cơm. 5.4. Đồ thị xác định giá trị trung bình bằng cách tích lũy
Để xác định trung vị từ một điểm trên thang tần số tích lũy (tần số) tương ứng với 50%, một đường thẳng được vẽ song song với trục abscissa đến giao điểm với tích lũy. Sau đó, từ giao điểm, một đường vuông góc được hạ xuống trục abscissa. Cơ sở của giao điểm là trung tuyến.

Phần tư, Phần phân chia, Phần trăm

Tương tự, với việc tìm giá trị trung bình trong chuỗi phân phối biến thiên, bạn có thể tìm giá trị của một đối tượng cho bất kỳ đơn vị nào của chuỗi được xếp hạng theo thứ tự. Vì vậy, ví dụ: bạn có thể tìm giá trị của một đối tượng địa lý trong các đơn vị chia chuỗi thành bốn phần bằng nhau, thành 10 hoặc 100 phần. Những giá trị này được gọi là "tứ phân vị", "thập phân", "phân vị".
Phần tư là giá trị của một đối tượng địa lý chia dân số trong phạm vi thành 4 phần bằng nhau.
Có một phần tư thấp hơn (Q 1), ngăn cách ¼ dân số với những giá trị nhỏ nhất dấu, và phần tư phía trên (Q 3), cắt bớt ¼ phần bằng giá trị cao nhất dấu hiệu. Điều này có nghĩa là 25% đơn vị dân số sẽ nhỏ hơn Q 1; 25% đơn vị sẽ được bao quanh giữa Q 1 và Q 2; 25% - giữa Q 2 và Q 3, và 25% còn lại cao hơn Q 3. Phần tư giữa của Q 2 là trung vị.
Để tính toán các phần tư theo chuỗi biến thiên khoảng, các công thức sau được sử dụng:
, ,
ở đâu x Q 1- giới hạn dưới của khoảng có chứa phần tư thấp hơn (khoảng được xác định theo tần suất tích lũy, lần đầu tiên vượt quá 25%);
x Q 3- giới hạn dưới của khoảng có chứa phần tư trên (khoảng được xác định bởi tần suất tích lũy, lần đầu tiên vượt quá 75%);
tôi- giá trị khoảng thời gian;
S Q 1-1 là tần số tích lũy của khoảng trước khoảng chứa phần tư thấp hơn;
S Q 3-1 là tần số tích lũy của khoảng trước khoảng chứa phần tư trên;
f Q 1 là tần số của khoảng chứa phần tư thấp hơn;
f Q 3 là tần số của khoảng chứa phần tư trên.
Xem xét tính toán của phần tư dưới và phần tư trên theo Bảng. 5.10. Phần tư thấp hơn nằm trong khoảng 60 - 80, tần suất tích lũy là 33,5%. Phần tư trên nằm trong khoảng 160 - 180 với tần suất tích lũy là 75,8%. Với suy nghĩ này, chúng tôi nhận được:
,
.
Ngoài các phần tư, các số phân vị có thể được xác định trong các rads phân phối biến đổi - các tùy chọn phân chia thứ hạng được xếp hạng chuỗi biến thể thành mười phần bằng nhau. Thập phân đầu tiên (d 1) chia dân số 1/10 thành 9/10, thập phân thứ hai (d 1) 2/10 thành 8/10, v.v.
Chúng được tính theo công thức:
, .
Giá trị tính năng chia chuỗi thành một trăm phần được gọi là phân vị. Tỷ lệ của trung vị, phần tư, phần thập phân và phần trăm được thể hiện trong Hình. 5.5.

Giả sử chúng ta cần xác định mức trung bình trong phân phối điểm của học sinh hoặc trong một mẫu dữ liệu kiểm soát chất lượng. Để làm điều này, bạn cần tính giá trị trung bình của một tập hợp số bằng cách sử dụng hàm MEDIAN.

Hàm này là một cách để đo lường xu hướng trung tâm, tức là vị trí của trung tâm của một bộ số trong phân phối thống kê. Có ba cách phổ biến nhất để xác định xu hướng trung tâm.

    Bần tiện- đây là một giá trị là trung bình cộng, nghĩa là, nó được tính bằng cách cộng một tập hợp số, sau đó chia tổng kết quả cho số của chúng. Ví dụ: giá trị trung bình của các số 2, 3, 3, 5, 7 và 10 là 5 (kết quả của phép chia tổng của các số này là 30 cho số của chúng được 6).

    Trung bình- một số là trung vị của một tập hợp các số: một nửa số có giá trị lớn hơn trung vị và một nửa số có giá trị nhỏ hơn. Ví dụ: trung vị của các số 2, 3, 3, 5, 7 và 10 là 4.

    Thời trang là con số xảy ra thường xuyên nhất trong bộ đã cho những con số. Ví dụ: chế độ cho các số 2, 3, 3, 5, 7 và 10 sẽ là 3.

Với sự phân bố đối xứng của một bộ số, cả ba giá trị của xu hướng trung tâm sẽ trùng nhau. Với phân phối chệch của một tập hợp số, các giá trị có thể khác nhau.

Ảnh chụp màn hình trong bài viết này được chụp trong Excel 2016. Nếu bạn đang sử dụng phiên bản khác, giao diện có thể trông hơi khác một chút, nhưng chức năng thì giống nhau.

Thí dụ

Để làm cho ví dụ này dễ hiểu hơn, hãy sao chép nó vào một trang giấy trắng.

Lời khuyên:Để chuyển đổi giữa xem kết quả và xem công thức trả lại những kết quả đó, hãy nhấn CTRL + `(dấu nháy đơn) hoặc trên tab Công thức trong một nhóm Phụ thuộc Công thức Nhấn nút Hiển thị công thức.

Hàm MEDIAN trong Excel được sử dụng để phân tích phạm vi Giá trị kiểu số và trả về một số nằm giữa tập hợp đang nghiên cứu (số trung vị). Đó là, chức năng nhất định có điều kiện chia tập hợp số thành hai tập hợp con, tập hợp thứ nhất chứa các số nhỏ hơn số trung vị và tập hợp thứ hai - nhiều hơn. Trung vị là một trong một số phương pháp để xác định xu hướng trung tâm của một phạm vi đang được nghiên cứu.

Ví dụ về cách sử dụng hàm MEDIAN trong Excel

Khi nghiên cứu nhóm tuổi sinh viên, dữ liệu từ một nhóm sinh viên được chọn ngẫu nhiên tại trường đại học đã được sử dụng. Nhiệm vụ là xác định tuổi trung bình của học sinh.

Dữ liệu ban đầu:

Công thức tính:


Mô tả đối số:

  • B3: B15 - phạm vi độ tuổi được nghiên cứu.

Kết quả:

Có nghĩa là, có những học sinh trong nhóm có độ tuổi dưới 21 tuổi và lớn hơn giá trị này.



So sánh các hàm MEDIAN và AVERAGE để tính giá trị trung bình

Trong suốt buổi tối ở bệnh viện, nhiệt độ cơ thể của từng bệnh nhân được đo. Chứng minh tính khả thi của việc sử dụng tham số trung vị thay vì giá trị trung bình để khám phá một loạt các giá trị thu được.

Dữ liệu ban đầu:

Công thức tìm giá trị trung bình:

Công thức tìm trung vị:

Như có thể thấy từ giá trị trung bình, nhiệt độ trung bình ở bệnh nhân là trên mức bình thường, nhưng điều này không đúng. Trung bình cho thấy ít nhất một nửa số bệnh nhân có thân nhiệt bình thường, không vượt quá 36,6.

Chú ý! Một phương pháp khác để xác định xu hướng trung tâm là chế độ (giá trị phổ biến nhất trong phạm vi đang nghiên cứu). Để xác định xu hướng trọng tâm trong Excel, hãy sử dụng hàm THỜI TRANG. Lưu ý rằng trong ví dụ này, giá trị trung vị và giá trị chế độ giống nhau:

Nghĩa là, giá trị trung bình chia một tập hợp thành các tập con nhỏ hơn và giá trị lớn cũng là giá trị xuất hiện thường xuyên nhất trong tập hợp. Như bạn thấy, hầu hết bệnh nhân có nhiệt độ là 36,6.

Một ví dụ về cách tính giá trị trung bình trong phân tích thống kê trong Excel

Ví dụ 3. Có 3 nhân viên bán hàng làm việc trong một cửa hàng. Dựa trên kết quả của 10 ngày gần nhất, cần xác định nhân viên sẽ được phát tiền thưởng. Khi chọn người thợ giỏi nhất, người ta phải tính đến mức độ hiệu quả của công việc chứ không phải số lượng hàng bán được.

Bảng dữ liệu nguồn:


Để mô tả hiệu quả, chúng tôi sẽ sử dụng ba chỉ số cùng một lúc: giá trị trung bình, giá trị trung bình và chế độ. Hãy xác định chúng cho từng nhân viên bằng công thức AVERAGE, MEDIAN và FASHION, tương ứng:


Để xác định mức độ phân tán dữ liệu, chúng tôi sử dụng một giá trị Tổng giá trị môđun của sự khác biệt giữa giá trị trung bình và chế độ, giá trị trung bình và giá trị trung vị, tương ứng. Nghĩa là, hệ số x = | av-med | + | av-mod |, trong đó:

  • av - giá trị trung bình;
  • med là trung vị;
  • mod - thời trang.

Tính giá trị của hệ số x cho người bán đầu tiên:

Tương tự, chúng tôi sẽ thực hiện tính toán cho những người bán khác. Kết quả:


Hãy xác định người bán mà tiền thưởng sẽ được trao cho họ:

Lưu ý: Hàm SMALL trả về giá trị đầu tiên giá trị tối thiểu từ phạm vi giá trị được xem xét của hệ số x.


Hệ số x là một số đặc tính định lượng sự ổn định của công việc của người bán, được giới thiệu bởi nhà kinh tế cửa hàng. Với sự trợ giúp của nó, có thể xác định phạm vi với độ lệch giá trị nhỏ nhất. Phương pháp này cho thấy ba phương pháp xác định xu hướng trung tâm có thể được sử dụng cùng một lúc để thu được kết quả đáng tin cậy nhất.

Các tính năng của việc sử dụng hàm MEDIAN trong Excel

Hàm có cú pháp sau:

MEDIAN (number1, [number2], ...)

Mô tả các đối số:

  • number1 là đối số bắt buộc đặc trưng cho giá trị số đầu tiên có trong phạm vi đang nghiên cứu;
  • [number2] - đối số thứ hai tùy chọn (và các đối số tiếp theo, tổng cộng tối đa 255 đối số) mô tả các giá trị thứ hai và tiếp theo của phạm vi đang nghiên cứu.

Ghi chú 1:

  1. Khi tính toán, sẽ thuận tiện hơn khi chuyển toàn bộ phạm vi giá trị được nghiên cứu cùng một lúc thay vì nhập các đối số một cách tuần tự.
  2. Đối số là dữ liệu số, tên chứa số, dữ liệu tham chiếu và mảng (ví dụ, = MEDIAN ((1; 2; 3; 5; 7; 10))).
  3. Khi tính giá trị trung bình, các ô chứa giá trị trống hoặc lôgic TRUE, FALSE, sẽ được hiểu là các giá trị số 1 và 0 tương ứng. Ví dụ: kết quả của việc thực thi một hàm với các giá trị logic trong các đối số (TRUE; FALSE) tương đương với kết quả của việc thực thi với các đối số (1; 0) và bằng 0,5.
  4. Nếu một hoặc nhiều đối số hàm nhận giá trị văn bản không thể chuyển đổi thành giá trị số hoặc chứa mã lỗi, hàm sẽ trả về mã lỗi #VALUE !.
  5. Các phương pháp khác có thể được sử dụng để xác định giá trị trung bình của mẫu. Hàm Excel: PERCENTILE ON, QUARTILE ON, Ví dụ TUYỆT VỜI NHẤT cách sử dụng:
  • = PERCENTILE.ON (A1: A10,0,5) vì theo định nghĩa, giá trị trung bình là phân vị thứ 50.
  • = QUARTILE.ON (A1: A10,2) vì trung vị là phần tư thứ hai.
  • = LARGE (A1: A9; COUNT (A1: A9) / 2), nhưng chỉ khi số lượng trong phạm vi là số lẻ.

Ghi chú 2:

  1. Nếu tất cả các số trong phạm vi đang nghiên cứu được phân phối đối xứng về giá trị trung bình, thì trung bình cộng và trung vị của phạm vi này sẽ tương đương nhau.
  2. Với độ lệch dữ liệu lớn trong phạm vi (“phân tán” giá trị), giá trị trung bình phản ánh tốt hơn xu hướng phân phối giá trị so với giá trị trung bình số học. Một ví dụ tuyệt vời là việc sử dụng trung vị để xác định mức lương thực tế của dân số của một tiểu bang mà các quan chức nhận được một thứ tự quan trọng hơn so với các công dân bình thường.
  3. Phạm vi giá trị được điều tra có thể bao gồm:
  • Số lẻ của các con số. Trong trường hợp này, trung vị sẽ là số ít A chia phạm vi thành hai tập con có giá trị lớn hơn và nhỏ hơn, tương ứng;
  • Một số chẵn. Sau đó, giá trị trung bình được tính là trung bình cộng của hai giá trị số chia tập hợp thành hai tập con được chỉ ra ở trên.