Tiểu sử Đặc trưng Phân tích

Cách tính trung bình số học. Tóm tắt: Giá trị trung bình dùng trong thống kê

Thuật ngữ này có ý nghĩa khác, xem ý nghĩa trung bình.

Trung bình(trong toán học và thống kê) bộ số - tổng của tất cả các số chia cho số của chúng. Đây là một trong những thước đo phổ biến nhất của xu hướng trung tâm.

Nó được đề xuất (cùng với trung bình hình học và trung bình điều hòa) bởi những người theo trường phái Pythagoras.

Các trường hợp đặc biệt của trung bình số học là trung bình (tổng thể) và trung bình mẫu (mẫu).

Giới thiệu

Hãy để chúng tôi biểu thị tập hợp dữ liệu X = (x 1 , x 2 , …, x N), thì giá trị trung bình mẫu thường được biểu thị bằng thanh ngang phía trên biến (x ¯ (\displaystyle (\bar (x))), phát âm là " x bằng một dòng").

Chữ cái Hy Lạp μ được sử dụng để biểu thị giá trị trung bình số học của toàn bộ dân số. Vì biến ngẫu nhiên, trong đó giá trị trung bình được xác định, μ là xác suất trung bình hoặc gia trị được ki vọng biến ngẫu nhiên. Nếu bộ X là một bộ sưu tập Số ngẫu nhiên với giá trị trung bình xác suất μ, thì với bất kỳ mẫu nào x Tôi từ tập hợp này μ = E( x Tôi) là kỳ vọng toán học của mẫu này.

Trong thực tế, sự khác biệt giữa μ và x ¯ (\displaystyle (\bar (x))) là μ là một biến điển hình vì bạn có thể nhìn thấy một mẫu chứ không phải toàn bộ dân số nói chung. Do đó, nếu mẫu được biểu diễn ngẫu nhiên (theo lý thuyết xác suất), thì x ¯ (\displaystyle (\bar (x))) (nhưng không phải μ) có thể được coi là một biến ngẫu nhiên có phân bố xác suất trên mẫu ( phân bố xác suất của giá trị trung bình).

Cả hai đại lượng này đều được tính theo cùng một cách:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Nếu như X là một biến ngẫu nhiên thì kỳ vọng toán học X có thể được coi là giá trị trung bình số học của các giá trị trong các phép đo lặp lại của một đại lượng X. Đây là biểu hiện của quy luật số lượng lớn. Do đó, giá trị trung bình mẫu được sử dụng để ước tính giá trị kỳ vọng chưa biết.

Đại số cơ bản đã chứng minh rằng giá trị trung bình N+ 1 số trên mức trung bình N các số khi và chỉ nếu số mới lớn hơn số trung bình cũ, nhỏ hơn khi và chỉ nếu số mới nhỏ hơn số trung bình, và không thay đổi khi và chỉ khi số mới bằng số trung bình. Nhiều hơn N, sự khác biệt giữa mức trung bình mới và cũ càng nhỏ.

Lưu ý rằng có sẵn một số "giá trị trung bình" khác, bao gồm trung bình lũy thừa, trung bình Kolmogorov, trung bình điều hòa, trung bình hình học số học và các trung bình có trọng số khác nhau (ví dụ: trung bình số học có trọng số, trung bình hình học có trọng số, trung bình điều hòa có trọng số).

Ví dụ

  • ba con số bạn cần cộng chúng lại và chia cho 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Đối với bốn số, bạn cần cộng chúng và chia cho 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Hoặc đơn giản hơn là 5+5=10, 10:2. Bởi vì chúng ta đang cộng 2 số, nghĩa là chúng ta thêm bao nhiêu số thì chia cho số đó.

Biến ngẫu nhiên liên tục

Đối với đại lượng phân bố liên tục f (x) (\displaystyle f(x)), trung bình số học trên khoảng [ a ; b ] (\displaystyle ) được xác định thông qua tích phân xác định:

F(x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Một số vấn đề khi sử dụng số trung bình

Thiếu sự mạnh mẽ

Bài chi tiết: Sự mạnh mẽ trong thống kê

Mặc dù trung bình số học thường được sử dụng làm giá trị trung bình hoặc xu hướng trung tâm, khái niệm này không áp dụng cho số liệu thống kê mạnh, có nghĩa là trung bình số học phải tuân theo ảnh hưởng mạnh mẽ"độ lệch lớn" Đáng chú ý là đối với các phân phối có hệ số sai lệch lớn, giá trị trung bình số học có thể không tương ứng với khái niệm “trung bình” và các giá trị trung bình từ thống kê mạnh mẽ (ví dụ: trung vị) có thể mô tả tốt hơn giá trị trung tâm. xu hướng.

Một ví dụ cổ điển là tính thu nhập trung bình. Giá trị trung bình số học có thể bị hiểu sai thành giá trị trung vị, điều này có thể dẫn đến kết luận rằng có nhiều người có thu nhập cao hơn thực tế. Thu nhập “trung bình” được hiểu là hầu hết mọi người đều có thu nhập quanh con số này. Thu nhập “trung bình” (theo nghĩa là trung bình số học) này cao hơn thu nhập của hầu hết mọi người, vì thu nhập cao với độ lệch lớn so với mức trung bình làm cho trung bình số học bị sai lệch nhiều (ngược lại, thu nhập trung bình ở mức trung bình). “chống lại” sự lệch lạc đó). Tuy nhiên, thu nhập "trung bình" này không nói lên điều gì về số người ở gần mức thu nhập trung bình (và không nói gì về số người ở gần mức thu nhập trung bình). Tuy nhiên, nếu bạn xem nhẹ khái niệm “trung bình” và “hầu hết mọi người”, bạn có thể rút ra kết luận sai lầm rằng hầu hết mọi người đều có thu nhập cao hơn thực tế. Ví dụ, một báo cáo về thu nhập ròng "trung bình" ở Medina, Washington, được tính bằng trung bình số học của tất cả thu nhập ròng hàng năm của cư dân, sẽ mang lại một con số lớn đáng ngạc nhiên nhờ có Bill Gates. Hãy xem xét mẫu (1, 2, 2, 2, 3, 9). Giá trị trung bình số học là 3,17, nhưng 5 trong số 6 giá trị nằm dưới giá trị trung bình này.

Lãi kép

Bài chi tiết: Hoàn lại vốn đầu tư

Nếu những con số nhân, nhưng không nếp gấp, bạn cần sử dụng trung bình hình học, không phải trung bình số học. Sự cố này thường xảy ra nhất khi tính toán lợi tức đầu tư vào tài chính.

Ví dụ: nếu một cổ phiếu giảm 10% trong năm đầu tiên và tăng 30% trong năm thứ hai thì việc tính mức tăng “trung bình” trong hai năm đó là trung bình số học (−10% + 30%) / 2 là không chính xác. = 10%; mức trung bình chính xác trong trường hợp này được tính bằng tốc độ tăng trưởng kép hàng năm, cho tốc độ tăng trưởng hàng năm chỉ khoảng 8,16653826392% ≈ 8,2%.

Lý do cho điều này là tỷ lệ phần trăm mỗi lần đều có điểm bắt đầu mới: 30% là 30% từ một con số nhỏ hơn giá đầu năm đầu tiên: nếu một cổ phiếu bắt đầu ở mức 30 đô la và giảm 10% thì nó có giá trị 27 đô la vào đầu năm thứ hai. Nếu cổ phiếu tăng 30%, nó sẽ có giá trị 35,1 USD vào cuối năm thứ hai. Mức tăng trưởng trung bình số học là 10%, nhưng vì cổ phiếu chỉ tăng 5,1 USD trong 2 năm nên mức tăng trưởng trung bình 8,2% cho kết quả cuối cùng là 35,1 USD:

[$30 (1 - 0,1) (1 + 0,3) = $30 (1 + 0,082) (1 + 0,082) = $35,1]. Nếu chúng ta sử dụng trung bình số học 10% theo cách tương tự, chúng ta sẽ không nhận được giá trị thực: [$30 (1 + 0,1) (1 + 0,1) = $36,3].

Lãi kép cuối 2 năm: 90% * 130% = 117%, tức là tổng mức tăng là 17%, bình quân hàng năm lãi kép 117% ≈ 108,2% (\displaystyle (\sqrt (117\%))\khoảng 108,2\%), tức là mức tăng trung bình hàng năm là 8,2%.

Hướng

Bài chi tiết: Thống kê điểm đến

Khi tính trung bình giá trị số họcĐối với một số biến thay đổi theo chu kỳ (chẳng hạn như pha hoặc góc), phải đặc biệt chú ý. Ví dụ: trung bình của 1° và 359° sẽ là 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Con số này không chính xác vì hai lý do.

  • Trước hết, số đo góc chỉ được xác định trong phạm vi từ 0° đến 360° (hoặc từ 0 đến 2π khi đo bằng radian). Vì vậy, cặp số giống nhau có thể được viết là (1° và −1°) hoặc (1° và 719°). Giá trị trung bình của mỗi cặp sẽ khác nhau: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2 ))=0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\ tròn )) .
  • Thứ hai, ở trong trường hợp này, giá trị 0° (tương đương với 360°) sẽ là giá trị trung bình tốt hơn về mặt hình học, vì các số lệch khỏi 0° ít hơn so với bất kỳ giá trị nào khác (giá trị 0° có phương sai nhỏ nhất). So sánh:
    • số 1° chỉ lệch khỏi 0° 1°;
    • số 1° lệch khỏi giá trị trung bình tính toán là 180° x 179°.

Giá trị trung bình của biến tuần hoàn được tính bằng công thức trên sẽ được dịch chuyển một cách giả tạo so với giá trị trung bình thực về phía giữa dãy số. Do đó, giá trị trung bình được tính theo một cách khác, cụ thể là số có phương sai nhỏ nhất (điểm trung tâm) được chọn làm giá trị trung bình. Ngoài ra, thay vì trừ, khoảng cách mô-đun (nghĩa là khoảng cách chu vi) được sử dụng. Ví dụ: khoảng cách mô-đun giữa 1° và 359° là 2°, không phải 358° (trên vòng tròn giữa 359° và 360°==0° - một độ, từ 0° đến 1° - cũng là 1°, tổng cộng - 2°).

Các loại giá trị trung bình và phương pháp tính toán của chúng

Ở sân khấu xử lý thống kê Có thể đặt ra nhiều vấn đề nghiên cứu khác nhau, để giải quyết được cần phải chọn mức trung bình thích hợp. Trong trường hợp này, cần tuân thủ quy tắc sau: các đại lượng đại diện cho tử số và mẫu số của trung bình phải có mối liên hệ logic với nhau.

  • công suất trung bình;
  • trung bình cấu trúc.

Hãy giới thiệu các quy ước sau:

Các đại lượng được tính giá trị trung bình;

Trung bình, trong đó thanh phía trên biểu thị rằng việc tính trung bình đang diễn ra giá trị cá nhân;

Tần số (độ lặp lại của các giá trị đặc tính riêng lẻ).

Các mức trung bình khác nhau được lấy từ công thức trung bình công suất chung:

(5.1)

khi k = 1 - trung bình số học; k = -1 - trung bình điều hòa; k = 0 - trung bình hình học; k = -2 - căn bậc hai có nghĩa là bình phương.

Giá trị trung bình có thể đơn giản hoặc có trọng số. Trung bình có trọng sốĐây là những giá trị có tính đến việc một số biến thể của giá trị thuộc tính có thể có các số khác nhau và do đó mỗi tùy chọn phải được nhân với số này. Nói cách khác, “tỷ lệ” là số đơn vị tổng hợp trong các nhóm khác nhau, tức là Mỗi tùy chọn đều được “có trọng số” theo tần suất của nó. Tần số f được gọi là trọng lượng thống kê hoặc Trọng lượng trung bình.

trung bình số học- loại trung bình phổ biến nhất. Nó được sử dụng khi phép tính được thực hiện trên dữ liệu thống kê chưa được nhóm, trong đó bạn cần lấy số hạng trung bình. Giá trị trung bình số học là giá trị trung bình của một đặc tính, khi đạt được giá trị đó thì tổng thể tích của đặc tính đó trong tập hợp không thay đổi.

Công thức trung bình số học ( đơn giản) có dạng

trong đó n là quy mô dân số.

Ví dụ: Tiền lương bình quân của nhân viên doanh nghiệp được tính bằng trung bình cộng số học:

Các chỉ tiêu quyết định ở đây là mức lương của từng nhân viên và số lượng nhân viên của doanh nghiệp. Khi tính bình quân, tổng số tiền lương vẫn giữ nguyên nhưng được phân bổ đều cho tất cả người lao động. Ví dụ: bạn cần tính giá trị trung bình tiền lương nhân viên của một công ty nhỏ có 8 người:

Khi tính giá trị trung bình, các giá trị riêng lẻ của đặc tính được lấy trung bình có thể được lặp lại, do đó giá trị trung bình được tính bằng cách sử dụng dữ liệu được nhóm. Trong trường hợp này Chúng ta đang nói về về việc sử dụng trọng số trung bình số học, có dạng

(5.3)

Vì vậy, chúng ta cần tính giá bình quân của cổ phiếu công ty cổ phần khi giao dịch trên sàn chứng khoán. Được biết, giao dịch được thực hiện trong vòng 5 ngày (5 giao dịch), số lượng cổ phiếu bán theo tỷ lệ bán ra được phân bổ như sau:

1 - 800 nghìn. - 1010 chà.

2 - 650 nghìn. - 990 chà.

3 - 700 nghìn. - 1015 chà.

4 - 550 nghìn. - 900 chà.

5 - 850 nghìn. - 1150 chà.

Tỷ số ban đầu để xác định giá cổ phiếu trung bình là tỷ số tổng cộng giao dịch (OSS) với số lượng cổ phiếu bán ra (KPA):

OSS = 1010·800+990·650+1015·700+900·550+1150·850= 3.634.500;

KPA = 800+650+700+550+850=3550.

Trong trường hợp này, giá cổ phiếu trung bình bằng

Cần phải biết các tính chất của trung bình số học, điều này rất quan trọng cho cả việc sử dụng và tính toán. Có ba thuộc tính chính, điều này chủ yếu quyết định việc sử dụng rộng rãi trung bình số học trong các tính toán thống kê và kinh tế.

Tài sản một (số không): tổng độ lệch dương của các giá trị riêng lẻ của một đặc tính so với giá trị trung bình của nó bằng tổng độ lệch tiêu cực. Đây là một thuộc tính rất quan trọng vì nó cho thấy rằng mọi sai lệch (cả + và -) gây ra bởi các lý do ngẫu nhiên sẽ bị loại bỏ lẫn nhau.

Bằng chứng:

Thuộc tính hai (tối thiểu): tổng độ lệch bình phương của các giá trị riêng lẻ của một đặc tính so với giá trị trung bình số học nhỏ hơn bất kỳ số nào khác (a), tức là. có một số lượng tối thiểu.

Bằng chứng.

Hãy tổng hợp tổng độ lệch bình phương từ biến a:

(5.4)

Để tìm cực trị của hàm số này, cần phải đánh đồng đạo hàm của nó theo a bằng 0:

Từ đây chúng tôi nhận được:

(5.5)

Do đó, cực trị của tổng bình phương độ lệch đạt được ở mức . Cực trị này là cực tiểu vì hàm số không thể có cực đại.

Thuộc tính ba: trung bình số học giá trị hiện có bằng hằng số này: với a = const.

Ngoài ba người này những đặc tính quan trọng nhất số học có nghĩa là có cái gọi là đặc tính thiết kế, đang dần mất đi ý nghĩa do việc sử dụng công nghệ máy tính điện tử:

  • nếu giá trị riêng của thuộc tính của mỗi đơn vị được nhân hoặc chia cho số không đổi, thì trung bình số học sẽ tăng hoặc giảm một lượng như nhau;
  • giá trị trung bình số học sẽ không thay đổi nếu trọng số (tần số) của từng giá trị thuộc tính được chia cho một số không đổi;
  • nếu các giá trị riêng lẻ của thuộc tính của từng đơn vị giảm hoặc tăng cùng một lượng thì giá trị trung bình số học sẽ giảm hoặc tăng cùng một lượng.

Ý nghĩa hài hòa. Giá trị trung bình này được gọi là giá trị trung bình số học nghịch đảo vì giá trị này được sử dụng khi k = -1.

Ý nghĩa hài hòa đơn giảnđược sử dụng khi trọng số của các giá trị thuộc tính giống nhau. Công thức của nó có thể được bắt nguồn từ công thức cơ bản, thay k = -1:

Ví dụ, chúng ta cần tính toán tốc độ trung bình hai ô tô đi cùng một quãng đường nhưng với tốc độ khác nhau: ô tô thứ nhất có tốc độ 100 km/h, ô tô thứ hai có tốc độ 90 km/h. Sử dụng phương pháp trung bình điều hòa, chúng tôi tính tốc độ trung bình:

Trong thực hành thống kê, trọng số điều hòa thường được sử dụng nhiều hơn, công thức của nó có dạng

Công thức này được sử dụng trong trường hợp trọng số (hoặc thể tích của hiện tượng) cho mỗi thuộc tính không bằng nhau. Trong tỉ số ban đầu để tính trung bình cộng, tử số đã biết nhưng mẫu số chưa xác định.

Ví dụ: khi tính giá trung bình, chúng ta phải sử dụng tỷ lệ giữa số lượng bán được với số lượng đơn vị bán được. Chúng tôi không biết số lượng đơn vị đã bán (chúng tôi đang nói về các sản phẩm khác nhau), nhưng chúng tôi biết số lượng bán ra của các sản phẩm khác nhau này. Hãy nói rằng chúng ta cần biết giá trung bình hàng đã bán:

Chúng tôi nhận được

trung bình hình học. Thông thường, giá trị trung bình hình học được ứng dụng trong việc xác định tốc độ tăng trưởng trung bình (hệ số tăng trưởng trung bình), khi các giá trị riêng lẻ của một đặc tính được trình bày dưới dạng giá trị tương đối. Nó cũng được sử dụng nếu cần tìm giá trị trung bình giữa mức tối thiểu và giá trị tối đađặc trưng (ví dụ: từ 100 đến 1.000.000). Có các công thức tính trung bình hình học đơn giản và có trọng số.

Đối với một ý nghĩa hình học đơn giản

Đối với giá trị trung bình hình học có trọng số

Trung bình số lượng bậc hai . Lĩnh vực ứng dụng chính của nó là đo lường sự thay đổi của một đặc tính trong tổng hợp (tính trung bình độ lệch vuông).

Công thức bình phương trung bình đơn giản

Công thức bình phương trung bình có trọng số

(5.11)

Kết quả là, chúng ta có thể nói rằng từ sự lựa chọn đúng đắn loại giá trị trung bình trong từng trường hợp cụ thể phụ thuộc giải pháp thành công nhiệm vụ nghiên cứu thống kê. Việc chọn mức trung bình bao gồm trình tự sau:

a) thiết lập chỉ số chung về dân số;

b) xác định mối quan hệ toán học của các đại lượng đối với một chỉ báo chung nhất định;

c) thay thế các giá trị riêng lẻ bằng giá trị trung bình;

d) tính giá trị trung bình bằng cách sử dụng phương trình thích hợp.

Trung bình và biến thiên

giá trị trung bình là một chỉ số tổng quát đặc trưng cho một quần thể đồng nhất về mặt chất lượng theo một tiêu chuẩn nhất định đặc tính định lượng. Ví dụ, tuổi trung bình người bị kết tội trộm cắp.

Trong thống kê tư pháp, giá trị trung bình được sử dụng để mô tả:

Thời gian trung bình để xem xét các trường hợp thuộc loại này;

Kích thước yêu cầu trung bình;

Số bị cáo trung bình mỗi vụ án;

Thiệt hại trung bình;

Khối lượng công việc trung bình của thẩm phán, v.v.

Giá trị trung bình luôn là một giá trị được đặt tên và có cùng chiều với đặc điểm của một đơn vị dân số riêng lẻ. Mỗi giá trị trung bìnhđặc trưng cho dân số đang được nghiên cứu theo bất kỳ một đặc điểm khác nhau nào, do đó, đằng sau bất kỳ mức trung bình nào đều ẩn chứa một loạt phân bổ các đơn vị của dân số này theo đặc điểm đang được nghiên cứu. Việc lựa chọn loại trung bình được xác định bởi nội dung của chỉ báo và dữ liệu ban đầu để tính giá trị trung bình.

Tất cả các loại giá trị trung bình được sử dụng trong nghiên cứu thống kê, được chia thành hai loại:

1) công suất trung bình;

2) trung bình cơ cấu.

Loại trung bình đầu tiên bao gồm: trung bình số học, trung bình điều hòa, trung bình hình học căn bậc hai có nghĩa là bình phương . Loại thứ hai là thời trangTrung bình. Đồng thời, mỗi liệt kê các loại công suất trung bình có thể có hai dạng: đơn giản có trọng lượng . Mâu đơn giản Giá trị trung bình được sử dụng để thu được giá trị trung bình của đặc tính đang được nghiên cứu khi việc tính toán được thực hiện bằng cách sử dụng dữ liệu thống kê chưa được nhóm hoặc khi mỗi tùy chọn trong tổng hợp chỉ xảy ra một lần. Trung bình có trọng số là các giá trị tính đến các biến thể của giá trị thuộc tính có thể có các số khác nhau và do đó mỗi biến thể phải được nhân với tần số tương ứng. Nói cách khác, mỗi tùy chọn được “có trọng số” theo tần suất của nó. Tần số được gọi là trọng số thống kê.

Trung bình số học đơn giản- loại trung bình phổ biến nhất. Nó bằng tổng giá trị cá nhân thuộc tính chia cho Tổng số những giá trị:

,

Ở đâu x 1 ,x 2 , … ,x N là các giá trị riêng lẻ của đặc tính khác nhau (các biến thể) và N là số lượng đơn vị trong quần thể.

Trọng số trung bình số họcđược sử dụng trong trường hợp dữ liệu được trình bày dưới dạng chuỗi hoặc nhóm phân phối. Nó được tính bằng tổng các tích của các tùy chọn và tần số tương ứng của chúng, chia cho tổng tần số của tất cả các tùy chọn:

Ở đâu x tôi- nghĩa Tôi-các biến thể thứ của đặc tính; tôi- Tính thường xuyên Tôi-tùy chọn thứ.

Do đó, mỗi giá trị biến thể được tính trọng số theo tần số của nó, đó là lý do tại sao tần số đôi khi được gọi là trọng số thống kê.

Bình luận. Khi nói đến mức trung bình giá trị số học không chỉ rõ loại của nó thì giá trị trung bình số học rất đơn giản.

Bảng 12.

Giải pháp.Để tính toán, chúng tôi sử dụng công thức trung bình số học có trọng số:

Như vậy, trung bình mỗi vụ án hình sự có hai bị cáo.

Nếu việc tính giá trị trung bình được thực hiện bằng cách sử dụng dữ liệu được nhóm theo dạng chuỗi phân phối khoảng, thì trước tiên bạn cần xác định các giá trị giữa của mỗi khoảng x"i, sau đó tính giá trị trung bình bằng cách sử dụng trung bình trọng số số học công thức trong đó x"i được thay thế thay vì xi.

Ví dụ. Dữ liệu về độ tuổi của tội phạm bị kết tội trộm cắp được trình bày trong bảng:

Bảng 13.

Xác định độ tuổi trung bình của tội phạm bị kết tội trộm cắp.

Giải pháp.Để xác định độ tuổi trung bình của tội phạm dựa trên khoảng thời gian chuỗi biến thể Trước tiên bạn phải tìm các giá trị ở giữa của các khoảng. Vì chúng ta được cho một chuỗi khoảng với mở đầu tiên và các khoảng cuối cùng thì giá trị của các khoảng này được lấy bằng giá trị của các khoảng đóng liền kề. Trong trường hợp của chúng tôi, giá trị của khoảng đầu tiên và khoảng cuối cùng bằng 10.

Bây giờ chúng ta tìm độ tuổi trung bình của tội phạm bằng cách sử dụng công thức trung bình số học có trọng số:

Như vậy, độ tuổi trung bình của tội phạm bị kết tội trộm cắp là khoảng 27 tuổi.

Ý nghĩa hài hòa đơn giản biểu thị nghịch đảo của giá trị trung bình số học của các giá trị nghịch đảo của đặc tính:

ở đâu 1/ x tôigiá trị tương hỗ các lựa chọn, và N là số lượng đơn vị trong dân số.

Ví dụ.Để xác định khối lượng công việc trung bình hàng năm của các thẩm phán tòa án quận khi xét xử các vụ án hình sự, một nghiên cứu về khối lượng công việc của 5 thẩm phán tòa án này đã được tiến hành. Thời gian trung bình dành cho một vụ án hình sự đối với mỗi thẩm phán được khảo sát hóa ra là bằng nhau (tính theo ngày): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Tìm chi phí trung bình cho một vụ án hình sự vụ án hình sự và khối lượng công việc trung bình hàng năm của các thẩm phán của một tòa án quận nhất định khi xem xét các vụ án hình sự.

Giải pháp.Để xác định thời gian trung bình dành cho một vụ án hình sự, chúng tôi sử dụng công thức trung bình hài hòa:

Để đơn giản hóa việc tính toán, trong ví dụ chúng ta lấy số ngày trong một năm là 365, kể cả ngày cuối tuần (điều này không ảnh hưởng đến phương pháp tính toán và khi tính một chỉ tiêu tương tự trong thực tế, cần phải thay thế số ngày làm việc). ngày trong một năm cụ thể thay vì 365 ngày). Khi đó khối lượng công việc trung bình hàng năm của các thẩm phán của một tòa án cấp quận khi xem xét các vụ án hình sự sẽ là: 365 (ngày): 5,56 ≈ 65,6 (vụ án).

Nếu chúng ta sử dụng công thức trung bình số học đơn giản để xác định thời gian trung bình dành cho một vụ án hình sự, chúng ta sẽ nhận được:

365 (ngày): 5,64 ≈ 64,7 (trường hợp), tức là khối lượng công việc trung bình của các thẩm phán hóa ra lại ít hơn.

Hãy kiểm tra tính hợp lệ của phương pháp này. Để làm điều này, chúng tôi sẽ sử dụng dữ liệu về thời gian xử lý một vụ án hình sự của mỗi thẩm phán và tính toán số vụ án hình sự được mỗi thẩm phán xem xét mỗi năm.

Chúng tôi nhận được phù hợp:

365(ngày) : 6 ≈ 61 (trường hợp), 365(ngày) : 5,6 ≈ 65,2 (trường hợp), 365(ngày) : 6,3 ≈ 58 (trường hợp),

365(ngày) : 4,9 ≈ 74,5 (ca), 365(ngày): 5,4 ≈ 68 (ca).

Bây giờ hãy tính khối lượng công việc trung bình hàng năm của các thẩm phán của một tòa án quận nhất định khi xem xét các vụ án hình sự:

Những thứ kia. tải trọng trung bình năm giống như khi sử dụng trung bình điều hòa.

Vì vậy, việc sử dụng số trung bình số học trong trường hợp này là trái pháp luật.

Trong trường hợp đã biết các biến thể của một đặc tính và giá trị thể tích của chúng (tích của các biến thể và tần số), nhưng bản thân tần số không xác định, thì sử dụng công thức trung bình điều hòa có trọng số:

,

Ở đâu x tôi là các giá trị của các tùy chọn thuộc tính và w i là các giá trị thể tích của các tùy chọn ( w tôi = x tôi f tôi).

Ví dụ. Dữ liệu về giá của một đơn vị cùng loại sản phẩm được sản xuất bởi các tổ chức khác nhau của hệ thống hình sự và về khối lượng bán ra của nó được nêu trong Bảng 14.

Bảng 14

Tìm giá bán trung bình của sản phẩm.

Giải pháp. Khi tính giá trung bình, chúng ta phải sử dụng tỷ lệ giữa số lượng bán được với số lượng đơn vị bán được. Chúng ta không biết số lượng đơn vị bán ra, nhưng chúng ta biết số lượng hàng hóa bán ra. Vì vậy, để tìm giá trung bình của hàng hóa bán ra, chúng ta sẽ sử dụng công thức trung bình điều hòa có trọng số. Chúng tôi nhận được

Nếu bạn sử dụng công thức trung bình số học ở đây, bạn có thể nhận được mức giá trung bình không thực tế:

trung bình hình họcđược tính bằng cách trích rút căn bậc N từ tích của tất cả các giá trị của các biến thể thuộc tính:

Ở đâu x 1 ,x 2 , … ,x N– các giá trị riêng lẻ của đặc tính khác nhau (các biến thể) và

N– số lượng đơn vị trong dân số.

Loại trung bình này được sử dụng để tính tốc độ tăng trưởng trung bình của chuỗi thời gian.

Bình phương trung bìnhđược sử dụng để tính độ lệch chuẩn, là một chỉ báo về sự thay đổi và sẽ được thảo luận dưới đây.

Để xác định cơ cấu dân số, các chỉ số trung bình đặc biệt được sử dụng, bao gồm Trung bình thời trang , hay còn gọi là đường trung bình cấu trúc. Nếu giá trị trung bình số học được tính toán dựa trên việc sử dụng tất cả các biến thể của các giá trị thuộc tính thì trung vị và mode sẽ đặc trưng cho giá trị của biến thể chiếm một vị trí trung bình nhất định trong chuỗi được xếp hạng (có thứ tự). Các đơn vị của tổng thể thống kê có thể được sắp xếp theo thứ tự tăng dần hoặc giảm dần của các biến thể của đặc tính đang được nghiên cứu.

Trung Bình (Tôi)– đây là giá trị tương ứng với tùy chọn nằm ở giữa chuỗi xếp hạng. Vì vậy, trung vị là phiên bản của chuỗi xếp hạng, ở cả hai phía của chuỗi này phải có số bằng nhau các đơn vị dân số.

Để tìm số trung vị, trước tiên bạn cần xác định nó số seri trong một dãy xếp hạng theo công thức:

Trong đó N là thể tích của chuỗi (số đơn vị trong tổng thể).

Nếu chuỗi bao gồm một số lẻ các số hạng thì trung vị bằng tùy chọn có số N Me. Nếu chuỗi bao gồm một số số chẵn thì trung vị được định nghĩa là trung bình số học của hai tùy chọn liền kề nằm ở giữa.

Ví dụ. Cho một dãy xếp hạng 1, 2, 3, 3, 6, 7, 9, 9, 10. Khối lượng của dãy đó là N = 9, nghĩa là N Me = (9 + 1) / 2 = 5. Do đó, Me = 6, tức là . lựa chọn thứ năm. Nếu hàng được cho 1, 5, 7, 9, 11, 14, 15, 16, tức là. chuỗi có số số hạng chẵn (N=8) thì N Me = (8 + 1)/2 = 4,5. Điều này có nghĩa là số trung vị bằng một nửa tổng của tùy chọn thứ tư và thứ năm, tức là Tôi = (9 + 11) / 2 = 10.

Trong một chuỗi biến thiên rời rạc, trung vị được xác định bởi tần số tích lũy. Tần số của tùy chọn, bắt đầu từ tần số đầu tiên, được tính tổng cho đến khi vượt quá số trung vị. Giá trị của các tùy chọn tổng hợp cuối cùng sẽ là giá trị trung bình.

Ví dụ. Tìm số bị cáo trung bình trong mỗi vụ án hình sự bằng cách sử dụng dữ liệu trong Bảng 12.

Giải pháp. Trong trường hợp này, số lượng của chuỗi biến thiên là N = 154, do đó, N Me = (154 + 1) / 2 = 77,5. Tổng hợp tần số của tùy chọn thứ nhất và thứ hai, chúng ta nhận được: 75 + 43 = 118, tức là chúng tôi đã vượt qua con số trung bình. Vậy là tôi = 2.

Trong một chuỗi biến thiên theo khoảng, phân phối đầu tiên cho biết khoảng mà trung vị sẽ nằm trong đó. Anh ấy được gọi Trung bình . Đây là quãng đầu tiên có tần số tích lũy vượt quá một nửa âm lượng của chuỗi biến thiên quãng. Khi đó giá trị số của trung vị được xác định theo công thức:

Ở đâu x tôi- giới hạn dưới của khoảng trung vị; i – giá trị của khoảng trung vị; S Me-1- tần số tích lũy của khoảng trước trung vị; f Tôi- tần số của khoảng trung vị.

Ví dụ. Tìm độ tuổi trung bình của những người phạm tội bị kết tội trộm cắp dựa trên số liệu thống kê được trình bày trong Bảng 13.

Giải pháp. Dữ liệu thống kê được trình bày dưới dạng khoảng chuỗi biến thể, có nghĩa là trước tiên chúng ta xác định khoảng trung vị. Khối lượng của dân số là N = 162, do đó, khoảng trung vị là khoảng 18-28, bởi vì đây là quãng đầu tiên có tần số tích lũy (15 + 90 = 105) vượt quá một nửa âm lượng (162: 2 = 81) của chuỗi biến thể quãng. Bây giờ chúng ta xác định giá trị số của trung vị bằng công thức trên:

Như vậy, một nửa số người bị kết tội trộm cắp đều dưới 25 tuổi.

Thời trang (Mo) Họ gọi giá trị của một đặc điểm thường thấy nhất trong các đơn vị dân số. Thời trang được sử dụng để xác định giá trị của một đặc điểm phân phối lớn nhất. Đối với dòng rời rạc, chế độ sẽ là tùy chọn có tần số cao nhất. Ví dụ: đối với chuỗi rời rạc được trình bày trong Bảng 3 Mo= 1, vì giá trị này tương ứng với tần số cao nhất - 75. Để xác định chế độ của chuỗi khoảng, trước tiên hãy xác định phương thức khoảng (khoảng có tần số cao nhất). Sau đó, trong khoảng này, giá trị của đối tượng được tìm thấy, có thể là một chế độ.

Giá trị của nó được tìm thấy bằng công thức:

Ở đâu x Mo- giới hạn dưới của khoảng thời gian; i - giá trị của khoảng thời gian; f Mo- tần số của khoảng thời gian; f Mo-1- tần số của khoảng trước nhịp điệu; f Mo+1– tần số của khoảng theo sau phương thức.

Ví dụ. Tìm tuổi của những tên tội phạm bị kết tội trộm cắp, dữ liệu được trình bày trong Bảng 13.

Giải pháp. Tần số cao nhất tương ứng với khoảng 18-28, do đó, chế độ phải nằm trong khoảng này. Giá trị của nó được xác định theo công thức trên:

Như vậy, số lớn nhất người phạm tội bị kết tội trộm cắp đều 24 tuổi.

Giá trị trung bình cung cấp đặc điểm chung của toàn bộ hiện tượng đang được nghiên cứu. Tuy nhiên, hai quần thể có cùng giá trị trung bình có thể khác nhau đáng kể về mức độ dao động (biến thiên) trong giá trị của đặc tính đang được nghiên cứu. Ví dụ, tại một tòa án, các thời hạn tù sau đây được áp dụng: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 năm và ở một tòa án khác - 5, 5, 6, 6, 7, 7 , 7, 8, 8, 8 tuổi. Trong cả hai trường hợp, trung bình số học là 6,7 năm. Tuy nhiên, các quần thể này khác nhau đáng kể ở chỗ chênh lệch giá trị cá nhân của thời hạn phạt tù được ấn định so với giá trị trung bình.

Và đối với tòa án đầu tiên, nơi mức chênh lệch này khá lớn, thời hạn tù trung bình không phản ánh toàn bộ dân số. Do đó, nếu các giá trị riêng lẻ của một đặc tính khác nhau một chút, thì giá trị trung bình số học sẽ là một đặc tính khá biểu thị về các thuộc tính của một quần thể nhất định. Nếu không, giá trị trung bình số học sẽ là một đặc tính không đáng tin cậy của tổng thể này và việc sử dụng nó trong thực tế sẽ không hiệu quả. Vì vậy, cần phải tính đến sự thay đổi giá trị của đặc tính đang được nghiên cứu.

Biến thể- đây là những khác biệt về giá trị của bất kỳ đặc điểm nào giữa các đơn vị khác nhau của một quần thể nhất định tại cùng một thời điểm hoặc thời điểm. Thuật ngữ “biến thể” có nguồn gốc Latin– variatio, có nghĩa là khác biệt, thay đổi, dao động. Nó phát sinh do thực tế là các giá trị riêng lẻ của một đặc tính được hình thành dưới tác động tổng hợp của nhiều yếu tố (điều kiện) khác nhau, được kết hợp khác nhau trong mỗi yếu tố. trương hợp đặc biệt. tuyệt đối khác nhau và chỉ số tương đối.

Các chỉ số chính của sự thay đổi bao gồm:

1) phạm vi thay đổi;

2) độ lệch tuyến tính trung bình;

3) sự phân tán;

4) độ lệch chuẩn;

5) hệ số biến thiên.

Chúng ta hãy xem xét ngắn gọn từng người trong số họ.

Phạm vi biến đổi R là chỉ số tuyệt đối dễ tiếp cận nhất về mặt dễ tính toán, được định nghĩa là sự khác biệt giữa giá trị lớn nhất và nhỏ nhất của một đặc tính đối với các đơn vị của một dân số nhất định:

Phạm vi biến đổi (phạm vi biến động) – chỉ số quan trọng sự thay đổi của dấu hiệu, nhưng nó chỉ có thể nhìn thấy những sai lệch cực độ, điều này làm hạn chế phạm vi ứng dụng của nó. Để mô tả chính xác hơn sự biến đổi của một tính trạng dựa trên tính biến đổi của nó, các chỉ số khác được sử dụng.

Độ lệch tuyến tính trung bìnhđại diện cho giá trị trung bình số học của giá trị tuyệt đốiđộ lệch của các giá trị riêng lẻ của một đặc tính so với mức trung bình và được xác định bằng các công thức:

1) dữ liệu chưa được nhóm

2) chuỗi biến thể

Tuy nhiên, thước đo độ biến thiên được sử dụng rộng rãi nhất là sự phân tán . Nó đặc trưng cho thước đo độ phân tán của các giá trị của đặc tính đang được nghiên cứu so với giá trị trung bình của nó. Độ phân tán được định nghĩa là bình phương trung bình của độ lệch.

Phương sai đơn giảnđối với dữ liệu chưa được nhóm:

.

Trọng số phương sai cho chuỗi biến thể:

Bình luận. Trong thực tế, tốt hơn nên sử dụng các công thức sau để tính phương sai:

Đối với phương sai đơn giản

.

Đối với phương sai có trọng số

Độ lệch chuẩn là căn bậc hai của phương sai:

Độ lệch chuẩn là thước đo độ tin cậy của giá trị trung bình. Độ lệch chuẩn càng nhỏ thì tổng thể càng đồng nhất và trung bình số học phản ánh toàn bộ tổng thể càng tốt.

Các biện pháp phân tán được thảo luận ở trên (phạm vi biến thiên, độ phân tán, độ lệch chuẩn) là về mặt tuyệt đối, qua đó không phải lúc nào cũng có thể đánh giá mức độ biến đổi của một đặc tính. Trong một số bài toán cần sử dụng các chỉ số tán xạ tương đối, một trong số đó là hệ số biến thiên.

Hệ số biến thiên- tỷ số giữa độ lệch chuẩn và giá trị trung bình số học, được biểu thị bằng phần trăm:

Hệ số biến thiên không chỉ được sử dụng để đánh giá so sánh mức độ biến thiên dấu hiệu khác nhau hoặc cùng một đặc điểm ở các quần thể khác nhau mà còn để biểu thị tính đồng nhất của quần thể. Một tổng thể thống kê được coi là đồng nhất về mặt định lượng nếu hệ số biến thiên không vượt quá 33% (đối với phân phối gần với phân phối chuẩn).

Ví dụ. Dữ liệu sau đây có sẵn về thời hạn bỏ tù của 50 người bị kết án để chấp hành bản án do tòa án tuyên trong trại cải huấn của hệ thống hình sự: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Xây dựng dãy phân chia theo thời hạn phạt tù.

2. Tìm giá trị trung bình, phương sai và độ lệch chuẩn.

3. Tính hệ số biến thiên và đưa ra kết luận về tính đồng nhất hoặc không đồng nhất của tổng thể đang nghiên cứu.

Giải pháp.Để xây dựng một chuỗi phân phối rời rạc, cần xác định các phương án và tần số. Lựa chọn trong bài toán này là thời hạn phạt tù và tần suất là số lượng các lựa chọn riêng lẻ. Tính tần số ta được kết quả sau chuỗi rời rạc phân phối:

Hãy tìm giá trị trung bình và phương sai. Vì dữ liệu thống kê được biểu thị bằng một chuỗi biến thiên rời rạc nên chúng tôi sẽ sử dụng các công thức tính trung bình số học và độ phân tán có trọng số để tính toán chúng. Chúng tôi nhận được:

= = 4,1;

= 5,21.

Bây giờ chúng ta tính độ lệch chuẩn:

Tìm hệ số biến thiên:

Do đó, dân số thống kê không đồng nhất về mặt định lượng.

Trung bình số học đơn giản

Giá trị trung bình

Giá trị trung bình được sử dụng rộng rãi trong thống kê.

giá trị trung bình- đây là một chỉ báo chung trong đó các hành động được thể hiện điều kiện chung, mô hình phát triển của hiện tượng đang được nghiên cứu.

Trung bình thống kê được tính toán trên cơ sở dữ liệu khối lượng từ quan sát được tổ chức thống kê hợp lý (liên tục và có chọn lọc). Tuy nhiên, giá trị trung bình thống kê sẽ khách quan và điển hình nếu nó được tính toán từ dữ liệu đại chúng cho một quần thể đồng nhất về mặt chất lượng ( hiện tượng khối lượng). Ví dụ: nếu bạn tính mức lương trung bình ở các công ty cổ phần và doanh nghiệp nhà nước và mở rộng kết quả cho toàn bộ dân số, thì mức trung bình là hư cấu, vì nó được tính cho một nhóm dân số không đồng nhất và mức trung bình đó sẽ mất tất cả. nghĩa.

Với sự trợ giúp của giá trị trung bình, sự khác biệt về giá trị của một đặc tính phát sinh vì lý do này hay lý do khác trong các đơn vị quan sát riêng lẻ sẽ được giải quyết.

Ví dụ, sản lượng trung bình của một cá nhân nhân viên bán hàng phụ thuộc vào nhiều lý do: trình độ chuyên môn, thời gian làm việc, độ tuổi, hình thức phục vụ, sức khỏe, v.v. Sản lượng trung bình phản ánh đặc điểm chung cả bộ.

Giá trị trung bình được đo bằng cùng đơn vị với chính thuộc tính đó.

Mỗi giá trị trung bình đặc trưng cho dân số đang được nghiên cứu theo bất kỳ một đặc điểm nào. Để có được bức tranh đầy đủ, toàn diện về đối tượng nghiên cứu dựa trên một số đặc điểm cơ bản, cần có một hệ thống giá trị trung bình có thể mô tả hiện tượng từ nhiều góc độ khác nhau.

Hiện hữu các loại khác nhau trung bình:

    trung bình số học;

    ý nghĩa hài hòa;

    trung bình hình học;

    có nghĩa là hình vuông;

    khối trung bình.

Lần lượt, mức trung bình của tất cả các loại được liệt kê ở trên được chia thành đơn giản (không có trọng số) và có trọng số.

Hãy xem xét các loại giá trị trung bình được sử dụng trong thống kê.

Giá trị trung bình số học đơn giản (không có trọng số) bằng tổng các giá trị riêng lẻ của thuộc tính chia cho số lượng các giá trị này.

Các giá trị riêng lẻ của một đặc tính được gọi là các biến thể và được ký hiệu là x i (
); số lượng đơn vị quần thể ký hiệu là n, giá trị trung bình của đặc tính ký hiệu là . Do đó, giá trị trung bình số học đơn giản bằng:

hoặc

Ví dụ 1. Bảng 1

Dữ liệu về công nhân sản xuất sản phẩm A mỗi ca

TRONG trong ví dụ này một tính năng khác nhau là sản xuất sản phẩm theo ca.

Các giá trị số của thuộc tính (16, 17, v.v.) được gọi là tùy chọn. Hãy xác định sản lượng trung bình của công nhân nhóm này:

MÁY TÍNH.

Trung bình số học đơn giản được sử dụng trong trường hợp có các giá trị riêng biệt của một đặc tính, tức là. dữ liệu không được nhóm lại. Nếu dữ liệu được trình bày dưới dạng chuỗi phân phối hoặc nhóm thì giá trị trung bình sẽ được tính theo cách khác.

Trọng số trung bình số học

Trung bình có trọng số số học bằng tổng các tích của từng giá trị riêng lẻ của thuộc tính (biến thể) với tần số tương ứng, chia cho tổng của tất cả các tần số.

Số giá trị giống nhau của một đặc tính trong các hàng phân phối được gọi là tần số hoặc trọng số và được ký hiệu là fi.

Theo đó, giá trị trung bình số học có trọng số trông như thế này:

hoặc

Từ công thức, rõ ràng là giá trị trung bình không chỉ phụ thuộc vào các giá trị của thuộc tính mà còn phụ thuộc vào tần số của chúng, tức là. về thành phần của tổng hợp, về cấu trúc của nó.

Ví dụ 2. ban 2

Dữ liệu lương công nhân

Theo dữ liệu chuỗi phân phối rời rạc, rõ ràng là các giá trị đặc tính giống nhau (các biến thể) được lặp lại nhiều lần. Như vậy, tùy chọn x 1 xảy ra tổng cộng 2 lần và tùy chọn x 2 - 6 lần, v.v.

Hãy tính mức lương trung bình của một công nhân:

Quỹ tiền lương cho từng nhóm công nhân tương đương với sản phẩm tùy chọn tần số (
), và tổng các sản phẩm này tạo ra tổng quỹ tiền lương của tất cả người lao động (
).

Nếu việc tính toán được thực hiện bằng công thức trung bình số học đơn giản, thu nhập trung bình sẽ bằng 3.000 rúp. (). So sánh kết quả thu được với dữ liệu ban đầu, rõ ràng mức lương trung bình phải cao hơn đáng kể (hơn một nửa số công nhân nhận được mức lương trên 3.000 rúp). Do đó, phép tính sử dụng trung bình số học đơn giản trong những trường hợp như vậy sẽ sai.

Kết quả của quá trình xử lý, tài liệu thống kê có thể được trình bày không chỉ ở dạng chuỗi phân bố rời rạc mà còn ở dạng chuỗi biến thiên theo khoảng với các khoảng đóng hoặc mở.

Hãy xem xét việc tính giá trị trung bình số học cho chuỗi như vậy.

Trung bình là:

Giá trị trung bình

Giá trị trung bình - đặc tính số bộ số hoặc hàm; - một số nhất định giữa giá trị nhỏ nhất và lớn nhất của chúng.

  • 1 Thông tin cơ bản
  • 2 Phân cấp trung bình trong toán học
  • 3 Trong lý thuyết xác suất và thống kê
  • 4 Xem thêm
  • 5 lưu ý

Thông tin cơ bản

Điểm khởi đầu cho sự phát triển của lý thuyết về số trung bình là nghiên cứu về tỷ lệ của trường phái Pythagoras. Đồng thời, không có sự phân biệt chặt chẽ giữa các khái niệm về kích thước và tỷ lệ trung bình. Động lực đáng kể cho sự phát triển của lý thuyết về tỷ lệ theo quan điểm số học được đưa ra bởi các nhà toán học Hy Lạp - Nicomachus của Geras (cuối thế kỷ 1 - đầu thế kỷ 2 sau Công nguyên) và Pappus của Alexandria (thế kỷ thứ 3 sau Công nguyên). Giai đoạn đầu tiên trong quá trình phát triển khái niệm số trung bình là giai đoạn mà số trung bình bắt đầu được coi là thành viên trung tâm của một tỷ lệ liên tục. Nhưng khái niệm trung bình là giá trị trung tâm của một cấp số không cho phép rút ra khái niệm trung bình trong mối quan hệ với một dãy gồm n số hạng, bất kể thứ tự chúng theo sau nhau. Để đạt được mục đích này, cần phải sử dụng đến cách khái quát hóa hình thức các giá trị trung bình. Giai đoạn tiếp theo là sự chuyển đổi từ tỷ lệ liên tục sang cấp tiến - số học, hình học và điều hòa.

Trong lịch sử thống kê, lần đầu tiên việc sử dụng rộng rãi số trung bình gắn liền với tên tuổi của nhà khoa học người Anh W. Petty. W. Petty là một trong những người đầu tiên cố gắng gán cho giá trị trung bình một ý nghĩa thống kê, kết nối nó với hạng mục kinh tế. Nhưng Petty không mô tả khái niệm kích thước trung bình hay cô lập nó. A. Quetelet được coi là người sáng lập ra lý thuyết về mức trung bình. Ông là một trong những người đầu tiên phát triển một cách nhất quán lý thuyết về số trung bình, cố gắng cung cấp cơ sở toán học cho nó. A. Quetelet phân biệt hai loại trung bình - trung bình thực tế và trung bình số học. Trên thực tế, số trung bình đại diện cho một thứ, một con số thực sự tồn tại. Trên thực tế, các giá trị trung bình hoặc trung bình thống kê phải được rút ra từ các hiện tượng có cùng chất lượng, giống hệt nhau về ý nghĩa bên trong. Trung bình số học là những con số đưa ra ý tưởng gần nhất có thể về nhiều số, khác nhau, mặc dù đồng nhất.

Mỗi loại trung bình có thể xuất hiện ở dạng trung bình đơn giản hoặc ở dạng trung bình có trọng số. Việc lựa chọn đúng hình thức ở giữa xuất phát từ bản chất vật chất của đối tượng nghiên cứu. Công thức trung bình đơn giản được sử dụng nếu các giá trị riêng lẻ của đặc tính được lấy trung bình không được lặp lại. Khi ở nghiên cứu thực tế các giá trị riêng lẻ của đặc tính đang được nghiên cứu xảy ra nhiều lần trong các đơn vị của tổng thể được nghiên cứu, khi đó tần suất lặp lại các giá trị riêng lẻ của đặc tính đó xuất hiện trong công thức tính công suất trung bình. Trong trường hợp này, chúng được gọi là công thức trung bình có trọng số.

Quỹ Wikimedia. 2010.

Chủ đề 5. Giá trị trung bình làm chỉ tiêu thống kê

Khái niệm giá trị trung bình Phạm vi trung bình trong nghiên cứu thống kê

Giá trị trung bình được sử dụng ở giai đoạn xử lý và tóm tắt dữ liệu thống kê sơ cấp thu được. Nhu cầu xác định các giá trị trung bình là do, theo quy luật, các giá trị riêng lẻ có cùng đặc điểm đối với các đơn vị quần thể khác nhau được nghiên cứu là không giống nhau.

Kích thước trung bìnhđược gọi là chỉ số mô tả giá trị tổng quát của một đặc điểm hoặc một nhóm đặc điểm trong dân số đang được nghiên cứu.

Nếu một dân số có chất lượng đặc điểm đồng nhất, thì giá trị trung bình xuất hiện ở đây dưới dạng trung bình điển hình. Ví dụ: đối với các nhóm công nhân trong một ngành nhất định có mức thu nhập cố định, mức chi tiêu trung bình điển hình cho các nhu cầu cơ bản được xác định, tức là. mức trung bình điển hình khái quát hóa các giá trị đồng nhất về mặt chất lượng của thuộc tính trong một dân số nhất định, tức là phần chi phí giữa những người lao động thuộc nhóm này đối với các hàng hóa thiết yếu.

Khi nghiên cứu một dân số có các đặc điểm không đồng nhất về chất lượng, tính không điển hình của các chỉ số trung bình có thể xuất hiện. Ví dụ, đây là những chỉ số trung bình về thu nhập quốc dân bình quân đầu người (khác nhau) nhóm tuổi), năng suất ngũ cốc trung bình trên khắp nước Nga (các vùng có vùng khí hậu khác nhau và các loại cây ngũ cốc khác nhau), tỷ lệ sinh trung bình ở tất cả các vùng trong nước, nhiệt độ trung bình trên Thời kỳ nhất định vân vân. Ở đây, các giá trị trung bình khái quát hóa các giá trị không đồng nhất về mặt chất lượng của các đặc điểm hoặc các tập hợp không gian hệ thống (cộng đồng quốc tế, lục địa, tiểu bang, khu vực, khu vực, v.v.) hoặc các tập hợp động kéo dài theo thời gian (thế kỷ, thập kỷ, năm, mùa, v.v.). ) . Giá trị trung bình như vậy được gọi là trung bình hệ thống.

Như vậy, ý nghĩa của các giá trị trung bình nằm ở hàm tổng quát hóa của chúng. Giá trị trung bình thay thế một số lượng lớn các giá trị riêng lẻ của đặc tính, tiết lộ Thuộc tính chung, vốn có trong tất cả các đơn vị dân số. Điều này, đến lượt nó, có thể tránh được các nguyên nhân ngẫu nhiên và xác định mẫu chung vì lý do chung.

Các loại giá trị trung bình và phương pháp tính toán của chúng

Ở giai đoạn xử lý thống kê, có thể đặt ra nhiều vấn đề nghiên cứu khác nhau, để giải quyết vấn đề đó cần phải chọn mức trung bình thích hợp. Trong trường hợp này, cần tuân thủ quy tắc sau: các đại lượng đại diện cho tử số và mẫu số của trung bình phải có mối liên hệ logic với nhau.

    công suất trung bình;

    trung bình cấu trúc.

Hãy giới thiệu các quy ước sau:

Các đại lượng được tính giá trị trung bình;

Trung bình, trong đó thanh phía trên biểu thị rằng việc lấy trung bình các giá trị riêng lẻ diễn ra;

Tần số (độ lặp lại của các giá trị đặc tính riêng lẻ).

Các mức trung bình khác nhau được lấy từ công thức trung bình công suất chung:

(5.1)

khi k = 1 - trung bình số học; k = -1 - trung bình điều hòa; k = 0 - trung bình hình học; k = -2 - căn bậc hai có nghĩa là bình phương.

Giá trị trung bình có thể đơn giản hoặc có trọng số. Trung bình có trọng sốĐây là những giá trị có tính đến việc một số biến thể của giá trị thuộc tính có thể có các số khác nhau và do đó mỗi tùy chọn phải được nhân với số này. Nói cách khác, “tỷ lệ” là số đơn vị tổng hợp trong các nhóm khác nhau, tức là Mỗi tùy chọn đều được “có trọng số” theo tần suất của nó. Tần số f được gọi là trọng lượng thống kê hoặc trọng lượng trung bình.

trung bình số học- loại trung bình phổ biến nhất. Nó được sử dụng khi phép tính được thực hiện trên dữ liệu thống kê chưa được nhóm, trong đó bạn cần lấy số hạng trung bình. Giá trị trung bình số học là giá trị trung bình của một đặc tính, khi đạt được giá trị đó thì tổng thể tích của đặc tính đó trong tập hợp không thay đổi.

Công thức tính trung bình số học (đơn giản) có dạng

trong đó n là quy mô dân số.

Ví dụ: Tiền lương bình quân của nhân viên doanh nghiệp được tính bằng trung bình cộng số học:


Các chỉ tiêu quyết định ở đây là mức lương của từng nhân viên và số lượng nhân viên của doanh nghiệp. Khi tính bình quân, tổng số tiền lương vẫn giữ nguyên nhưng được phân bổ đều cho tất cả người lao động. Ví dụ: bạn cần tính mức lương trung bình của công nhân trong một công ty nhỏ có 8 người:

Khi tính giá trị trung bình, các giá trị riêng lẻ của đặc tính được lấy trung bình có thể được lặp lại, do đó giá trị trung bình được tính bằng cách sử dụng dữ liệu được nhóm. Trong trường hợp này chúng ta đang nói về việc sử dụng trọng số trung bình số học, có dạng

(5.3)

Vì vậy, chúng ta cần tính giá bình quân của cổ phiếu công ty cổ phần khi giao dịch trên sàn chứng khoán. Được biết, giao dịch được thực hiện trong vòng 5 ngày (5 giao dịch), số lượng cổ phiếu bán theo tỷ lệ bán ra được phân bổ như sau:

    1 - 800 nghìn. - 1010 chà.

    2 - 650 nghìn. - 990 chà.

    3 - 700 nghìn. - 1015 chà.

    4 - 550 nghìn. - 900 chà.

    5 - 850 nghìn. - 1150 chà.

Tỷ lệ ban đầu để xác định giá bình quân của cổ phiếu là tỷ lệ giữa tổng lượng giao dịch (TVA) trên số lượng cổ phiếu bán ra (KPA):

OSS = 1010·800+990·650+1015·700+900·550+1150·850= 3.634.500;

KPA = 800+650+700+550+850=3550.

Trong trường hợp này, giá cổ phiếu trung bình bằng

Cần phải biết các tính chất của trung bình số học, điều này rất quan trọng cho cả việc sử dụng và tính toán. Chúng ta có thể phân biệt ba đặc tính chính quyết định việc sử dụng rộng rãi trung bình số học trong các phép tính thống kê và kinh tế.

Thuộc tính một (không): tổng độ lệch dương của các giá trị riêng lẻ của một đặc tính so với giá trị trung bình của nó bằng tổng độ lệch âm. Đây là một thuộc tính rất quan trọng vì nó cho thấy rằng mọi sai lệch (cả + và -) gây ra bởi các lý do ngẫu nhiên sẽ bị loại bỏ lẫn nhau.

Bằng chứng:

Thuộc tính hai (tối thiểu): tổng độ lệch bình phương của các giá trị riêng lẻ của một đặc tính so với giá trị trung bình số học nhỏ hơn bất kỳ số nào khác (a), tức là. có một số lượng tối thiểu.

Bằng chứng.

Hãy tổng hợp tổng độ lệch bình phương từ biến a:

(5.4)

Để tìm cực trị của hàm số này, cần phải đánh đồng đạo hàm của nó theo a bằng 0:

Từ đây chúng tôi nhận được:

(5.5)

Do đó, cực trị của tổng bình phương độ lệch đạt được ở mức . Cực trị này là cực tiểu vì hàm số không thể có cực đại.

Thuộc tính thứ ba: trung bình số học của một giá trị không đổi bằng hằng số này: với a = const.

Ngoài ba thuộc tính quan trọng nhất của trung bình số học, còn có cái gọi là đặc tính thiết kế, đang dần mất đi ý nghĩa do việc sử dụng công nghệ máy tính điện tử:

    nếu nhân hoặc chia giá trị riêng của thuộc tính của từng đơn vị cho một số không đổi thì giá trị trung bình số học sẽ tăng hoặc giảm một lượng như nhau;

    giá trị trung bình số học sẽ không thay đổi nếu trọng số (tần số) của từng giá trị thuộc tính được chia cho một số không đổi;

    nếu các giá trị riêng lẻ của thuộc tính của từng đơn vị giảm hoặc tăng cùng một lượng thì giá trị trung bình số học sẽ giảm hoặc tăng cùng một lượng.

Ý nghĩa hài hòa. Giá trị trung bình này được gọi là giá trị trung bình số học nghịch đảo vì giá trị này được sử dụng khi k = -1.

Ý nghĩa hài hòa đơn giảnđược sử dụng khi trọng số của các giá trị thuộc tính giống nhau. Công thức của nó có thể được suy ra từ công thức cơ bản bằng cách thay k = -1:

Ví dụ: chúng ta cần tính tốc độ trung bình của hai ô tô đi trên cùng một con đường nhưng ở các tốc độ khác nhau: ô tô thứ nhất có tốc độ 100 km/h, ô tô thứ hai có tốc độ 90 km/h. Sử dụng phương pháp trung bình điều hòa, chúng tôi tính tốc độ trung bình:

Trong thực hành thống kê, trọng số điều hòa thường được sử dụng nhiều hơn, công thức của nó có dạng

Công thức này được sử dụng trong trường hợp trọng số (hoặc thể tích của hiện tượng) cho mỗi thuộc tính không bằng nhau. Trong tỉ số ban đầu để tính trung bình cộng, tử số đã biết nhưng mẫu số chưa xác định.

Cách tính trung bình cộng các số trong Excel

Tìm mức trung bình số học trong Excel bạn có thể sử dụng hàm.

Cú pháp TRUNG BÌNH

=AVERAGE(số1,[số2],…) - Phiên bản tiếng Nga

Đối số TRUNG BÌNH

  • số 1- số hoặc dãy số đầu tiên dùng để tính trung bình số học;
  • số 2(Tùy chọn) – số thứ hai hoặc dãy số để tính giá trị trung bình số học. Số tiền tối đađối số hàm – 255.

Để tính toán, hãy làm theo các bước sau:

  • Chọn bất kỳ ô nào;
  • Viết công thức vào đó =TRUNG BÌNH(
  • Chọn phạm vi ô mà bạn muốn thực hiện phép tính;
  • Nhấn phím “Enter” trên bàn phím của bạn

Hàm sẽ tính giá trị trung bình trong phạm vi được chỉ định trong số các ô chứa số.

Cách tìm văn bản trung bình đã cho

Nếu có dòng hoặc văn bản trống trong phạm vi dữ liệu, hàm sẽ coi chúng là “không”. Nếu trong số dữ liệu có biểu thức logic FALSE hoặc TRUE thì hàm sẽ coi FALSE là “không” và TRUE là “1”.

Cách tìm giá trị trung bình số học theo điều kiện

Để tính giá trị trung bình theo điều kiện hoặc tiêu chí, hãy sử dụng hàm. Ví dụ: hãy tưởng tượng rằng chúng tôi có dữ liệu về doanh số bán sản phẩm:

Nhiệm vụ của chúng ta là tính giá trị trung bình của doanh số bán bút. Để làm điều này, chúng tôi sẽ thực hiện các bước sau:

  • Trong một tế bào A13 ghi tên sản phẩm “Bút”;
  • Trong một tế bào B13 hãy giới thiệu công thức:

=AVERAGEIF(A2:A10,A13,B2:B10)

Phạm vi ô “ A2:A10” cho biết danh sách các sản phẩm mà chúng ta sẽ tìm kiếm từ “Bút”. Lý lẽ A13đây là liên kết đến một ô có văn bản mà chúng tôi sẽ tìm kiếm trong toàn bộ danh sách sản phẩm. Phạm vi ô “ B2:B10” là một dải có dữ liệu bán sản phẩm, trong đó hàm sẽ tìm “Tay cầm” và tính giá trị trung bình.


Trong quá trình học toán, học sinh được làm quen với khái niệm trung bình số học. Trong tương lai, trong thống kê và một số ngành khoa học khác, học sinh phải đối mặt với những phép tính của người khác, chúng có thể là gì và chúng khác nhau như thế nào?

ý nghĩa và sự khác biệt

Các chỉ số chính xác không phải lúc nào cũng cung cấp sự hiểu biết về tình hình. Để đánh giá một tình huống cụ thể, đôi khi cần phải phân tích số lượng lớn con số Và sau đó mức trung bình đến giải cứu. Chúng cho phép chúng ta đánh giá tình hình một cách tổng thể.

Kể từ thời đi học, nhiều người lớn đã nhớ đến sự tồn tại của trung bình số học. Cách tính rất đơn giản - tổng của một dãy n số hạng được chia cho n. Nghĩa là, nếu bạn cần tính trung bình số học trong chuỗi giá trị 27, 22, 34 và 37, thì bạn cần giải biểu thức (27+22+34+37)/4, vì 4 giá trị ​được sử dụng trong các tính toán. Trong trường hợp này, giá trị bắt buộc sẽ là 30.

Thường ở trong khóa họcÝ nghĩa hình học cũng được nghiên cứu. Phép tính giá trị đã cho dựa trên việc trích xuất căn bậc n của tích của n số hạng. Nếu chúng ta lấy các số giống nhau: 27, 22, 34 và 37 thì kết quả của phép tính sẽ bằng 29,4.

Ý nghĩa hài hòa trong Trường cấp hai thường không phải là chủ đề nghiên cứu. Tuy nhiên, nó được sử dụng khá thường xuyên. Giá trị này là nghịch đảo của trung bình số học và được tính bằng thương số của n - số lượng các giá trị và tổng 1/a 1 +1/a 2 +...+1/a n. Nếu chúng ta lấy lại số đó để tính toán thì hài sẽ là 29,6.

Trung bình có trọng số: tính năng

Tuy nhiên, tất cả các giá trị trên có thể không được sử dụng ở mọi nơi. Ví dụ, trong thống kê, khi tính toán một số vai trò quan trọng có "trọng số" của mỗi số được sử dụng trong phép tính. Các kết quả mang tính biểu thị và chính xác hơn vì chúng tính đến nhiều thông tin hơn. Nhóm đại lượng này được tên gọi chung "bình quân gia quyền“Chúng không được dạy ở trường nên rất đáng để xem xét chúng chi tiết hơn.

Trước hết, cần phải nói “trọng lượng” của một giá trị cụ thể nghĩa là gì. Cách dễ nhất để giải thích điều này là ví dụ cụ thể. Hai lần một ngày tại bệnh viện, nhiệt độ cơ thể của từng bệnh nhân được đo. Trong số 100 bệnh nhân ở các khoa khác nhau của bệnh viện, 44 người sẽ có nhiệt độ bình thường - 36,6 độ. 30 khác sẽ có giá trị tăng lên - 37,2, 14 - 38, 7 - 38,5, 3 - 39 và hai số còn lại - 40. Và nếu chúng ta lấy trung bình số học, thì giá trị này nói chung đối với bệnh viện sẽ lớn hơn 38 độ! Nhưng gần một nửa số bệnh nhân hoàn toàn có Và ở đây sẽ chính xác hơn nếu sử dụng giá trị trung bình có trọng số và “trọng số” của mỗi giá trị sẽ là số người. Trong trường hợp này, kết quả tính toán sẽ là 37,25 độ. Sự khác biệt là rõ ràng.

Trong trường hợp tính toán trung bình có trọng số, “trọng lượng” có thể được coi là số lượng lô hàng, số người làm việc trong một ngày nhất định, nói chung là bất kỳ thứ gì có thể đo lường được và ảnh hưởng đến kết quả cuối cùng.

Đẳng cấp

Giá trị trung bình có trọng số liên quan đến giá trị trung bình số học được thảo luận ở đầu bài viết. Tuy nhiên, giá trị đầu tiên, như đã đề cập, cũng tính đến trọng số của từng số được sử dụng trong phép tính. Ngoài ra còn có các giá trị hình học và điều hòa có trọng số.

Có một biến thể thú vị khác được sử dụng trong dãy số. Đây là một đường trung bình động có trọng số. Đó là trên cơ sở này mà các xu hướng được tính toán. Ngoài bản thân các giá trị và trọng lượng của chúng, tính tuần hoàn cũng được sử dụng ở đó. Và khi tính giá trị trung bình tại một thời điểm nào đó, các giá trị cho khoảng thời gian trước đó cũng được tính đến.

Việc tính toán tất cả các giá trị này không khó lắm, nhưng trong thực tế, người ta thường chỉ sử dụng giá trị trung bình có trọng số thông thường.

Phương pháp tính toán

Trong thời đại tin học hóa rộng rãi, không cần thiết phải tính trung bình trọng số một cách thủ công. Tuy nhiên, sẽ rất hữu ích nếu biết công thức tính toán để bạn có thể kiểm tra và điều chỉnh kết quả thu được nếu cần.

Cách dễ nhất là xem xét phép tính bằng một ví dụ cụ thể.

Cần phải tìm hiểu mức lương trung bình ở doanh nghiệp này là bao nhiêu, có tính đến số lượng công nhân nhận được mức lương này hay mức lương khác.

Vì vậy, giá trị trung bình có trọng số được tính theo công thức sau:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Ví dụ: phép tính sẽ như thế này:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Rõ ràng, không có khó khăn đặc biệt nào trong việc tính toán trung bình có trọng số theo cách thủ công. Công thức tính giá trị này trong một trong những ứng dụng công thức phổ biến nhất - Excel - trông giống như hàm SUMPRODVEL (chuỗi số; chuỗi trọng số) / SUM (chuỗi trọng số).

giá trị trung bình- đây là một chỉ số chung đặc trưng cho một quần thể đồng nhất về chất theo một đặc tính định lượng nhất định. Ví dụ, độ tuổi trung bình của những người bị kết tội trộm cắp.

Trong thống kê tư pháp, giá trị trung bình được sử dụng để mô tả:

Thời gian trung bình để xem xét các trường hợp thuộc loại này;

Kích thước yêu cầu trung bình;

Số bị cáo trung bình mỗi vụ án;

Thiệt hại trung bình;

Khối lượng công việc trung bình của thẩm phán, v.v.

Giá trị trung bình luôn là một giá trị được đặt tên và có cùng chiều với đặc điểm của một đơn vị dân số riêng lẻ. Mỗi giá trị trung bình đặc trưng cho tổng thể đang được nghiên cứu theo bất kỳ một đặc điểm khác nhau nào, do đó, đằng sau mỗi giá trị trung bình là một chuỗi phân bố các đơn vị của tổng thể này theo đặc điểm đang được nghiên cứu. Việc lựa chọn loại trung bình được xác định bởi nội dung của chỉ báo và dữ liệu ban đầu để tính giá trị trung bình.

Tất cả các loại giá trị trung bình được sử dụng trong nghiên cứu thống kê được chia thành hai loại:

1) công suất trung bình;

2) trung bình cơ cấu.

Loại trung bình đầu tiên bao gồm: trung bình số học, trung bình điều hòa, trung bình hình học căn bậc hai có nghĩa là bình phương . Loại thứ hai là thời trangTrung bình. Hơn nữa, mỗi loại công suất trung bình được liệt kê có thể có hai dạng: đơn giản có trọng lượng . Dạng trung bình đơn giản được sử dụng để thu được giá trị trung bình của đặc tính đang được nghiên cứu khi phép tính được thực hiện trên dữ liệu thống kê chưa được nhóm hoặc khi mỗi tùy chọn trong tổng hợp chỉ xảy ra một lần. Trung bình có trọng số là các giá trị tính đến các biến thể của giá trị thuộc tính có thể có các số khác nhau và do đó mỗi biến thể phải được nhân với tần số tương ứng. Nói cách khác, mỗi tùy chọn được “có trọng số” theo tần suất của nó. Tần số được gọi là trọng số thống kê.

Trung bình số học đơn giản- loại trung bình phổ biến nhất. Nó bằng tổng các giá trị riêng lẻ của thuộc tính chia cho tổng số các giá trị này:

Ở đâu x 1 ,x 2 , … ,x N là các giá trị riêng lẻ của đặc tính khác nhau (các biến thể) và N là số lượng đơn vị trong quần thể.

Trọng số trung bình số họcđược sử dụng trong trường hợp dữ liệu được trình bày dưới dạng chuỗi hoặc nhóm phân phối. Nó được tính bằng tổng các tích của các tùy chọn và tần số tương ứng của chúng, chia cho tổng tần số của tất cả các tùy chọn:

Ở đâu x tôi- nghĩa Tôi các biến thể của đặc tính; tôi- Tính thường xuyên Tôi tùy chọn thứ.

Do đó, mỗi giá trị biến thể được tính trọng số theo tần số của nó, đó là lý do tại sao tần số đôi khi được gọi là trọng số thống kê.


Bình luận. Khi chúng ta nói về trung bình số học mà không chỉ ra loại của nó, chúng ta muốn nói đến trung bình số học đơn giản.

Bảng 12.

Giải pháp.Để tính toán, chúng tôi sử dụng công thức trung bình số học có trọng số:

Như vậy, trung bình mỗi vụ án hình sự có hai bị cáo.

Nếu việc tính giá trị trung bình được thực hiện bằng cách sử dụng dữ liệu được nhóm theo dạng chuỗi phân phối khoảng, thì trước tiên bạn cần xác định các giá trị giữa của mỗi khoảng x"i, sau đó tính giá trị trung bình bằng cách sử dụng trung bình trọng số số học công thức trong đó x"i được thay thế thay vì xi.

Ví dụ. Dữ liệu về độ tuổi của tội phạm bị kết tội trộm cắp được trình bày trong bảng:

Bảng 13.

Xác định độ tuổi trung bình của tội phạm bị kết tội trộm cắp.

Giải pháp.Để xác định độ tuổi trung bình của tội phạm dựa trên chuỗi biến thiên khoảng, trước tiên cần tìm các giá trị ở giữa của các khoảng. Vì một chuỗi khoảng với các khoảng mở đầu tiên và cuối cùng được đưa ra, nên giá trị của các khoảng này được lấy bằng giá trị của các khoảng đóng liền kề. Trong trường hợp của chúng tôi, giá trị của khoảng đầu tiên và khoảng cuối cùng bằng 10.

Bây giờ chúng ta tìm độ tuổi trung bình của tội phạm bằng cách sử dụng công thức trung bình số học có trọng số:

Như vậy, độ tuổi trung bình của tội phạm bị kết tội trộm cắp là khoảng 27 tuổi.

Ý nghĩa hài hòa đơn giản biểu thị nghịch đảo của giá trị trung bình số học của các giá trị nghịch đảo của đặc tính:

ở đâu 1/ x tôi là các giá trị nghịch đảo của các tùy chọn và N là số đơn vị trong dân số.

Ví dụ.Để xác định khối lượng công việc trung bình hàng năm của các thẩm phán tòa án quận khi xét xử các vụ án hình sự, một nghiên cứu về khối lượng công việc của 5 thẩm phán tòa án này đã được tiến hành. Thời gian trung bình dành cho một vụ án hình sự đối với mỗi thẩm phán được khảo sát hóa ra là bằng nhau (tính theo ngày): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Tìm chi phí trung bình cho một vụ án hình sự vụ án hình sự và khối lượng công việc trung bình hàng năm của các thẩm phán của một tòa án quận nhất định khi xem xét các vụ án hình sự.

Giải pháp.Để xác định thời gian trung bình dành cho một vụ án hình sự, chúng tôi sử dụng công thức trung bình hài hòa:

Để đơn giản hóa việc tính toán, trong ví dụ chúng ta lấy số ngày trong một năm là 365, kể cả ngày cuối tuần (điều này không ảnh hưởng đến phương pháp tính toán và khi tính một chỉ tiêu tương tự trong thực tế, cần phải thay thế số ngày làm việc). ngày trong một năm cụ thể thay vì 365 ngày). Khi đó khối lượng công việc trung bình hàng năm của các thẩm phán của một tòa án cấp quận khi xem xét các vụ án hình sự sẽ là: 365 (ngày): 5,56 ≈ 65,6 (vụ án).

Nếu chúng ta sử dụng công thức trung bình số học đơn giản để xác định thời gian trung bình dành cho một vụ án hình sự, chúng ta sẽ nhận được:

365 (ngày): 5,64 ≈ 64,7 (trường hợp), tức là khối lượng công việc trung bình của các thẩm phán hóa ra lại ít hơn.

Hãy kiểm tra tính hợp lệ của phương pháp này. Để làm điều này, chúng tôi sẽ sử dụng dữ liệu về thời gian xử lý một vụ án hình sự của mỗi thẩm phán và tính toán số vụ án hình sự được mỗi thẩm phán xem xét mỗi năm.

Chúng tôi nhận được phù hợp:

365(ngày) : 6 ≈ 61 (trường hợp), 365(ngày) : 5,6 ≈ 65,2 (trường hợp), 365(ngày) : 6,3 ≈ 58 (trường hợp),

365(ngày) : 4,9 ≈ 74,5 (ca), 365(ngày): 5,4 ≈ 68 (ca).

Bây giờ hãy tính khối lượng công việc trung bình hàng năm của các thẩm phán của một tòa án quận nhất định khi xem xét các vụ án hình sự:

Những thứ kia. tải trọng trung bình năm giống như khi sử dụng trung bình điều hòa.

Vì vậy, việc sử dụng số trung bình số học trong trường hợp này là trái pháp luật.

Trong trường hợp đã biết các biến thể của một đặc tính và giá trị thể tích của chúng (tích của các biến thể và tần số), nhưng bản thân tần số không xác định, thì sử dụng công thức trung bình điều hòa có trọng số:

,

Ở đâu x tôi là các giá trị của các tùy chọn thuộc tính và w i là các giá trị thể tích của các tùy chọn ( w tôi = x tôi f tôi).

Ví dụ. Dữ liệu về giá của một đơn vị cùng loại sản phẩm được sản xuất bởi các tổ chức khác nhau của hệ thống hình sự và về khối lượng bán ra của nó được nêu trong Bảng 14.

Bảng 14

Tìm giá bán trung bình của sản phẩm.

Giải pháp. Khi tính giá trung bình, chúng ta phải sử dụng tỷ lệ giữa số lượng bán được với số lượng đơn vị bán được. Chúng ta không biết số lượng đơn vị bán ra, nhưng chúng ta biết số lượng hàng hóa bán ra. Vì vậy, để tìm giá trung bình của hàng hóa bán ra, chúng ta sẽ sử dụng công thức trung bình điều hòa có trọng số. Chúng tôi nhận được

Nếu bạn sử dụng công thức trung bình số học ở đây, bạn có thể nhận được mức giá trung bình không thực tế:

trung bình hình họcđược tính bằng cách trích rút căn bậc N từ tích của tất cả các giá trị của các biến thể thuộc tính:

,

Ở đâu x 1 ,x 2 , … ,x N- các giá trị riêng lẻ của đặc tính khác nhau (các biến thể) và

N- số lượng đơn vị trong dân số.

Loại trung bình này được sử dụng để tính tốc độ tăng trưởng trung bình của chuỗi thời gian.

Bình phương trung bìnhđược sử dụng để tính độ lệch chuẩn, là một chỉ báo về sự thay đổi và sẽ được thảo luận dưới đây.

Để xác định cơ cấu dân số, các chỉ số trung bình đặc biệt được sử dụng, bao gồm Trung bình thời trang , hay còn gọi là đường trung bình cấu trúc. Nếu giá trị trung bình số học được tính toán dựa trên việc sử dụng tất cả các biến thể của các giá trị thuộc tính thì trung vị và mode sẽ đặc trưng cho giá trị của biến thể chiếm một vị trí trung bình nhất định trong chuỗi được xếp hạng (có thứ tự). Các đơn vị của tổng thể thống kê có thể được sắp xếp theo thứ tự tăng dần hoặc giảm dần của các biến thể của đặc tính đang được nghiên cứu.

Trung Bình (Tôi)- đây là giá trị tương ứng với tùy chọn nằm ở giữa chuỗi xếp hạng. Do đó, trung vị là phiên bản của chuỗi được xếp hạng, ở cả hai phía của chuỗi này phải có số lượng đơn vị dân số bằng nhau.

Để tìm số trung vị, trước tiên bạn cần xác định số sê-ri của nó trong chuỗi xếp hạng bằng công thức:

Trong đó N là thể tích của chuỗi (số đơn vị trong tổng thể).

Nếu chuỗi bao gồm một số lẻ các số hạng thì trung vị bằng tùy chọn có số N Me. Nếu chuỗi bao gồm một số số chẵn thì trung vị được định nghĩa là trung bình số học của hai tùy chọn liền kề nằm ở giữa.

Ví dụ. Cho một dãy xếp hạng 1, 2, 3, 3, 6, 7, 9, 9, 10. Khối lượng của dãy đó là N = 9, nghĩa là N Me = (9 + 1) / 2 = 5. Do đó, Me = 6, tức là . lựa chọn thứ năm. Nếu hàng được cho 1, 5, 7, 9, 11, 14, 15, 16, tức là. chuỗi có số số hạng chẵn (N=8) thì N Me = (8 + 1)/2 = 4,5. Điều này có nghĩa là số trung vị bằng một nửa tổng của tùy chọn thứ tư và thứ năm, tức là Tôi = (9 + 11) / 2 = 10.

Trong một chuỗi biến thiên rời rạc, trung vị được xác định bởi tần số tích lũy. Tần số của tùy chọn, bắt đầu từ tần số đầu tiên, được tính tổng cho đến khi vượt quá số trung vị. Giá trị của các tùy chọn tổng hợp cuối cùng sẽ là giá trị trung bình.

Ví dụ. Tìm số bị cáo trung bình trong mỗi vụ án hình sự bằng cách sử dụng dữ liệu trong Bảng 12.

Giải pháp. Trong trường hợp này, số lượng của chuỗi biến thiên là N = 154, do đó, N Me = (154 + 1) / 2 = 77,5. Tổng hợp tần số của tùy chọn thứ nhất và thứ hai, chúng ta nhận được: 75 + 43 = 118, tức là chúng tôi đã vượt qua con số trung bình. Vậy là tôi = 2.

Trong một chuỗi biến thiên theo khoảng, phân phối đầu tiên cho biết khoảng mà trung vị sẽ nằm trong đó. Anh ấy được gọi Trung bình . Đây là quãng đầu tiên có tần số tích lũy vượt quá một nửa âm lượng của chuỗi biến thiên quãng. Khi đó giá trị số của trung vị được xác định theo công thức:

Ở đâu x tôi- giới hạn dưới của khoảng trung vị; i là giá trị của khoảng trung vị; S Me-1- tần số tích lũy của khoảng trước trung vị; f Tôi- tần số của khoảng trung vị.

Ví dụ. Tìm độ tuổi trung bình của những người phạm tội bị kết tội trộm cắp dựa trên số liệu thống kê được trình bày trong Bảng 13.

Giải pháp. Dữ liệu thống kê được trình bày dưới dạng chuỗi biến thiên theo khoảng, có nghĩa là trước tiên chúng tôi xác định khoảng trung vị. Khối lượng của dân số là N = 162, do đó, khoảng trung vị là khoảng 18-28, bởi vì đây là quãng đầu tiên có tần số tích lũy (15 + 90 = 105) vượt quá một nửa âm lượng (162: 2 = 81) của chuỗi biến thể quãng. Bây giờ chúng ta xác định giá trị số của trung vị bằng công thức trên:

Như vậy, một nửa số người bị kết tội trộm cắp đều dưới 25 tuổi.

Thời trang (Mo) Họ gọi giá trị của một đặc điểm thường thấy nhất trong các đơn vị dân số. Thời trang được sử dụng để xác định giá trị của một đặc tính phổ biến nhất. Đối với dòng rời rạc, chế độ sẽ là tùy chọn có tần số cao nhất. Ví dụ: đối với chuỗi rời rạc được trình bày trong Bảng 3 Mo= 1, vì giá trị này tương ứng với tần số cao nhất - 75. Để xác định chế độ của chuỗi khoảng, trước tiên hãy xác định phương thức khoảng (khoảng có tần số cao nhất). Sau đó, trong khoảng này, giá trị của đối tượng được tìm thấy, có thể là một chế độ.

Giá trị của nó được tìm thấy bằng công thức:

Ở đâu x Mo- giới hạn dưới của khoảng thời gian; i là giá trị của khoảng thời gian; f Mo- tần số của khoảng thời gian; f Mo-1- tần số của khoảng trước phương thức; f Mo+1- tần số của khoảng thời gian theo phương thức.

Ví dụ. Tìm tuổi của những tên tội phạm bị kết tội trộm cắp, dữ liệu được trình bày trong Bảng 13.

Giải pháp. Tần số cao nhất tương ứng với khoảng 18-28, do đó, chế độ phải nằm trong khoảng này. Giá trị của nó được xác định theo công thức trên:

Như vậy, số tội phạm bị kết tội trộm cắp nhiều nhất là 24 tuổi.

Giá trị trung bình cung cấp đặc điểm chung của toàn bộ hiện tượng đang được nghiên cứu. Tuy nhiên, hai quần thể có cùng giá trị trung bình có thể khác nhau đáng kể về mức độ dao động (biến thiên) trong giá trị của đặc tính đang được nghiên cứu. Ví dụ, tại một tòa án, các thời hạn tù sau đây được áp dụng: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 năm và ở một tòa án khác - 5, 5, 6, 6, 7, 7 , 7, 8, 8, 8 tuổi. Trong cả hai trường hợp, trung bình số học là 6,7 năm. Tuy nhiên, các quần thể này khác nhau đáng kể ở chỗ chênh lệch giá trị cá nhân của thời hạn phạt tù được ấn định so với giá trị trung bình.

Và đối với tòa án đầu tiên, nơi mức chênh lệch này khá lớn, thời hạn tù trung bình không phản ánh toàn bộ dân số. Do đó, nếu các giá trị riêng lẻ của một đặc tính khác nhau một chút, thì giá trị trung bình số học sẽ là một đặc tính khá biểu thị về các thuộc tính của một quần thể nhất định. Nếu không, giá trị trung bình số học sẽ là một đặc tính không đáng tin cậy của tổng thể này và việc sử dụng nó trong thực tế sẽ không hiệu quả. Vì vậy, cần phải tính đến sự thay đổi giá trị của đặc tính đang được nghiên cứu.

Biến thể- đây là những khác biệt về giá trị của bất kỳ đặc điểm nào giữa các đơn vị khác nhau của một quần thể nhất định tại cùng một thời điểm hoặc thời điểm. Thuật ngữ "biến thể" có nguồn gốc từ tiếng Latin - variatio, có nghĩa là sự khác biệt, thay đổi, biến động. Nó phát sinh do thực tế là các giá trị riêng lẻ của một đặc tính được hình thành dưới tác động tổng hợp của nhiều yếu tố (điều kiện) khác nhau, được kết hợp khác nhau trong từng trường hợp riêng lẻ. Để đo lường sự biến đổi của một đặc điểm, nhiều chỉ số tuyệt đối và tương đối khác nhau được sử dụng.

Các chỉ số chính của sự thay đổi bao gồm:

1) phạm vi thay đổi;

2) độ lệch tuyến tính trung bình;

3) sự phân tán;

4) độ lệch chuẩn;

5) hệ số biến thiên.

Chúng ta hãy xem xét ngắn gọn từng người trong số họ.

Phạm vi biến đổi R là chỉ số tuyệt đối dễ tiếp cận nhất về mặt dễ tính toán, được định nghĩa là sự khác biệt giữa giá trị lớn nhất và nhỏ nhất của một đặc tính đối với các đơn vị của một dân số nhất định:

Phạm vi biến đổi (phạm vi dao động) là một chỉ báo quan trọng về tính biến đổi của một đặc điểm, nhưng nó chỉ có thể nhìn thấy những sai lệch cực độ, điều này làm hạn chế phạm vi ứng dụng của nó. Để mô tả chính xác hơn sự biến đổi của một tính trạng dựa trên tính biến đổi của nó, các chỉ số khác được sử dụng.

Độ lệch tuyến tính trung bình biểu thị giá trị trung bình số học của các giá trị tuyệt đối của độ lệch của các giá trị riêng lẻ của một đặc tính so với giá trị trung bình và được xác định bằng các công thức:

1) dữ liệu chưa được nhóm

2) chuỗi biến thể

Tuy nhiên, thước đo độ biến thiên được sử dụng rộng rãi nhất là sự phân tán . Nó đặc trưng cho thước đo độ phân tán của các giá trị của đặc tính đang được nghiên cứu so với giá trị trung bình của nó. Độ phân tán được định nghĩa là bình phương trung bình của độ lệch.

Phương sai đơn giảnđối với dữ liệu chưa được nhóm:

.

Trọng số phương sai cho chuỗi biến thể:

Bình luận. Trong thực tế, tốt hơn nên sử dụng các công thức sau để tính phương sai:

Đối với phương sai đơn giản

.

Đối với phương sai có trọng số

Độ lệch chuẩn là căn bậc hai của phương sai:

Độ lệch chuẩn là thước đo độ tin cậy của giá trị trung bình. Độ lệch chuẩn càng nhỏ thì tổng thể càng đồng nhất và trung bình số học phản ánh toàn bộ tổng thể càng tốt.

Các thước đo tán xạ được thảo luận ở trên (phạm vi biến thiên, độ phân tán, độ lệch chuẩn) là các chỉ số tuyệt đối, qua đó không phải lúc nào cũng có thể đánh giá mức độ biến thiên của một đặc tính. Trong một số bài toán cần sử dụng các chỉ số tán xạ tương đối, một trong số đó là hệ số biến thiên.

Hệ số biến thiên- tỷ số giữa độ lệch chuẩn và giá trị trung bình số học, được biểu thị bằng phần trăm:

Hệ số biến thiên không chỉ được sử dụng để đánh giá so sánh sự biến thiên của các đặc điểm khác nhau hoặc cùng một đặc điểm ở các quần thể khác nhau mà còn để mô tả tính đồng nhất của quần thể. Một tổng thể thống kê được coi là đồng nhất về mặt định lượng nếu hệ số biến thiên không vượt quá 33% (đối với phân phối gần với phân phối chuẩn).

Ví dụ. Dữ liệu sau đây có sẵn về thời hạn bỏ tù của 50 người bị kết án để chấp hành bản án do tòa án tuyên trong trại cải huấn của hệ thống hình sự: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Xây dựng dãy phân chia theo thời hạn phạt tù.

2. Tìm giá trị trung bình, phương sai và độ lệch chuẩn.

3. Tính hệ số biến thiên và đưa ra kết luận về tính đồng nhất hoặc không đồng nhất của tổng thể đang nghiên cứu.

Giải pháp.Để xây dựng một chuỗi phân phối rời rạc, cần xác định các phương án và tần số. Lựa chọn trong bài toán này là thời hạn phạt tù và tần suất là số lượng các lựa chọn riêng lẻ. Sau khi tính toán tần số, chúng ta thu được chuỗi phân phối rời rạc sau:

Hãy tìm giá trị trung bình và phương sai. Vì dữ liệu thống kê được biểu thị bằng một chuỗi biến thiên rời rạc nên chúng tôi sẽ sử dụng các công thức tính trung bình số học và độ phân tán có trọng số để tính toán chúng. Chúng tôi nhận được:

= = 4,1;

= 5,21.

Bây giờ chúng ta tính độ lệch chuẩn:

Tìm hệ số biến thiên:

Do đó, dân số thống kê không đồng nhất về mặt định lượng.