Tiểu sử Đặc trưng Phân tích

Cách tính công thức trung bình cộng. Tìm tổng chỉ số cung cấp thực phẩm bán buôn theo giá thực tế

Cách tính giá trị trung bình của các số trong Excel

Bạn có thể tìm trung bình cộng của các số trong Excel bằng cách sử dụng hàm.

Cú pháp AVERAGE

= AVERAGE (number1, [number2],…) - Phiên bản tiếng Nga

Đối số AVERAGE

  • số 1- số hoặc dải số đầu tiên, để tính giá trị trung bình cộng;
  • số 2(Tùy chọn) - số thứ hai hoặc dải số để tính trung bình cộng. Số đối số hàm tối đa là 255.

Để tính toán, hãy làm theo các bước sau:

  • Chọn bất kỳ ô nào;
  • Viết một công thức trong đó = AVERAGE (
  • Chọn phạm vi ô mà bạn muốn thực hiện phép tính;
  • Nhấn phím "Enter" trên bàn phím

Hàm sẽ tính giá trị trung bình trong phạm vi được chỉ định giữa các ô có chứa số.

Cách tìm giá trị trung bình cho văn bản

Nếu có dòng hoặc văn bản trống trong phạm vi dữ liệu, thì hàm coi chúng là "không". Nếu có biểu thức logic FALSE hoặc TRUE trong số dữ liệu, thì hàm sẽ coi FALSE là "không" và TRUE là "1".

Cách tìm giá trị trung bình cộng theo điều kiện

Hàm được sử dụng để tính giá trị trung bình theo một điều kiện hoặc tiêu chí. Ví dụ: giả sử chúng tôi có dữ liệu bán sản phẩm:

Nhiệm vụ của chúng ta là tính toán doanh số bán bút trung bình. Để làm điều này, chúng tôi sẽ thực hiện các bước sau:

  • Trong một phòng giam A13 viết tên sản phẩm “Bút”;
  • Trong một phòng giam B13 hãy nhập công thức:

= AVERAGEIF (A2: A10, A13, B2: B10)

Phạm vi ô “ A2: A10”Trỏ đến danh sách các sản phẩm mà chúng tôi sẽ tìm kiếm từ“ Bút ”. Lý lẽ A13đây là một liên kết đến một ô có văn bản mà chúng tôi sẽ tìm kiếm trong toàn bộ danh sách sản phẩm. Phạm vi ô “ B2: B10”Là một phạm vi có dữ liệu bán sản phẩm, trong đó hàm sẽ tìm“ Bút ”và tính giá trị trung bình.


Để phân tích và đưa ra kết luận thống kê về kết quả của việc tổng hợp và phân nhóm, các chỉ tiêu tổng hợp được tính toán - giá trị trung bình và giá trị tương đối.

Vấn đề của số trung bình - để đặc trưng cho tất cả các đơn vị của tổng thể thống kê với một giá trị của thuộc tính.

Giá trị trung bình đặc trưng cho các chỉ tiêu định tính của hoạt động kinh doanh: chi phí phân phối, lợi nhuận, khả năng sinh lời, v.v.

giá trị trung bình- Đây là đặc điểm tổng quát của các đơn vị của quần thể theo một số thuộc tính khác nhau.

Giá trị trung bình giúp có thể so sánh các mức độ của cùng một tính trạng trong các quần thể khác nhau và tìm ra lý do cho sự khác biệt này.

Trong phân tích các hiện tượng đang nghiên cứu, vai trò của các giá trị trung bình là rất to lớn. Nhà kinh tế học người Anh W. Petty (1623-1687) đã sử dụng rộng rãi các số liệu trung bình. V. Petty muốn sử dụng các giá trị trung bình làm thước đo chi phí chi tiêu cho sinh hoạt bình quân hàng ngày của một công nhân. Tính ổn định của giá trị trung bình là sự phản ánh mô hình của các quá trình đang nghiên cứu. Ông tin rằng thông tin có thể được chuyển đổi ngay cả khi không có đủ dữ liệu ban đầu.

Nhà khoa học người Anh G. King (1648-1712) đã sử dụng giá trị trung bình và giá trị tương đối khi phân tích dữ liệu về dân số nước Anh.

Những phát triển lý thuyết của nhà thống kê người Bỉ A. Quetelet (1796-1874) dựa trên sự mâu thuẫn về bản chất của các hiện tượng xã hội - có tính ổn định cao về khối lượng, nhưng hoàn toàn mang tính cá thể.

Theo A. Quetelet, các nguyên nhân vĩnh viễn tác động giống nhau lên mỗi hiện tượng đang nghiên cứu và làm cho các hiện tượng này giống nhau, tạo ra các khuôn mẫu chung cho tất cả chúng.

Hệ quả của những lời dạy của A. Quetelet là việc phân bổ các giá trị trung bình làm phương pháp phân tích thống kê chính. Ông cho rằng trung bình thống kê không phải là một phạm trù của thực tế khách quan.

A. Quetelet bày tỏ quan điểm của mình về mức trung bình trong lý thuyết của ông về người trung bình. Người trung bình là người có tất cả các phẩm chất ở kích thước trung bình (tỷ lệ tử vong hoặc tỷ lệ sinh trung bình, chiều cao và cân nặng trung bình, tốc độ chạy trung bình, xu hướng kết hôn và tự sát trung bình, hành động tốt, v.v.). Đối với A. Quetelet, con người bình thường là lý tưởng của một con người. Sự mâu thuẫn trong lý thuyết của A. Quetelet về người đàn ông trung bình đã được chứng minh trong các tài liệu thống kê Nga vào cuối thế kỷ 19-20.

Nhà thống kê nổi tiếng người Nga Yu E. Yanson (1835-1893) đã viết rằng A. Quetelet giả định sự tồn tại trong bản chất của loại người bình thường như một cái gì đó cho sẵn, từ đó cuộc sống đã loại bỏ những người trung bình của một xã hội nhất định và một thời điểm nhất định, và điều này dẫn anh ta đến một cái nhìn hoàn toàn máy móc về các quy luật vận động của đời sống xã hội: vận động là sự tăng dần các thuộc tính trung bình của con người, sự phục hồi dần dần của một loại hình; do đó, sự san bằng như vậy đối với tất cả các biểu hiện của đời sống cơ thể xã hội, vượt quá mọi chuyển động về phía trước đều chấm dứt.

Bản chất của lý thuyết này đã được phát triển thêm trong các công trình của một số nhà lý thuyết thống kê với tư cách là lý thuyết về các giá trị đích thực. A. Quetelet có những người đi theo - nhà kinh tế học và thống kê người Đức W. Lexis (1837-1914), người đã chuyển giao lý thuyết giá trị đích thực cho các hiện tượng kinh tế của đời sống xã hội. Lý thuyết của ông được gọi là lý thuyết ổn định. Một phiên bản khác của lý thuyết duy tâm về số trung bình dựa trên triết lý

Người sáng lập nó là nhà thống kê người Anh A. Bowley (1869–1957), một trong những nhà lý thuyết lỗi lạc nhất thời hiện đại trong lĩnh vực lý thuyết về số trung bình. Khái niệm về số trung bình của ông được nêu ra trong cuốn sách "Các yếu tố của thống kê".

A. Bowley chỉ xem xét mức trung bình từ mặt định lượng, do đó tách số lượng ra khỏi chất lượng. Xác định ý nghĩa của các giá trị trung bình (hay "chức năng của chúng"), A. Bowley đưa ra nguyên tắc tư duy Machist. A. Bowley đã viết rằng hàm số trung bình phải biểu thị một nhóm phức tạp

với một vài số nguyên tố. Dữ liệu thống kê nên được đơn giản hóa, nhóm lại và tính trung bình. Những quan điểm này đã được chia sẻ bởi R. Fisher (1890-1968), J. Yule (1871-1951), Frederick S. Mills (1892) và những người khác.

Trong những năm 30. Thế kỷ 20 và những năm tiếp theo, giá trị trung bình được coi là một đặc tính có ý nghĩa xã hội, nội dung thông tin phụ thuộc vào tính đồng nhất của dữ liệu.

Các đại diện tiêu biểu nhất của trường phái Ý là R. Benini (1862-1956) và C. Gini (1884-1965), coi thống kê là một nhánh của lôgic học, đã mở rộng phạm vi quy nạp thống kê, nhưng họ đã gắn các nguyên tắc nhận thức của lôgic học. và thống kê với bản chất của các hiện tượng được nghiên cứu, tuân theo các truyền thống của xã hội học giải thích thống kê.

Trong các tác phẩm của K. Marx và V. I. Lenin, một vai trò đặc biệt được gán cho các giá trị trung bình.

K. Marx lập luận rằng các sai lệch riêng lẻ so với mức chung bị hủy bỏ trong giá trị trung bình và mức trung bình trở thành một đặc điểm tổng quát của hiện tượng khối lượng. Giá trị trung bình trở thành một đặc trưng của hiện tượng khối lượng chỉ khi lấy một số lượng đáng kể các đơn vị. và các đơn vị này đồng nhất về chất. Marx đã viết rằng giá trị trung bình được tìm thấy là giá trị trung bình của "... nhiều giá trị riêng lẻ khác nhau của cùng một loại."

Giá trị bình quân thu được có ý nghĩa đặc biệt trong nền kinh tế thị trường. Nó giúp xác định cái cần thiết và tổng quát, xu hướng của các quy luật phát triển kinh tế một cách trực tiếp thông qua cá nhân và ngẫu nhiên.

Giá trị trung bình là các chỉ số khái quát hóa trong đó biểu hiện hành động của các điều kiện chung, tính thường xuyên của hiện tượng đang nghiên cứu.

Trung bình thống kê được tính toán trên cơ sở dữ liệu khối lượng của một cuộc quan sát hàng loạt được tổ chức chính xác về mặt thống kê. Nếu trung bình thống kê được tính toán từ dữ liệu khối lượng cho một tổng thể đồng nhất về chất (hiện tượng khối lượng), thì nó sẽ là khách quan.

Giá trị trung bình là trừu tượng, vì nó đặc trưng cho giá trị của một đơn vị trừu tượng.

Giá trị trung bình được tóm tắt từ sự đa dạng của đối tượng địa lý trong các đối tượng riêng lẻ. Trừu tượng hóa là một khâu của nghiên cứu khoa học. Sự thống nhất biện chứng giữa cái riêng và cái chung được thực hiện ở giá trị bình quân.

Giá trị trung bình cần được áp dụng trên cơ sở hiểu biết biện chứng về các phạm trù của cái riêng và cái chung, cái riêng và số đông.

Cái ở giữa phản ánh điểm chung được cộng lại trong một đối tượng duy nhất nhất định.

Để xác định các kiểu mẫu trong các quá trình xã hội đại chúng, giá trị trung bình có tầm quan trọng lớn.

Sự lệch lạc của cái riêng so với cái chung là biểu hiện của quá trình phát triển.

Giá trị trung bình phản ánh tính chất đặc trưng, ​​điển hình, mức độ hiện thực của sự vật hiện tượng đang nghiên cứu. Mục đích của giá trị trung bình là đặc trưng cho các mức này và sự thay đổi của chúng theo thời gian và không gian.

Chỉ tiêu bình quân là một giá trị thông thường, do nó được hình thành trong điều kiện bình thường, tự nhiên, chung cho sự tồn tại của một hiện tượng khối lượng cụ thể, được coi là một tổng thể.

Thuộc tính khách quan của một quá trình hoặc hiện tượng thống kê phản ánh giá trị trung bình.

Các giá trị riêng của đối tượng thống kê được nghiên cứu là khác nhau đối với từng đơn vị dân số. Giá trị trung bình của các giá trị cá biệt của một loại là sản phẩm của tất yếu, là kết quả của hoạt động cộng dồn của tất cả các đơn vị của quần thể, biểu hiện thành một loạt các tai nạn lặp lại.

Một số hiện tượng riêng lẻ có các dấu hiệu tồn tại trong tất cả các hiện tượng, nhưng với số lượng khác nhau - đây là chiều cao hoặc tuổi của một người. Các dấu hiệu khác của một hiện tượng cá nhân là khác nhau về chất ở các hiện tượng khác nhau, nghĩa là chúng có ở một số và không được quan sát thấy ở những người khác (một người đàn ông sẽ không trở thành một người phụ nữ). Giá trị trung bình được tính cho các dấu hiệu đồng nhất về mặt chất lượng và chỉ khác nhau về mặt định lượng, những dấu hiệu này vốn có trong tất cả các hiện tượng trong một tập hợp nhất định.

Giá trị trung bình là sự phản ánh các giá trị của tính trạng đang được nghiên cứu và được đo cùng chiều với đặc điểm này.

Học thuyết duy vật biện chứng cho rằng vạn vật trên thế giới đều thay đổi và phát triển. Và các dấu hiệu được đặc trưng bởi giá trị trung bình cũng thay đổi, và theo đó, chính các giá trị trung bình.

Cuộc sống là một quá trình liên tục tạo ra một cái gì đó mới. Đối tượng mang chất lượng mới là các đối tượng đơn lẻ, sau đó số lượng các đối tượng này tăng lên và cái mới trở thành khối lượng, điển hình.

Giá trị trung bình chỉ đặc trưng cho dân số được nghiên cứu trên một cơ sở. Để trình bày đầy đủ và toàn diện dân số đang nghiên cứu đối với một số đối tượng cụ thể, cần có một hệ thống các giá trị trung bình có thể mô tả hiện tượng từ các góc độ khác nhau.

2. Các loại trung bình

Trong quá trình xử lý thống kê của tài liệu, các vấn đề khác nhau nảy sinh cần được giải quyết và do đó các giá trị trung bình khác nhau được sử dụng trong thực hành thống kê. Thống kê toán học sử dụng nhiều mức trung bình khác nhau, chẳng hạn như: mức trung bình số học; ý nghĩa hình học; sóng hài trung bình; căn bậc hai có nghĩa là bình phương.

Để áp dụng một trong các dạng trung bình trên, cần phải phân tích dân số đang nghiên cứu, xác định nội dung vật chất của hiện tượng đang nghiên cứu, tất cả những điều này được thực hiện trên cơ sở kết luận rút ra từ nguyên tắc ý nghĩa của kết quả. khi cân hoặc tổng hợp.

Trong nghiên cứu về số trung bình, các chỉ số và ký hiệu sau được sử dụng.

Tiêu chí mà giá trị trung bình được tìm thấy được gọi là tính năng trung bình và được ký hiệu là x; giá trị của đối tượng được tính trung bình cho bất kỳ đơn vị nào của tổng thể thống kê được gọi là ý nghĩa riêng của nó hoặc tùy chọn, và được biểu thị là x 1 , X 2 , x 3 ,… X P ; tần số là độ lặp lại của các giá trị riêng lẻ của một đặc điểm, được ký hiệu bằng chữ cái f.

Trung bình số học

Một trong những loại phương tiện phổ biến nhất trung bình cộng, được tính khi khối lượng của thuộc tính trung bình được hình thành dưới dạng tổng các giá trị của nó đối với các đơn vị riêng lẻ của dân số thống kê được nghiên cứu.

Để tính giá trị trung bình số học, tổng của tất cả các cấp độ đối tượng được chia cho số của chúng.


Nếu một số tùy chọn xảy ra nhiều lần, thì tổng các mức thuộc tính có thể nhận được bằng cách nhân mỗi cấp với số đơn vị dân số tương ứng, tiếp theo là tổng của các tích kết quả, giá trị trung bình số học được tính theo cách này được gọi là số học có trọng số nghĩa là.

Công thức cho giá trị trung bình số học có trọng số như sau:


trong đó x tôi là các lựa chọn,

f i - tần số hoặc trọng số.

Giá trị trung bình có trọng số nên được sử dụng trong mọi trường hợp khi các biến thể có mức độ phong phú khác nhau.

Giá trị trung bình số học, như nó vốn có, phân phối công bằng giữa các đối tượng riêng lẻ tổng giá trị của thuộc tính, trên thực tế, giá trị này khác nhau đối với từng đối tượng.

Việc tính toán các giá trị trung bình được thực hiện theo dữ liệu được nhóm dưới dạng chuỗi phân bố khoảng, khi các biến thể tính trạng mà từ đó giá trị trung bình được tính được trình bày dưới dạng khoảng (từ - đến).

Các tính chất của trung bình cộng:

1) trung bình cộng của tổng các giá trị thay đổi bằng tổng trung bình cộng: Nếu x i = y i + z i, thì


Thuộc tính này cho biết những trường hợp nào có thể tóm tắt các giá trị trung bình.

2) tổng đại số của độ lệch của các giá trị riêng lẻ của thuộc tính thay đổi so với giá trị trung bình bằng 0, vì tổng độ lệch theo một hướng được bù đắp bằng tổng độ lệch theo hướng khác:


Quy tắc này chứng tỏ rằng giá trị trung bình là kết quả.

3) nếu tất cả các biến thể của chuỗi đều tăng hoặc giảm cùng một số ?, thì giá trị trung bình sẽ tăng hay giảm theo cùng một số ?:


4) nếu tất cả các biến thể của chuỗi đều tăng hoặc giảm A lần, thì giá trị trung bình cũng sẽ tăng hoặc giảm A lần:


5) Tính chất thứ năm của giá trị trung bình cho chúng ta thấy rằng nó không phụ thuộc vào kích thước của các trọng số mà phụ thuộc vào tỷ lệ giữa chúng. Vì trọng số, không chỉ có giá trị tương đối mà còn có thể lấy giá trị tuyệt đối.

Nếu tất cả các tần số của chuỗi được chia hoặc nhân với cùng một số d, thì giá trị trung bình sẽ không thay đổi.


Sóng hài trung bình.Để xác định giá trị trung bình cộng, cần phải có một số tùy chọn và tần số, tức là các giá trị Xf.

Giả sử chúng ta biết các giá trị riêng lẻ của đối tượng địa lý X và hoạt động X /, và tần số f chưa biết, do đó, để tính giá trị trung bình, chúng tôi ký hiệu tích = X /;ở đâu:



Trung bình ở dạng này được gọi là trung bình có trọng số điều hòa và được ký hiệu là x hại. vzvv.

Theo đó, giá trị trung bình điều hòa đồng nhất với giá trị trung bình cộng. Nó được áp dụng khi không biết trọng lượng thực tế. f, và sản phẩm được biết đến fx = z

Khi công trình fx bằng hoặc bằng một (m = 1), giá trị trung bình đơn giản của sóng hài được sử dụng, được tính theo công thức:


ở đâu X- các tùy chọn riêng biệt;

N- con số.

Trung bình hình học

Nếu có n hệ số tăng trưởng thì công thức tính hệ số trung bình là:


Đây là công thức trung bình hình học.

Giá trị trung bình hình học bằng với gốc của độ N từ tích của các hệ số tăng trưởng đặc trưng cho tỷ lệ giữa giá trị của mỗi kỳ tiếp theo với giá trị của kỳ trước.

Nếu các giá trị được biểu thị dưới dạng hàm bình phương phải tính trung bình, thì bình phương trung bình căn được sử dụng. Ví dụ: sử dụng bình phương trung bình gốc, bạn có thể xác định đường kính của đường ống, bánh xe, v.v.

Bình phương đơn giản trung bình được xác định bằng cách lấy căn bậc hai của thương chia tổng bình phương của các giá trị đối tượng địa lý riêng lẻ cho số của chúng.


Bình phương trung bình căn bậc hai có trọng số là:

3. Trung bình cơ cấu. Chế độ và trung vị

Để mô tả cấu trúc của dân số thống kê, các chỉ số được sử dụng được gọi là trung bình cơ cấu. Chúng bao gồm chế độ và trung vị.

Thời trang (M Về ) - tùy chọn phổ biến nhất. Thời trang giá trị của đối tượng địa lý được gọi, tương ứng với điểm cực đại của đường cong phân phối lý thuyết.

Chế độ này đại diện cho giá trị xuất hiện thường xuyên nhất hoặc giá trị điển hình.

Thời trang được sử dụng trong thực tế thương mại để nghiên cứu nhu cầu của người tiêu dùng và ghi lại giá cả.

Trong một chuỗi rời rạc, chế độ là biến thể có tần số cao nhất. Trong chuỗi biến thiên khoảng, biến thể trung tâm của khoảng, có tần số cao nhất (đặc biệt), được coi là chế độ.

Trong khoảng thời gian, cần phải tìm giá trị của thuộc tính, đó là chế độ.


ở đâu X Về là giới hạn dưới của khoảng phương thức;

h là giá trị của khoảng phương thức;

fm là tần số của khoảng phương thức;

f t-1 - tần số của khoảng trước phương thức;

fm+1 là tần số của khoảng thời gian tuân theo phương thức.

Chế độ phụ thuộc vào quy mô của các nhóm, vào vị trí chính xác của ranh giới của các nhóm.

Thời trang- con số thực sự xuất hiện thường xuyên nhất (là một giá trị nhất định), trong thực tế nó có mức sử dụng rộng rãi nhất (loại người mua phổ biến nhất).

Trung vị (M e- đây là giá trị chia số chuỗi biến thể có thứ tự thành hai phần bằng nhau: một phần có các giá trị của đối tượng thay đổi nhỏ hơn biến thể trung bình và phần còn lại là lớn.

Trung bình là phần tử lớn hơn hoặc bằng và đồng thời nhỏ hơn hoặc bằng một nửa số phần tử còn lại của chuỗi phân phối.

Thuộc tính của giá trị trung bình là tổng độ lệch tuyệt đối của các giá trị tính trạng so với giá trị trung bình nhỏ hơn bất kỳ giá trị nào khác.

Sử dụng giá trị trung bình cho phép bạn nhận được kết quả chính xác hơn so với việc sử dụng các hình thức trung bình khác.

Thứ tự tìm giá trị trung vị trong chuỗi biến thiên khoảng như sau: ta sắp xếp các giá trị riêng của thuộc tính theo thứ hạng; xác định tần số tích lũy cho chuỗi được xếp hạng này; theo các tần số tích lũy, chúng tôi tìm thấy khoảng thời gian trung vị:


ở đâu x tôi là giới hạn dưới của khoảng trung vị;

tôi Tôi là giá trị của khoảng trung vị;

f / 2 là tổng nửa của các tần số của chuỗi;

S Tôi-1 là tổng các tần số tích lũy trước khoảng trung vị;

f Tôi là tần số của khoảng trung vị.

Trung vị chia đôi số hàng, do đó, nó là nơi tần suất tích lũy bằng một nửa hoặc hơn một nửa tổng số tần số và tần suất (tích lũy) trước đó nhỏ hơn một nửa số tổng thể.

Trong hầu hết các trường hợp, dữ liệu tập trung xung quanh một số điểm trung tâm. Vì vậy, để mô tả bất kỳ tập dữ liệu nào, chỉ cần chỉ ra giá trị trung bình là đủ. Hãy xem xét liên tiếp ba đặc điểm số được sử dụng để ước tính giá trị trung bình của phân phối: trung bình cộng, trung vị và chế độ.

Trung bình

Giá trị trung bình số học (thường được gọi đơn giản là giá trị trung bình) là ước tính phổ biến nhất về giá trị trung bình của một phân phối. Nó là kết quả của việc chia tổng của tất cả các giá trị số quan sát được cho số của chúng. Đối với một số mẫu X 1, X 2, ..., XN, trung bình của mẫu (được biểu thị bằng ký hiệu ) bằng \ u003d (X 1 + X 2 + ... + XN) / N, hoặc

trung bình của mẫu ở đâu, N- cỡ mẫu, Xtôi- phần tử thứ i của mẫu.

Tải xuống ghi chú ở định dạng hoặc, ví dụ ở định dạng

Xem xét tính toán trung bình số học của lợi nhuận trung bình hàng năm trong 5 năm của 15 quỹ tương hỗ có rủi ro rất cao (Hình 1).

Cơm. 1. Lợi tức trung bình hàng năm của 15 quỹ tương hỗ có rủi ro rất cao

Giá trị trung bình của mẫu được tính như sau:

Đây là một khoản lợi nhuận tốt, đặc biệt là khi so sánh với khoản lợi nhuận 3-4% mà những người gửi tiền ngân hàng hoặc công đoàn tín dụng nhận được trong cùng một khoảng thời gian. Nếu bạn sắp xếp các giá trị trả về, có thể dễ dàng thấy rằng tám quỹ có lợi tức trên và bảy - dưới mức trung bình. Giá trị trung bình số học hoạt động như một điểm cân bằng, để quỹ thu nhập thấp cân bằng quỹ thu nhập cao. Tất cả các phần tử của mẫu đều tham gia vào việc tính giá trị trung bình. Không có công cụ ước tính nào khác của phân phối có nghĩa là có thuộc tính này.

Khi nào cần tính trung bình cộng. Vì giá trị trung bình cộng phụ thuộc vào tất cả các phần tử của mẫu, nên sự hiện diện của các giá trị cực trị ảnh hưởng đáng kể đến kết quả. Trong những tình huống như vậy, giá trị trung bình số học có thể làm sai lệch ý nghĩa của dữ liệu số. Vì vậy, khi mô tả tập dữ liệu chứa các giá trị cực trị, cần chỉ ra trung vị hoặc trung bình cộng và trung vị. Ví dụ: nếu lợi nhuận của quỹ Tăng trưởng mới nổi RS bị loại bỏ khỏi mẫu, thì trung bình mẫu về lợi tức của 14 quỹ giảm gần 1% xuống còn 5,19%.

Trung bình

Trung vị là giá trị giữa của một mảng số có thứ tự. Nếu mảng không chứa các số lặp lại, thì một nửa số phần tử của nó sẽ nhỏ hơn và một nửa so với giá trị trung vị. Nếu mẫu chứa các giá trị cực trị, tốt hơn nên sử dụng giá trị trung bình hơn là giá trị trung bình số học để ước tính giá trị trung bình. Để tính giá trị trung bình của một mẫu, trước tiên nó phải được sắp xếp.

Công thức này không rõ ràng. Kết quả của nó phụ thuộc vào việc số đó là số chẵn hay lẻ. N:

  • Nếu mẫu chứa một số lẻ các mục, giá trị trung bình là (n + 1) / 2-thành phần.
  • Nếu mẫu chứa một số phần tử chẵn thì trung vị nằm giữa hai phần tử ở giữa của mẫu và bằng trung bình cộng được tính trên hai phần tử này.

Để tính giá trị trung bình cho một mẫu gồm 15 quỹ tương hỗ có rủi ro rất cao, trước tiên chúng ta cần sắp xếp dữ liệu thô (Hình 2). Khi đó trung vị sẽ đối diện với số phần tử ở giữa của mẫu; trong ví dụ số 8 của chúng tôi. Excel có một hàm đặc biệt = MEDIAN () cũng hoạt động với các mảng không có thứ tự.

Cơm. 2. Trung bình 15 quỹ

Như vậy, trung vị là 6,5. Điều này có nghĩa là một nửa số quỹ có rủi ro rất cao không vượt quá 6,5, trong khi nửa còn lại làm như vậy. Lưu ý rằng trung bình 6,5 lớn hơn một chút so với trung bình 6,08.

Nếu chúng ta loại bỏ khả năng sinh lời của quỹ Tăng trưởng mới nổi RS khỏi mẫu, thì mức trung bình của 14 quỹ còn lại sẽ giảm xuống còn 6,2%, tức là không đáng kể bằng trung bình cộng (Hình 3).

Cơm. 3. Trung bình 14 quỹ

Thời trang

Thuật ngữ này được Pearson đưa ra lần đầu tiên vào năm 1894. Thời trang là con số xuất hiện thường xuyên nhất trong mẫu (thời trang nhất). Thời trang mô tả tốt, ví dụ, phản ứng điển hình của người lái xe đối với tín hiệu giao thông để dừng giao thông. Một ví dụ cổ điển về việc sử dụng thời trang là lựa chọn kích thước của lô giày được sản xuất hoặc màu sắc của giấy dán tường. Nếu một phân phối có nhiều chế độ, thì nó được cho là đa phương thức hoặc đa phương thức (có hai hoặc nhiều "đỉnh"). Phân phối đa phương thức cung cấp thông tin quan trọng về bản chất của biến số đang nghiên cứu. Ví dụ, trong các cuộc điều tra xã hội học, nếu một biến đại diện cho sở thích hoặc thái độ đối với điều gì đó, thì đa phương thức có thể có nghĩa là có một số ý kiến ​​khác nhau rõ ràng. Đa phương thức cũng là một chỉ báo cho thấy mẫu không đồng nhất và các quan sát có thể được tạo ra bởi hai hoặc nhiều phân bố "chồng lên nhau". Không giống như giá trị trung bình số học, các giá trị ngoại lệ không ảnh hưởng đến chế độ. Đối với các biến ngẫu nhiên được phân phối liên tục, chẳng hạn như lợi nhuận trung bình hàng năm của các quỹ tương hỗ, chế độ này đôi khi hoàn toàn không tồn tại (hoặc không có ý nghĩa). Vì các chỉ số này có thể nhận nhiều giá trị khác nhau, nên các giá trị lặp lại là cực kỳ hiếm.

Tứ phân vị

Phần tư là các thước đo được sử dụng phổ biến nhất để đánh giá sự phân bố của dữ liệu khi mô tả các thuộc tính của các mẫu số lớn. Trong khi phần trung vị chia mảng có thứ tự thành một nửa (50% phần tử của mảng nhỏ hơn giá trị trung bình và 50% lớn hơn), các phần tư chia tập dữ liệu có thứ tự thành bốn phần. Giá trị Q 1, giá trị trung bình và Q 3 lần lượt là phân vị thứ 25, 50 và 75. Phần tư đầu tiên Q 1 là số chia mẫu thành hai phần: 25% các phần tử nhỏ hơn và 75% nhiều hơn phần tư đầu tiên.

Phần tư thứ ba Q 3 là một số chia mẫu thành hai phần: 75% nguyên tố nhỏ hơn và 25% nhiều hơn phần tư thứ ba.

Để tính toán phần tư trong các phiên bản Excel trước năm 2007, hàm = QUARTILE (mảng, phần) đã được sử dụng. Bắt đầu với Excel 2010, hai hàm được áp dụng:

  • = QUARTILE.ON (mảng, một phần)
  • = QUARTILE.EXC (mảng, một phần)

Hai hàm này cho các giá trị hơi khác nhau (Hình 4). Ví dụ: khi tính toán các phần tư của một mẫu chứa dữ liệu về lợi tức trung bình hàng năm của 15 quỹ tương hỗ có rủi ro rất cao, Q 1 = 1,8 hoặc -0,7 cho QUARTILE.INC và QUARTILE.EXC, tương ứng. Nhân tiện, hàm QUARTILE được sử dụng trước đó tương ứng với hàm QUARTILE.ON hiện đại. Để tính toán các phần tư trong Excel bằng cách sử dụng các công thức trên, mảng dữ liệu có thể không được sắp xếp theo thứ tự.

Cơm. 4. Tính toán tứ phân vị trong Excel

Hãy nhấn mạnh lại. Excel có thể tính toán phần tư cho đơn biến loạt rời rạc, chứa các giá trị của một biến ngẫu nhiên. Việc tính toán các phần tư cho phân phối dựa trên tần suất được đưa ra trong phần bên dưới.

ý nghĩa hình học

Không giống như trung bình số học, trung bình hình học đo lường mức độ thay đổi của một biến theo thời gian. Giá trị trung bình hình học là gốc N mức độ từ sản phẩm N giá trị (trong Excel, hàm = CUGEOM được sử dụng):

G= (X 1 * X 2 * ... * X n) 1 / n

Một tham số tương tự - trung bình hình học của tỷ suất sinh lợi - được xác định theo công thức:

G \ u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

ở đâu R i- tỷ lệ lợi nhuận tôi-khoảng thời gian thứ.

Ví dụ: giả sử khoản đầu tư ban đầu là 100.000 đô la. Vào cuối năm đầu tiên, nó giảm xuống còn 50.000 đô la và đến cuối năm thứ hai, nó thu hồi về 100.000 đô la ban đầu. Tỷ suất lợi nhuận trên khoản đầu tư này trong một hai- khoảng thời gian năm bằng 0, vì số tiền ban đầu và số tiền cuối cùng bằng nhau. Tuy nhiên, trung bình cộng của tỷ suất sinh lợi hàng năm là = (-0,5 + 1) / 2 = 0,25 hoặc 25%, vì tỷ suất sinh lợi trong năm đầu tiên R 1 = (50.000 - 100.000) / 100.000 = -0,5, và trong lần thứ hai R 2 = (100.000 - 50.000) / 50.000 = 1. Đồng thời, trung bình hình học của tỷ suất sinh lợi trong hai năm là: G = [(1–0,5) * (1 + 1)] 1 / 2 - 1 = ½ - 1 = 1 - 1 = 0. Do đó, trung bình hình học phản ánh chính xác hơn sự thay đổi (chính xác hơn là không thay đổi) về khối lượng đầu tư trong hai năm so với trung bình số học.

Sự thật thú vị.Đầu tiên, trung bình hình học sẽ luôn nhỏ hơn trung bình cộng của các số giống nhau. Trừ trường hợp tất cả các số đã lấy đều bằng nhau. Thứ hai, sau khi xem xét các tính chất của một tam giác vuông, người ta có thể hiểu tại sao giá trị trung bình được gọi là hình học. Chiều cao của một tam giác vuông, hạ xuống cạnh huyền, là tỷ lệ trung bình giữa hình chiếu của các chân trên cạnh huyền và mỗi chân là tỷ lệ trung bình giữa cạnh huyền và hình chiếu của nó trên cạnh huyền (Hình 5). Điều này cung cấp một cách hình học để xây dựng trung bình hình học của hai (độ dài) phân đoạn: bạn cần xây dựng một đường tròn trên tổng hai đoạn này là đường kính, sau đó là chiều cao, được khôi phục từ điểm nối của chúng đến giao điểm với vòng tròn, sẽ cho giá trị mong muốn:

Cơm. 5. Bản chất hình học của trung bình hình học (hình từ Wikipedia)

Thuộc tính quan trọng thứ hai của dữ liệu số là biến thểđặc trưng cho mức độ phân tán của dữ liệu. Hai mẫu khác nhau có thể khác nhau cả về giá trị trung bình và các biến thể. Tuy nhiên, như được hiển thị trong hình. 6 và 7, hai mẫu có thể có cùng độ thay đổi nhưng giá trị khác nhau, hoặc giá trị trung bình giống nhau và độ biến thiên hoàn toàn khác nhau. Dữ liệu tương ứng với đa giác B trong Hình. 7 thay đổi ít hơn nhiều so với dữ liệu mà từ đó đa giác A được tạo ra.

Cơm. 6. Hai phân bố hình chuông đối xứng có cùng độ chênh lệch và giá trị trung bình khác nhau

Cơm. 7. Hai phân bố hình chuông đối xứng với cùng phương tiện và phân tán khác nhau

Có năm ước tính về sự thay đổi dữ liệu:

  • nhịp,
  • phạm vi liên phần tư,
  • phân tán,
  • độ lệch chuẩn,
  • hệ số biến thiên.

phạm vi

Phạm vi là sự khác biệt giữa các phần tử lớn nhất và nhỏ nhất của mẫu:

Vuốt = XMax-XMin

Phạm vi của một mẫu chứa dữ liệu về lợi nhuận trung bình hàng năm của 15 quỹ tương hỗ có rủi ro rất cao có thể được tính toán bằng cách sử dụng một mảng có thứ tự (xem Hình 4): range = 18,5 - (-6,1) = 24,6. Điều này có nghĩa là chênh lệch giữa lợi nhuận trung bình hàng năm cao nhất và thấp nhất đối với các quỹ rủi ro rất cao là 24,6%.

Phạm vi đo lường mức độ phổ biến tổng thể của dữ liệu. Mặc dù phạm vi mẫu là một ước tính rất đơn giản về tổng mức lan truyền dữ liệu, nhưng điểm yếu của nó là không tính đến chính xác cách dữ liệu được phân phối giữa các phần tử tối thiểu và tối đa. Hiệu ứng này được thấy rõ trong Hình. 8 minh họa các mẫu có cùng phạm vi. Thang đo B cho thấy rằng nếu mẫu chứa ít nhất một giá trị cực trị thì phạm vi mẫu là một ước tính rất không chính xác về mức độ lan truyền của dữ liệu.

Cơm. 8. So sánh ba mẫu cùng dãy; hình tam giác tượng trưng cho giá đỡ của cán cân và vị trí của nó tương ứng với giá trị trung bình của mẫu

Phạm vi liên phần tư

Khoảng giữa phần tư, hoặc trung bình, là sự khác biệt giữa phần tư thứ ba và phần tư thứ nhất của mẫu:

Phạm vi liên phần tư \ u003d Q 3 - Q 1

Giá trị này giúp bạn có thể ước tính mức độ lan truyền của 50% các yếu tố và không tính đến ảnh hưởng của các yếu tố cực đoan. Phạm vi liên phần tư cho một mẫu chứa dữ liệu về lợi nhuận trung bình hàng năm của 15 quỹ tương hỗ có rủi ro rất cao có thể được tính toán bằng cách sử dụng dữ liệu trong Hình 2. 4 (ví dụ: đối với hàm QUARTILE.EXC): Phạm vi liên phần = 9,8 - (-0,7) = 10,5. Khoảng giữa 9,8 và -0,7 thường được gọi là nửa giữa.

Cần lưu ý rằng các giá trị Q 1 và Q 3, và do đó là phạm vi liên phần tư, không phụ thuộc vào sự hiện diện của các giá trị ngoại lệ, vì tính toán của chúng không tính đến bất kỳ giá trị nào nhỏ hơn Q 1 hoặc lớn hơn Q 3 . Các đặc điểm định lượng tổng thể, chẳng hạn như trung vị, phần tư thứ nhất và thứ ba, và phạm vi liên phần tư, không bị ảnh hưởng bởi các giá trị ngoại lai, được gọi là chỉ số mạnh mẽ.

Mặc dù phạm vi và phạm vi liên phần cung cấp ước tính tương ứng về tổng số và phân tán trung bình của mẫu, nhưng ước tính không tính đến cách dữ liệu được phân phối. Phương sai và độ lệch chuẩn miễn khỏi thiếu sót này. Các chỉ số này cho phép bạn đánh giá mức độ biến động của dữ liệu xung quanh giá trị trung bình. Phương sai mẫu là một phép gần đúng của giá trị trung bình số học được tính toán từ sự khác biệt bình phương giữa mỗi phần tử mẫu và giá trị trung bình của mẫu. Đối với một mẫu X 1, X 2, ... X n thì phương sai mẫu (được ký hiệu bằng ký hiệu S 2 được cho bởi công thức sau:

Nói chung, phương sai mẫu là tổng bình phương chênh lệch giữa các phần tử mẫu và giá trị trung bình của mẫu, chia cho một giá trị bằng cỡ mẫu trừ đi một:

ở đâu - trung bình cộng, N- cỡ mẫu, X tôi - tôi-thành phần mẫu X. Trong Excel trước phiên bản 2007, hàm = VAR () được sử dụng để tính phương sai mẫu, kể từ phiên bản 2010, hàm = VAR.V () được sử dụng.

Ước tính thực tế nhất và được chấp nhận rộng rãi về phân tán dữ liệu là độ lệch chuẩn. Chỉ số này được ký hiệu bằng ký hiệu S và bằng căn bậc hai của phương sai mẫu:

Trong Excel trước phiên bản 2007, hàm = STDEV () được sử dụng để tính độ lệch chuẩn, từ phiên bản 2010, hàm = STDEV.B () được sử dụng. Để tính toán các hàm này, mảng dữ liệu có thể không có thứ tự.

Cả phương sai mẫu và độ lệch chuẩn mẫu đều không được âm. Tình huống duy nhất trong đó các chỉ số S 2 và S có thể bằng không là nếu tất cả các phần tử của mẫu đều bằng nhau. Trong trường hợp hoàn toàn không thể xảy ra này, phạm vi và phạm vi liên phần cũng bằng không.

Dữ liệu số vốn dễ bay hơi. Bất kỳ biến nào cũng có thể nhận nhiều giá trị khác nhau. Ví dụ, các quỹ tương hỗ khác nhau có tỷ lệ lãi và lỗ khác nhau. Do sự thay đổi của dữ liệu số, điều rất quan trọng là phải nghiên cứu không chỉ các ước tính về giá trị trung bình, về bản chất tổng hợp, mà còn cả các ước tính về phương sai, đặc trưng cho sự phân tán của dữ liệu.

Phương sai và độ lệch chuẩn cho phép chúng tôi ước tính mức độ trải rộng của dữ liệu xung quanh giá trị trung bình, nói cách khác, để xác định xem có bao nhiêu phần tử của mẫu nhỏ hơn giá trị trung bình và bao nhiêu phần tử lớn hơn. Sự phân tán có một số tính chất toán học có giá trị. Tuy nhiên, giá trị của nó là bình phương của một đơn vị đo lường - phần trăm vuông, đô la vuông, inch vuông, v.v. Do đó, ước tính tự nhiên của phương sai là độ lệch chuẩn, được biểu thị bằng các đơn vị đo lường thông thường - phần trăm thu nhập, đô la hoặc inch.

Độ lệch chuẩn cho phép bạn ước tính lượng biến động của các phần tử mẫu xung quanh giá trị trung bình. Trong hầu hết các tình huống, phần lớn các giá trị quan sát nằm trong khoảng cộng hoặc trừ một độ lệch chuẩn so với giá trị trung bình. Do đó, khi biết giá trị trung bình cộng của các phần tử mẫu và độ lệch chuẩn của mẫu, có thể xác định được khoảng mà phần lớn dữ liệu thuộc về.

Độ lệch chuẩn của lợi nhuận trên 15 quỹ tương hỗ có rủi ro rất cao là 6,6 (Hình 9). Điều này có nghĩa là lợi nhuận của phần lớn các quỹ khác với giá trị trung bình không quá 6,6% (nghĩa là nó dao động trong phạm vi từ - S= 6,2 - 6,6 = –0,4 đến + S= 12,8). Trên thực tế, khoảng thời gian này chứa lợi nhuận hàng năm trung bình trong 5 năm là 53,3% (8 trong số 15) quỹ.

Cơm. 9. Độ lệch chuẩn

Lưu ý rằng trong quá trình tính tổng các chênh lệch bình phương, các mục ở xa giá trị trung bình sẽ tăng trọng lượng hơn các mục ở gần hơn. Tính chất này là lý do chính tại sao giá trị trung bình số học thường được sử dụng nhất để ước tính giá trị trung bình của một phân phối.

Hệ số biến đổi

Không giống như các ước tính phân tán trước đây, hệ số biến thiên là một ước tính tương đối. Nó luôn được đo dưới dạng phần trăm, không phải trong các đơn vị dữ liệu gốc. Hệ số biến thiên, được biểu thị bằng các ký hiệu CV, đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình. Hệ số biến đổi bằng độ lệch chuẩn chia cho trung bình cộng và nhân với 100%:

ở đâu S- độ lệch mẫu chuẩn, - trung bình của mẫu.

Hệ số biến thiên cho phép bạn so sánh hai mẫu, các phần tử của chúng được biểu thị bằng các đơn vị đo lường khác nhau. Ví dụ, người quản lý của một dịch vụ chuyển phát thư có ý định nâng cấp đội xe tải. Khi tải các gói hàng, có hai loại hạn chế cần xem xét: trọng lượng (tính bằng pound) và thể tích (tính bằng feet khối) của mỗi gói hàng. Giả sử rằng trong một mẫu 200 bao, trọng lượng trung bình là 26,0 pound, độ lệch chuẩn của trọng lượng là 3,9 pound, thể tích gói trung bình là 8,8 feet khối và độ lệch chuẩn của thể tích là 2,2 feet khối. Làm thế nào để so sánh giữa trọng lượng và khối lượng của các gói hàng?

Vì các đơn vị trọng lượng và thể tích khác nhau nên người quản lý phải so sánh mức độ chênh lệch tương đối của các giá trị này. Hệ số biến đổi trọng lượng là CV W = 3,9 / 26,0 * 100% = 15% và hệ số biến đổi thể tích CV V = 2,2 / 8,8 * 100% = 25%. Do đó, độ phân tán tương đối của khối lượng gói lớn hơn nhiều so với độ phân tán tương đối của trọng lượng của chúng.

Hình thức phân phối

Thuộc tính quan trọng thứ ba của mẫu là hình thức phân phối của nó. Sự phân bố này có thể đối xứng hoặc không đối xứng. Để mô tả hình dạng của một phân phối, cần phải tính giá trị trung bình và trung vị của nó. Nếu hai số đo này giống nhau, biến được cho là phân phối đối xứng. Nếu giá trị trung bình của một biến lớn hơn giá trị trung bình, thì phân phối của nó có độ lệch dương (Hình 10). Nếu giá trị trung vị lớn hơn giá trị trung bình, thì phân phối của biến số bị lệch âm. Độ lệch dương xảy ra khi giá trị trung bình tăng lên các giá trị cao bất thường. Độ lệch âm xảy ra khi giá trị trung bình giảm xuống các giá trị nhỏ bất thường. Một biến được phân phối đối xứng nếu nó không nhận bất kỳ giá trị cực trị nào theo cả hai hướng, sao cho các giá trị lớn và nhỏ của biến triệt tiêu lẫn nhau.

Cơm. 10. Ba loại phân phối

Dữ liệu được mô tả trên thang điểm A có độ lệch âm. Hình này cho thấy một đuôi dài và lệch trái gây ra bởi các giá trị nhỏ bất thường. Những giá trị cực kỳ nhỏ này sẽ chuyển giá trị trung bình sang trái và nó trở nên nhỏ hơn giá trị trung bình. Dữ liệu được hiển thị trên thang đo B được phân phối đối xứng. Nửa bên trái và bên phải của sự phân bố là hình ảnh phản chiếu của chúng. Các giá trị lớn và nhỏ cân bằng lẫn nhau, giá trị trung bình và giá trị trung vị bằng nhau. Dữ liệu được hiển thị trên thang đo B có độ lệch dương. Hình này cho thấy một cái đuôi dài và lệch sang bên phải, gây ra bởi sự hiện diện của các giá trị cao bất thường. Các giá trị quá lớn này sẽ chuyển giá trị trung bình sang phải và nó trở nên lớn hơn giá trị trung bình.

Trong Excel, thống kê mô tả có thể được lấy bằng cách sử dụng bổ trợ Gói phân tích. Xem qua menu Dữ liệuPhân tích dữ liệu, trong cửa sổ mở ra, hãy chọn dòng Thống kê mô tả và bấm vào Được. Trong cửa sổ Thống kê mô tả hãy chắc chắn để chỉ ra khoảng thời gian đầu vào(Hình 11). Nếu bạn muốn xem thống kê mô tả trên cùng một trang tính với dữ liệu gốc, hãy chọn nút radio khoảng thời gian đầu ra và chỉ định ô mà bạn muốn đặt góc trên bên trái của thống kê được hiển thị (trong ví dụ của chúng tôi là $ C $ 1). Nếu bạn muốn xuất dữ liệu sang trang tính mới hoặc sổ làm việc mới, chỉ cần chọn nút radio thích hợp. Chọn hộp bên cạnh Thống kê cuối cùng. Tùy ý, bạn cũng có thể chọn Cấp độ khó,thứ k nhỏ nhất vàlớn thứ k.

Nếu đặt cọc Dữ liệu trong khu vực Phân tích bạn không thấy biểu tượng Phân tích dữ liệu, trước tiên bạn phải cài đặt tiện ích bổ sung Gói phân tích(xem ví dụ,).

Cơm. 11. Thống kê mô tả lợi nhuận trung bình hàng năm trong 5 năm của các quỹ có mức độ rủi ro rất cao, được tính bằng tiện ích bổ sung Phân tích dữ liệu Chương trình Excel

Excel tính toán một số thống kê được thảo luận ở trên: trung bình, trung vị, chế độ, độ lệch chuẩn, phương sai, phạm vi ( khoảng thời gian), tối thiểu, tối đa và kích thước mẫu ( kiểm tra). Ngoài ra, Excel tính toán một số thống kê mới cho chúng tôi: lỗi tiêu chuẩn, kurtosis và độ lệch. lỗi tiêu chuẩn bằng độ lệch chuẩn chia cho căn bậc hai của kích thước mẫu. không đối xứngđặc trưng cho độ lệch khỏi tính đối xứng của phân bố và là một hàm phụ thuộc vào khối lập phương của sự khác biệt giữa các phần tử của mẫu và giá trị trung bình. Kurtosis là thước đo nồng độ tương đối của dữ liệu xung quanh giá trị trung bình so với các phần cuối của phân phối, và phụ thuộc vào sự khác biệt giữa mẫu và giá trị trung bình được nâng lên lũy thừa thứ tư.

Tính toán thống kê mô tả cho dân số chung

Giá trị trung bình, độ phân tán và hình dạng của phân bố được thảo luận ở trên là các đặc điểm dựa trên mẫu. Tuy nhiên, nếu tập dữ liệu chứa các phép đo bằng số của toàn bộ tổng thể, thì các tham số của nó có thể được tính toán. Các tham số này bao gồm giá trị trung bình, phương sai và độ lệch chuẩn của tổng thể.

Gia trị được ki vọng bằng tổng tất cả các giá trị của tổng thể chung chia cho thể tích của tổng thể chung:

ở đâu µ - gia trị được ki vọng, Xtôi- tôi-quan sát biến thứ X, N- khối lượng của dân số chung. Trong Excel, để tính toán kỳ vọng toán học, hàm tương tự được sử dụng như cho giá trị trung bình số học: = AVERAGE ().

Phương sai dân số bằng tổng bình phương chênh lệch giữa các phần tử của tổng thể chung và chiếu. kỳ vọng chia cho quy mô dân số:

ở đâu σ2 là phương sai của tổng thể chung. Excel trước phiên bản 2007 sử dụng hàm = VAR () để tính phương sai tổng thể, bắt đầu với phiên bản 2010 = VAR.G ().

Độ lệch tiêu chuẩn dân số bằng căn bậc hai của phương sai tổng thể:

Trước Excel 2007, hàm = SDV () được sử dụng để tính độ lệch chuẩn dân số, từ phiên bản 2010 = SDV.Y (). Lưu ý rằng các công thức cho phương sai tổng thể và độ lệch chuẩn khác với các công thức cho phương sai mẫu và độ lệch chuẩn. Khi tính toán thống kê mẫu S2S mẫu số của phân số là n - 1 và khi tính toán các tham số σ2σ - khối lượng của dân số chung N.

quy tắc ngón tay cái

Trong hầu hết các tình huống, một tỷ lệ lớn các quan sát tập trung xung quanh dải phân cách, tạo thành một cụm. Trong các tập dữ liệu có độ lệch dương, cụm này nằm ở bên trái (tức là bên dưới) kỳ vọng toán học và trong các bộ có độ lệch âm, cụm này nằm ở bên phải (tức là ở trên) của kỳ vọng toán học. Dữ liệu đối xứng có cùng giá trị trung bình và trung vị, và các quan sát tập hợp xung quanh giá trị trung bình, tạo thành một phân bố hình chuông. Nếu phân phối không có độ lệch rõ rệt và dữ liệu tập trung xung quanh một trọng tâm nhất định, thì một quy tắc ngón tay cái có thể được sử dụng để ước tính độ biến thiên, cho biết: nếu dữ liệu có phân bố hình chuông, thì khoảng 68%. của các quan sát nằm trong một độ lệch chuẩn của kỳ vọng toán học, Khoảng 95% số quan sát nằm trong hai độ lệch chuẩn của giá trị kỳ vọng và 99,7% số quan sát nằm trong độ lệch chuẩn của giá trị kỳ vọng ba.

Do đó, độ lệch chuẩn, là ước tính của dao động trung bình xung quanh kỳ vọng toán học, giúp hiểu cách các quan sát được phân phối và xác định các giá trị ngoại lai. Nó tuân theo quy tắc ngón tay cái rằng đối với phân bố hình chuông, chỉ có một giá trị trong hai mươi khác với kỳ vọng toán học hơn hai độ lệch chuẩn. Do đó, các giá trị bên ngoài khoảng µ ± 2σ, có thể được coi là ngoại lệ. Ngoài ra, chỉ có ba trong số 1000 quan sát khác với kỳ vọng toán học hơn ba độ lệch chuẩn. Do đó, các giá trị bên ngoài khoảng µ ± 3σ hầu như luôn luôn là ngoại lệ. Đối với các bản phân phối có độ lệch cao hoặc không có hình chuông, có thể áp dụng quy tắc ngón tay cái Biename-Chebyshev.

Hơn một trăm năm trước, các nhà toán học Bienamay và Chebyshev đã độc lập phát hiện ra một tính chất hữu ích của độ lệch chuẩn. Họ phát hiện ra rằng đối với bất kỳ tập dữ liệu nào, bất kể hình dạng của phân bố, tỷ lệ phần trăm quan sát nằm ở khoảng cách không vượt quá kđộ lệch chuẩn so với kỳ vọng toán học, không ít (1 – 1/ 2) * 100%.

Ví dụ, nếu k= 2, quy tắc Biename-Chebyshev tuyên bố rằng ít nhất (1 - (1/2) 2) x 100% = 75% các quan sát phải nằm trong khoảng µ ± 2σ. Quy tắc này đúng cho bất kỳ k vượt quá một. Quy tắc Biename-Chebyshev có bản chất rất chung và có giá trị đối với các phân phối thuộc bất kỳ loại nào. Nó chỉ ra số lượng quan sát tối thiểu, khoảng cách từ đó đến kỳ vọng toán học không vượt quá một giá trị nhất định. Tuy nhiên, nếu phân phối là hình chuông, quy tắc ngón tay cái ước tính chính xác hơn nồng độ của dữ liệu xung quanh giá trị trung bình.

Tính toán thống kê mô tả cho phân phối dựa trên tần suất

Nếu dữ liệu gốc không có sẵn, phân bố tần số sẽ trở thành nguồn thông tin duy nhất. Trong những tình huống như vậy, có thể tính toán các giá trị gần đúng của các chỉ số định lượng của phân phối, chẳng hạn như giá trị trung bình số học, độ lệch chuẩn, phần tư.

Nếu dữ liệu mẫu được trình bày dưới dạng phân bố tần số, thì giá trị gần đúng của giá trị trung bình số học có thể được tính toán, giả sử rằng tất cả các giá trị trong mỗi lớp đều tập trung tại điểm giữa của lớp:

ở đâu - ý nghĩa mẫu, N- số lượng quan sát, hoặc cỡ mẫu, với- số lớp trong phân bố tần số, mj- điểm giữa j- hạng thứ, fj- tần số tương ứng với j-thứ hạng.

Để tính toán độ lệch chuẩn từ phân bố tần số, người ta cũng giả định rằng tất cả các giá trị trong mỗi lớp đều tập trung tại điểm giữa của lớp.

Để hiểu cách các phần tư của chuỗi được xác định dựa trên tần suất, chúng ta hãy xem xét tính toán phần tư thấp hơn dựa trên dữ liệu cho năm 2013 về phân bố dân số Nga theo thu nhập tiền mặt bình quân đầu người (Hình 12).

Cơm. 12. Tỷ lệ dân số của Nga với thu nhập tiền tệ bình quân đầu người bình quân mỗi tháng, rúp

Để tính toán phần tư đầu tiên của chuỗi biến thiên khoảng thời gian, bạn có thể sử dụng công thức:

trong đó Q1 là giá trị của phần tư đầu tiên, xQ1 là giới hạn dưới của khoảng chứa phần tư đầu tiên (khoảng được xác định bởi tần suất tích lũy, phần đầu tiên vượt quá 25%); i là giá trị của khoảng thời gian; Σf là tổng các tần số của toàn bộ mẫu; có lẽ luôn luôn bằng 100%; SQ1–1 là tần số tích lũy của khoảng trước khoảng chứa phần tư thấp hơn; fQ1 là tần số của khoảng có chứa phần tư thấp hơn. Công thức cho phần tư thứ ba khác nhau ở mọi chỗ, thay vì Q1, bạn cần sử dụng Q3 và thay thế ¾ thay vì ¼.

Trong ví dụ của chúng tôi (Hình 12), phần tư thấp hơn nằm trong khoảng 7000,1 - 10.000, tần suất tích lũy là 26,4%. Giới hạn dưới của khoảng này là 7000 rúp, giá trị của khoảng là 3000 rúp, tần số tích lũy của khoảng trước khoảng chứa phần tư dưới là 13,4%, tần suất của khoảng chứa phần tư dưới là 13,0%. Do đó: Q1 \ u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \ u003d 9677 rúp.

Cạm bẫy liên quan đến thống kê mô tả

Trong ghi chú này, chúng tôi đã xem xét cách mô tả một tập dữ liệu bằng cách sử dụng các số liệu thống kê khác nhau để ước tính giá trị trung bình, phân tán và phân phối của nó. Bước tiếp theo là phân tích và diễn giải dữ liệu. Cho đến nay, chúng tôi đã nghiên cứu các thuộc tính khách quan của dữ liệu, và bây giờ chúng tôi chuyển sang cách giải thích chủ quan của chúng. Hai sai lầm nằm ở sự chờ đợi của nhà nghiên cứu: đối tượng phân tích được chọn không chính xác và giải thích sai kết quả.

Một phân tích về hoạt động của 15 quỹ tương hỗ có rủi ro rất cao là khá thiếu khách quan. Ông đã dẫn đến những kết luận hoàn toàn khách quan: tất cả các quỹ tương hỗ đều có lợi nhuận khác nhau, chênh lệch lợi nhuận của quỹ dao động từ -6,1 đến 18,5 và lợi nhuận trung bình là 6,08. Tính khách quan của phân tích dữ liệu được đảm bảo bởi sự lựa chọn chính xác của tổng các chỉ tiêu định lượng của phân phối. Một số phương pháp để ước tính giá trị trung bình và độ phân tán của dữ liệu đã được xem xét, đồng thời chỉ ra những ưu và nhược điểm của chúng. Làm thế nào để chọn đúng số liệu thống kê cung cấp một phân tích khách quan và không thiên vị? Nếu phân phối dữ liệu hơi lệch, có nên chọn giá trị trung bình trên giá trị trung bình cộng không? Chỉ báo nào mô tả chính xác hơn sự lan truyền của dữ liệu: độ lệch chuẩn hay phạm vi? Có nên chỉ ra độ lệch dương của phân phối không?

Mặt khác, diễn giải dữ liệu là một quá trình chủ quan. Những người khác nhau đưa ra những kết luận khác nhau, giải thích những kết quả giống nhau. Mọi người đều có quan điểm riêng của họ. Có người coi tổng lợi nhuận trung bình hàng năm của 15 quỹ có mức rủi ro rất cao là tốt và khá hài lòng với thu nhập nhận được. Những người khác có thể nghĩ rằng những quỹ này có lợi nhuận quá thấp. Vì vậy, tính chủ quan cần được bù đắp bằng sự trung thực, trung lập và rõ ràng của các kết luận.

Vấn đề đạo đức

Phân tích dữ liệu có mối liên hệ chặt chẽ với các vấn đề đạo đức. Một người nên phê phán thông tin được phổ biến bởi báo chí, đài phát thanh, truyền hình và Internet. Theo thời gian, bạn sẽ học cách hoài nghi không chỉ về kết quả mà còn về mục tiêu, đối tượng và tính khách quan của nghiên cứu. Chính trị gia nổi tiếng người Anh Benjamin Disraeli đã nói hay nhất: “Có ba loại dối trá: dối trá, dối trá chết tiệt và thống kê”.

Như đã đề cập trong ghi chú, các vấn đề đạo đức nảy sinh khi lựa chọn các kết quả cần được trình bày trong báo cáo. Cả hai kết quả tích cực và tiêu cực nên được công bố. Ngoài ra, khi lập báo cáo hoặc báo cáo bằng văn bản, kết quả phải được trình bày một cách trung thực, trung thực và khách quan. Phân biệt giữa trình bày xấu và không trung thực. Để làm được điều này, cần phải xác định ý định của người nói. Đôi khi người nói bỏ qua thông tin quan trọng do thiếu hiểu biết, và đôi khi cố ý (ví dụ: nếu anh ta sử dụng trung bình số học để ước tính giá trị trung bình của dữ liệu bị sai lệch rõ ràng nhằm thu được kết quả mong muốn). Nó cũng không trung thực để loại bỏ các kết quả không tương ứng với quan điểm của nhà nghiên cứu.

Tài liệu từ cuốn sách Levin và cộng sự. Thống kê cho các nhà quản lý được sử dụng. - M.: Williams, 2004. - tr. 178–209

Hàm QUARTILE được giữ lại để căn chỉnh với các phiên bản Excel trước

Giá trị trung bình dùng để chỉ tổng quát các chỉ tiêu thống kê đưa ra đặc điểm tóm tắt (cuối cùng) của các hiện tượng xã hội đại chúng, vì chúng được xây dựng trên cơ sở một số lượng lớn các giá trị riêng lẻ của một thuộc tính khác nhau. Để làm rõ thực chất của giá trị trung bình, cần xem xét các đặc điểm hình thành giá trị của các dấu hiệu của các hiện tượng đó, từ đó tính giá trị trung bình.

Người ta biết rằng các đơn vị của mỗi hiện tượng khối lượng có rất nhiều tính năng. Cho dù chúng ta sử dụng dấu hiệu nào trong số các dấu hiệu này, giá trị của nó đối với các đơn vị riêng lẻ sẽ khác nhau, chúng thay đổi, hoặc như chúng nói trong thống kê, thay đổi từ đơn vị này sang đơn vị khác. Vì vậy, ví dụ, tiền lương của một nhân viên được xác định bởi trình độ của anh ta, tính chất công việc, thời gian phục vụ và một số yếu tố khác, và do đó thay đổi trong một phạm vi rất rộng. Ảnh hưởng tích lũy của tất cả các yếu tố quyết định số tiền thu nhập của mỗi người lao động, tuy nhiên, chúng ta có thể nói về mức lương trung bình hàng tháng của người lao động trong các lĩnh vực khác nhau của nền kinh tế. Ở đây chúng tôi hoạt động với một giá trị đặc trưng, ​​điển hình của một thuộc tính biến, liên quan đến một đơn vị của một tập hợp lớn.

Mức trung bình phản ánh rằng chung,đặc trưng cho tất cả các đơn vị của dân số được nghiên cứu. Đồng thời, nó cân bằng ảnh hưởng của tất cả các yếu tố tác động lên độ lớn của thuộc tính của các đơn vị riêng lẻ của quần thể, như thể loại bỏ chúng lẫn nhau. Mức độ (hay quy mô) của bất kỳ hiện tượng xã hội nào đều do tác động của hai nhóm nhân tố quyết định. Một số trong số chúng là chung và chính, liên tục hoạt động, liên quan chặt chẽ đến bản chất của hiện tượng hoặc quá trình được nghiên cứu, và hình thành đặc trưng cho tất cả các đơn vị của dân số được nghiên cứu, được phản ánh bằng giá trị trung bình. Những kẻ khác là cá nhân, hành động của họ ít rõ ràng hơn và mang tính chất từng đợt, ngẫu nhiên. Chúng hoạt động theo hướng ngược lại, gây ra sự khác biệt giữa các đặc điểm số lượng của các đơn vị cá thể của quần thể, tìm cách thay đổi giá trị không đổi của các đặc điểm đang được nghiên cứu. Hành động của các dấu hiệu riêng lẻ bị dập tắt trong giá trị trung bình. Trong ảnh hưởng tích lũy của các yếu tố điển hình và riêng lẻ, được cân bằng và loại bỏ lẫn nhau trong các đặc điểm khái quát, điều cơ bản luật số lớn.

Trong tổng thể, các giá trị riêng lẻ của các dấu hiệu hợp nhất thành một khối chung và tan biến. Do đó và giá trị trung bình hoạt động như "vô nhân cách", có thể sai lệch khỏi các giá trị riêng lẻ của các đối tượng địa lý, không trùng khớp về mặt số lượng với bất kỳ giá trị nào trong số chúng. Giá trị trung bình phản ánh cái chung, đặc trưng và tiêu biểu cho toàn bộ tổng thể do sự khác biệt ngẫu nhiên, không điển hình giữa các dấu hiệu của các đơn vị riêng lẻ, vì giá trị của nó được xác định, như nó vốn có, bởi kết quả chung của tất cả nguyên nhân.

Tuy nhiên, để giá trị trung bình phản ánh giá trị tiêu biểu nhất của một đối tượng địa lý thì không nên xác định giá trị này cho bất kỳ quần thể nào mà chỉ xác định cho các quần thể bao gồm các đơn vị đồng nhất về chất. Yêu cầu này là điều kiện chính để áp dụng một cách khoa học các số trung bình và bao hàm mối liên hệ chặt chẽ giữa phương pháp số bình quân và phương pháp phân nhóm trong phân tích các hiện tượng kinh tế - xã hội. Vì vậy, giá trị trung bình là chỉ tiêu tổng hợp đặc trưng cho mức độ điển hình của tính trạng biến đổi trên một đơn vị quần thể thuần nhất trong những điều kiện cụ thể về địa điểm và thời gian.

Do đó, việc xác định bản chất của các giá trị trung bình, cần phải nhấn mạnh rằng việc tính đúng bất kỳ giá trị trung bình nào có nghĩa là đáp ứng các yêu cầu sau:

  • tính đồng nhất về chất của quần thể mà giá trị trung bình được tính toán. Điều này có nghĩa là việc tính toán các giá trị trung bình phải dựa trên phương pháp phân nhóm, đảm bảo lựa chọn các hiện tượng đồng nhất, cùng loại;
  • loại trừ ảnh hưởng đến việc tính toán giá trị trung bình của các nguyên nhân và yếu tố ngẫu nhiên, thuần túy riêng lẻ. Điều này đạt được trong trường hợp khi tính toán giá trị trung bình dựa trên một vật liệu đủ lớn, trong đó sự vận hành của quy luật số lớn được biểu hiện, và tất cả các tai nạn đều triệt tiêu lẫn nhau;
  • khi tính toán giá trị trung bình, điều quan trọng là phải thiết lập mục đích của phép tính và cái gọi là xác định chỉ báo-tel(thuộc tính) mà nó nên được định hướng.

Chỉ số xác định có thể đóng vai trò là tổng các giá trị của đối tượng địa lý được tính trung bình, tổng các giá trị tương hỗ của nó, tích các giá trị của nó, v.v. Mối quan hệ giữa chỉ số xác định và giá trị trung bình được biểu thị như sau: nếu tất cả các giá trị Của đối tượng trung bình được thay thế bằng giá trị trung bình, khi đó tổng hoặc tích của chúng trong trường hợp này sẽ không thay đổi chỉ số xác định. Trên cơ sở kết nối này của chỉ tiêu xác định với giá trị trung bình, một tỷ lệ định lượng ban đầu được xây dựng để tính toán trực tiếp giá trị trung bình. Khả năng của các giá trị trung bình để bảo toàn các thuộc tính của các quần thể thống kê được gọi là xác định tài sản.

Giá trị trung bình được tính cho tổng thể được gọi là trung bình chung; giá trị trung bình được tính cho mỗi nhóm - trung bình nhóm. Số trung bình chung phản ánh những nét chung của hiện tượng đang nghiên cứu, trung bình nhóm đưa ra mô tả về hiện tượng phát triển trong điều kiện cụ thể của nhóm này.

Các phương pháp tính toán có thể khác nhau, do đó, trong thống kê, một số loại trung bình được phân biệt, trong đó chủ yếu là trung bình số học, trung bình điều hòa và trung bình hình học.

Trong phân tích kinh tế, việc sử dụng số bình quân là công cụ chủ yếu để đánh giá kết quả của tiến bộ khoa học và công nghệ, đo lường xã hội, tìm kiếm nguồn dự trữ cho phát triển kinh tế. Đồng thời, cần nhớ rằng việc tập trung quá mức vào các số trung bình có thể dẫn đến các kết luận sai lệch khi tiến hành phân tích kinh tế và thống kê. Điều này là do thực tế là các giá trị trung bình, là các chỉ số tổng quát hóa, loại bỏ và bỏ qua những khác biệt đó trong các đặc điểm định lượng của các đơn vị riêng lẻ của quần thể thực sự tồn tại và có thể được quan tâm độc lập.

Các loại trung bình

Trong thống kê, nhiều loại giá trị trung bình khác nhau được sử dụng, được chia thành hai loại lớn:

  • trung bình công suất (trung bình hài hòa, trung bình hình học, trung bình cộng, trung bình bình phương, trung bình ba);
  • trung bình cơ cấu (chế độ, trung vị).

Tính toán quyền lực có nghĩa là tất cả các giá trị đặc trưng có sẵn phải được sử dụng. Thời trangTrung bình chỉ được xác định bởi cấu trúc phân phối, do đó chúng được gọi là cấu trúc, trung bình vị trí. Giá trị trung bình và chế độ thường được sử dụng như một đặc tính trung bình trong các quần thể mà việc tính toán hàm mũ trung bình là không thể hoặc không thực tế.

Loại trung bình phổ biến nhất là trung bình số học. Ở dưới trung bình cộngđược hiểu là một giá trị của đối tượng địa lý mà mỗi đơn vị dân số sẽ có nếu tổng tất cả các giá trị của đối tượng địa lý được phân phối đồng đều giữa tất cả các đơn vị đối tượng địa lý. Việc tính toán giá trị này được rút gọn thành tổng tất cả các giá trị của thuộc tính biến và phép chia số lượng kết quả cho tổng số đơn vị dân số. Ví dụ: năm công nhân đã hoàn thành đơn đặt hàng sản xuất các bộ phận, trong khi người đầu tiên sản xuất 5 bộ phận, người thứ hai - 7, người thứ ba - 4, người thứ tư - 10, người thứ năm - 12. Vì giá trị của mỗi phương án chỉ xảy ra một lần trong dữ liệu ban đầu, để xác định sản lượng trung bình của một công nhân nên áp dụng công thức trung bình cộng đơn giản:

tức là, trong ví dụ của chúng tôi, sản lượng trung bình của một công nhân bằng

Cùng với trung bình cộng đơn giản, các em học trung bình cộng có trọng số. Ví dụ: hãy tính tuổi trung bình của học sinh trong một nhóm 20 học sinh có độ tuổi từ 18 đến 22 tuổi, ở đâu xi- các biến thể của tính năng được tính trung bình, fi- tần suất, cho biết số lần nó xảy ra i-th giá trị tổng hợp (Bảng 5.1).

Bảng 5.1

Tuổi trung bình của học sinh

Áp dụng công thức trung bình cộng có trọng số, chúng ta nhận được:


Có một quy tắc nhất định để chọn giá trị trung bình số học có trọng số: nếu có một chuỗi dữ liệu về hai chỉ số, thì cần tính toán cho một trong số đó.

giá trị trung bình và đồng thời, các giá trị số \ u200b \ u200bof mẫu số của công thức logic của nó đã được biết và các giá trị \ u200b \ u200bof của tử số là không xác định, nhưng có thể được tìm thấy dưới dạng tích của các chỉ số này, sau đó giá trị trung bình phải được tính bằng công thức bình quân gia quyền số học.

Trong một số trường hợp, bản chất của dữ liệu thống kê ban đầu làm cho việc tính giá trị trung bình số học mất đi ý nghĩa của nó và chỉ số tổng quát duy nhất chỉ có thể là một loại giá trị trung bình khác - sóng hài trung bình. Hiện nay, các thuộc tính tính toán của giá trị trung bình số học đã không còn phù hợp trong việc tính toán các chỉ tiêu thống kê tổng quát do sự ra đời rộng rãi của máy tính điện tử. Giá trị sóng hài trung bình, cũng đơn giản và có trọng số, có tầm quan trọng thực tế rất lớn. Nếu các giá trị tử số của công thức logic đã biết và các giá trị của mẫu số chưa biết, nhưng có thể được tìm thấy dưới dạng thương số của một chỉ số này bởi một chỉ số khác, thì giá trị trung bình được tính bằng điều hòa có trọng số công thức nghĩa.

Ví dụ, cho biết rằng ô tô đi quãng đường 210 km đầu với vận tốc 70 km / h, 150 km còn lại với vận tốc 75 km / h. Không thể xác định vận tốc trung bình của ô tô trong suốt quãng đường dài 360 km bằng công thức trung bình cộng. Vì các tùy chọn là tốc độ trong các phần riêng lẻ xj= 70 km / h và x2= 75 km / h, và trọng lượng (fi) là các đoạn tương ứng của đường đi, khi đó sản phẩm của các tùy chọn theo trọng lượng sẽ không có ý nghĩa vật lý và kinh tế. Trong trường hợp này, ý nghĩa được tính bằng phần nhỏ của việc chia các đoạn của con đường thành các tốc độ tương ứng (tùy chọn xi), tức là thời gian dành cho việc đi qua các đoạn riêng lẻ của con đường (fi / xi). Nếu các đoạn của đường dẫn được biểu thị bằng fi, thì toàn bộ đường đi được biểu thị bằng Σfi và thời gian dành cho toàn bộ đường đi được biểu thị bằng Σ fi / xi , Sau đó, tốc độ trung bình có thể được tìm thấy bằng thương số của tổng quãng đường chia cho tổng thời gian đã sử dụng:

Trong ví dụ của chúng tôi, chúng tôi nhận được:

Nếu khi sử dụng trọng số hài trung bình của tất cả các tùy chọn (f) bằng nhau, thì thay vì trọng số hài, bạn có thể sử dụng trung bình hài đơn giản (không trọng số):

trong đó xi - các tùy chọn riêng lẻ; N- số lượng biến thể của đối tượng địa lý được tính trung bình. Trong ví dụ về tốc độ, một giá trị trung bình điều hòa đơn giản có thể được áp dụng nếu các đoạn của đường đi ở các tốc độ khác nhau là bằng nhau.

Bất kỳ giá trị trung bình nào cũng phải được tính toán sao cho khi nó thay thế từng biến thể của đối tượng được tính trung bình, giá trị của một số chỉ số tổng quát, cuối cùng, được liên kết với chỉ số được tính trung bình, không thay đổi. Vì vậy, khi thay thế tốc độ thực tế trên các đoạn đường riêng lẻ bằng giá trị trung bình của chúng (tốc độ trung bình), thì tổng khoảng cách không được thay đổi.

Hình thức (công thức) của giá trị trung bình được xác định bởi bản chất (cơ chế) của mối quan hệ của chỉ tiêu cuối cùng này với giá trị trung bình, do đó chỉ tiêu cuối cùng, giá trị của nó không được thay đổi khi các phương án được thay thế bằng giá trị trung bình của chúng , được gọi là xác định chỉ số.Để tính được công thức trung bình, bạn cần phải soạn và giải một phương trình bằng cách sử dụng mối quan hệ của chỉ số trung bình với chỉ số xác định. Phương trình này được xây dựng bằng cách thay thế các biến thể của đối tượng địa lý (chỉ số) trung bình bằng giá trị trung bình của chúng.

Ngoài giá trị trung bình cộng và giá trị trung bình điều hòa, các dạng (dạng) khác của giá trị trung bình cũng được sử dụng trong thống kê. Tất cả chúng đều là những trường hợp đặc biệt. mức độ trung bình. Nếu chúng tôi tính toán tất cả các loại trung bình của luật lũy thừa cho cùng một dữ liệu, thì các giá trị

chúng sẽ giống nhau, quy tắc áp dụng ở đây chuyên ngành Trung bình. Khi số mũ của giá trị trung bình tăng lên, thì bản thân giá trị trung bình cũng tăng lên. Công thức được sử dụng thường xuyên nhất trong các công thức nghiên cứu thực tế để tính toán các loại công suất trung bình khác nhau được trình bày trong Bảng. 5.2.

Bảng 5.2


Giá trị trung bình hình học được áp dụng khi có sẵn. N các yếu tố tăng trưởng, trong khi các giá trị riêng lẻ của đặc điểm, theo quy luật, là các giá trị tương đối của động lực, được xây dựng dưới dạng giá trị chuỗi, như một tỷ lệ với mức trước đó của mỗi mức trong chuỗi động lực. Do đó, giá trị trung bình đặc trưng cho tốc độ tăng trưởng trung bình. hình học có nghĩa là đơn giản tính theo công thức

Công thức trung bình hình học có trọng số có dạng sau:

Các công thức trên giống hệt nhau, nhưng một công thức được áp dụng cho các hệ số hoặc tốc độ tăng trưởng hiện tại, và công thức thứ hai - ở các giá trị tuyệt đối của các mức của chuỗi.

căn bậc hai có nghĩa làđược sử dụng khi tính toán với các giá trị của hàm bình phương, được sử dụng để đo mức độ biến động của các giá trị riêng lẻ của một đặc điểm xung quanh trung bình cộng trong chuỗi phân phối và được tính bằng công thức

Trọng số trung bình bình phươngđược tính bằng một công thức khác:

Khối trung bìnhđược sử dụng khi tính toán với các giá trị của hàm bậc ba và được tính bằng công thức

khối trung bình có trọng số:

Tất cả các giá trị trung bình ở trên có thể được biểu diễn dưới dạng công thức chung:

giá trị trung bình ở đâu; - giá trị cá nhân; N- số lượng đơn vị của dân số được nghiên cứu; k- số mũ, xác định loại trung bình.

Khi sử dụng cùng một dữ liệu nguồn, càng k trong công thức trung bình lũy thừa chung, giá trị trung bình càng lớn. Do đó, có một mối quan hệ thường xuyên giữa các giá trị của quyền lực có nghĩa là:

Các giá trị trung bình được mô tả ở trên cung cấp một ý tưởng khái quát về dân số đang được nghiên cứu, và từ quan điểm này, ý nghĩa lý thuyết, ứng dụng và nhận thức của chúng là không thể chối cãi. Nhưng điều xảy ra là giá trị của giá trị trung bình không trùng với bất kỳ phương án nào thực sự hiện có, do đó, ngoài các giá trị trung bình đã xem xét, trong phân tích thống kê, nên sử dụng các giá trị của các phương án cụ thể chiếm một giếng. -vị trí xác định trong một chuỗi giá trị thuộc tính có thứ tự (được xếp hạng). Trong số những đại lượng này, thường được sử dụng nhất là cấu trúc, hoặc mô tả, trung bình- chế độ (Mo) và trung vị (Me).

Thời trang- giá trị của tính trạng thường có ở quần thể này. Liên quan đến chuỗi biến thể, chế độ là giá trị xuất hiện thường xuyên nhất của chuỗi được xếp hạng, tức là biến thể có tần suất cao nhất. Thời trang có thể được sử dụng để xác định các cửa hàng được ghé thăm nhiều nhất, mức giá chung nhất cho bất kỳ sản phẩm nào. Nó cho biết kích thước của đối tượng địa lý, đặc điểm của một bộ phận đáng kể dân số và được xác định bằng công thức

trong đó x0 là giới hạn dưới của khoảng; h- giá trị khoảng thời gian; fm- tần số khoảng thời gian; fm_ 1 - tần số của khoảng thời gian trước đó; fm + 1 - tần số của khoảng tiếp theo.

Trung bình biến thể nằm ở trung tâm của hàng đã xếp hạng được gọi. Trung vị chia chuỗi thành hai phần bằng nhau sao cho ở cả hai phía của nó có cùng số đơn vị dân số. Đồng thời, ở một nửa số đơn vị dân số, giá trị của thuộc tính biến nhỏ hơn giá trị trung vị, ở nửa còn lại lớn hơn giá trị của nó. Trung vị được sử dụng khi nghiên cứu một phần tử có giá trị lớn hơn hoặc bằng hoặc đồng thời nhỏ hơn hoặc bằng một nửa số phần tử của chuỗi phân phối. Trung vị cho biết khái niệm chung về vị trí các giá trị của đối tượng địa lý được tập trung, hay nói cách khác, trung tâm của chúng ở đâu.

Tính chất mô tả của giá trị trung bình được thể hiện ở chỗ nó đặc trưng cho ranh giới định lượng của các giá trị của thuộc tính khác nhau, được sở hữu bởi một nửa số đơn vị dân số. Bài toán tìm giá trị trung bình cho một chuỗi biến phân rời rạc được giải một cách đơn giản. Nếu tất cả các đơn vị của chuỗi đều được gán số sê-ri, thì số sê-ri của biến thể trung bình được xác định là (n + 1) / 2 với số phần tử lẻ là n. Nếu số phần tử của chuỗi là số chẵn, thì giá trị trung bình sẽ là giá trị trung bình của hai biến thể có số sê-ri N/ 2 và N / 2 + 1.

Khi xác định giá trị trung bình trong chuỗi biến thiên khoảng, khoảng mà nó nằm (khoảng trung bình) được xác định đầu tiên. Khoảng này được đặc trưng bởi thực tế là tổng các tần số tích lũy của nó bằng hoặc vượt quá một nửa tổng tất cả các tần số của chuỗi. Việc tính số trung vị của chuỗi biến thiên khoảng được thực hiện theo công thức

ở đâu X0- giới hạn dưới của khoảng thời gian; h- giá trị khoảng thời gian; fm- tần số khoảng thời gian; f- số lượng thành viên của chuỗi;

∫m-1 - tổng các số hạng tích lũy của dãy số đứng trước dãy số này.

Cùng với giá trị trung vị, để mô tả đầy đủ hơn về đặc điểm cấu trúc của dân số được nghiên cứu, các giá trị khác của các phương án cũng được sử dụng, chiếm một vị trí khá xác định trong dãy số được xếp hạng. Bao gồm các tứ phân vịdeciles. Phần tư chia chuỗi theo tổng tần số thành 4 phần bằng nhau và phân chia - thành 10 phần bằng nhau. Có ba phần tư và chín phần mười.

Giá trị trung bình và phương thức, trái ngược với giá trị trung bình số học, không loại bỏ sự khác biệt riêng lẻ trong các giá trị của một thuộc tính biến số và do đó, là những đặc điểm bổ sung và rất quan trọng của tổng thể thống kê. Trong thực tế, chúng thường được sử dụng thay vì mức trung bình hoặc cùng với nó. Đặc biệt thích hợp để tính giá trị trung vị và chế độ trong những trường hợp khi tổng thể được nghiên cứu chứa một số đơn vị nhất định với giá trị rất lớn hoặc rất nhỏ của thuộc tính biến. Các giá trị này của các phương án, không đặc trưng cho dân số, trong khi ảnh hưởng đến giá trị của trung bình cộng, không ảnh hưởng đến các giá trị của trung vị và phương thức, điều này làm cho các chỉ số sau rất có giá trị cho phân tích kinh tế và thống kê .

Các chỉ số biến đổi

Mục đích của một nghiên cứu thống kê là xác định các thuộc tính và mô hình chính của tổng thể thống kê được nghiên cứu. Trong quá trình xử lý tóm tắt dữ liệu quan sát thống kê, chúng tôi xây dựng đường phân phối. Có hai loại chuỗi phân phối - phân bổ và biến phân, tùy thuộc vào việc thuộc tính được lấy làm cơ sở của nhóm là định tính hay định lượng.

biến dịđược gọi là chuỗi phân phối được xây dựng trên cơ sở định lượng. Giá trị của các đặc trưng số lượng đối với các đơn vị riêng lẻ của quần thể không phải là hằng số, ít nhiều khác nhau. Sự khác biệt về độ lớn của một tính trạng được gọi là các biến thể. Các giá trị số riêng biệt của tính trạng xuất hiện trong quần thể nghiên cứu được gọi là các tùy chọn giá trị. Sự hiện diện của sự biến đổi trong các đơn vị cá thể của quần thể là do ảnh hưởng của một số lượng lớn các nhân tố đến sự hình thành mức độ tính trạng. Việc nghiên cứu bản chất và mức độ biến động của các dấu hiệu trong các đơn vị riêng lẻ của dân số là vấn đề quan trọng nhất của bất kỳ nghiên cứu thống kê nào. Các chỉ số biến đổi được sử dụng để mô tả thước đo sự biến đổi của tính trạng.

Một nhiệm vụ quan trọng khác của nghiên cứu thống kê là xác định vai trò của các nhân tố riêng lẻ hoặc nhóm của chúng đối với sự biến đổi của các đặc điểm nhất định của dân số. Để giải quyết một vấn đề như vậy trong thống kê, các phương pháp đặc biệt để nghiên cứu sự biến đổi được sử dụng, dựa trên việc sử dụng một hệ thống các chỉ số đo lường sự biến động. Trong thực tế, nhà nghiên cứu phải đối mặt với một số lượng đủ lớn các lựa chọn cho các giá trị của thuộc tính, điều này không đưa ra ý tưởng về sự phân bố của các đơn vị theo giá trị của thuộc tính trong tổng thể. Để làm điều này, tất cả các biến thể của giá trị thuộc tính được sắp xếp theo thứ tự tăng dần hoặc giảm dần. Quá trình này được gọi là xếp hạng hàng. Chuỗi được xếp hạng ngay lập tức đưa ra ý tưởng chung về các giá trị mà đối tượng địa lý tổng hợp.

Việc thiếu giá trị trung bình để mô tả toàn bộ đặc điểm của quần thể khiến cần phải bổ sung các giá trị trung bình với các chỉ số để có thể đánh giá tính điển hình của các giá trị trung bình này bằng cách đo lường sự dao động (biến thiên) của đặc điểm đang nghiên cứu. Việc sử dụng các chỉ tiêu biến thiên này giúp cho việc phân tích thống kê được đầy đủ và có ý nghĩa hơn, từ đó hiểu rõ hơn bản chất của các hiện tượng xã hội được nghiên cứu.

Các dấu hiệu đơn giản nhất của sự biến đổi là tối thiểutối đa -đây là giá trị nhỏ nhất và lớn nhất của đối tượng địa lý trong tổng thể. Số lần lặp lại các biến thể riêng lẻ của các giá trị đối tượng được gọi là tỷ lệ lặp lại. Hãy để chúng tôi biểu thị tần suất lặp lại của giá trị đối tượng địa lý fi, tổng các tần số bằng với khối lượng của dân số được nghiên cứu sẽ là:

ở đâu k- số lượng biến thể của các giá trị thuộc tính. Thật tiện lợi khi thay thế các tần số bằng các tần số - Wi. Tính thường xuyên- chỉ báo tần số tương đối - có thể được biểu thị bằng phần nhỏ của một đơn vị hoặc tỷ lệ phần trăm và cho phép bạn so sánh chuỗi biến thiên với một số lượng quan sát khác nhau. Về mặt chính thức, chúng tôi có:

Để đo lường sự biến đổi của một tính trạng, các chỉ số tuyệt đối và tương đối khác nhau được sử dụng. Các chỉ báo tuyệt đối của sự thay đổi bao gồm độ lệch tuyến tính trung bình, khoảng biến thiên, phương sai, độ lệch chuẩn.

Biến thể nhịp(R) là hiệu số giữa giá trị tối đa và giá trị nhỏ nhất của tính trạng trong quần thể nghiên cứu: R= Xmax - Xmin. Chỉ báo này chỉ cung cấp ý tưởng chung nhất về sự biến động của đặc điểm đang nghiên cứu, vì nó chỉ cho thấy sự khác biệt giữa các giá trị giới hạn của các tùy chọn. Nó hoàn toàn không liên quan đến các tần số trong chuỗi biến phân, nghĩa là, với bản chất của phân phối, và sự phụ thuộc của nó có thể tạo cho nó một đặc tính ngẫu nhiên, không ổn định chỉ từ các giá trị cực đoan của đặc điểm. Phạm vi biến động không cung cấp bất kỳ thông tin nào về các đặc điểm của các quần thể được nghiên cứu và không cho phép chúng tôi đánh giá mức độ điển hình của các giá trị trung bình thu được. Phạm vi của chỉ thị này được giới hạn trong các quần thể khá đồng nhất, chính xác hơn là nó đặc trưng cho sự biến đổi của một tính trạng, một chỉ số dựa trên việc tính đến sự biến đổi của tất cả các giá trị của tính trạng đó.

Để mô tả sự biến đổi của một tính trạng, cần phải khái quát độ lệch của tất cả các giá trị so với bất kỳ giá trị nào đặc trưng cho quần thể đang nghiên cứu. Các chỉ số như vậy

các biến thể, chẳng hạn như độ lệch tuyến tính trung bình, phương sai và độ lệch chuẩn, dựa trên việc xem xét độ lệch của các giá trị thuộc tính của các đơn vị riêng lẻ của tổng thể so với giá trị trung bình số học.

Độ lệch tuyến tính trung bình là trung bình cộng của các giá trị tuyệt đối của độ lệch của các tùy chọn riêng lẻ so với trung bình cộng của chúng:


Giá trị tuyệt đối (môđun) của độ lệch biến thể so với giá trị trung bình cộng; f- tần số.

Công thức đầu tiên được áp dụng nếu mỗi tùy chọn xuất hiện trong tổng thể chỉ một lần và công thức thứ hai - trong chuỗi với tần suất không bằng nhau.

Có một cách khác để tính trung bình độ lệch của các tùy chọn so với giá trị trung bình số học. Phương pháp này, rất phổ biến trong thống kê, được rút gọn để tính toán độ lệch bình phương của các tùy chọn từ giá trị trung bình với giá trị trung bình tiếp theo của chúng. Trong trường hợp này, chúng tôi nhận được một chỉ báo mới về sự thay đổi - phương sai.

Sự phân tán(σ 2) - giá trị trung bình của độ lệch bình phương của các biến thể của các giá trị tính trạng so với giá trị trung bình của chúng:

Công thức thứ hai được sử dụng nếu các biến thể có trọng số riêng (hoặc tần số của chuỗi biến thể).

Trong phân tích kinh tế và thống kê, thông thường để đánh giá sự biến đổi của một thuộc tính thường sử dụng độ lệch chuẩn. Độ lệch chuẩn(σ) là căn bậc hai của phương sai:

Độ lệch trung bình tuyến tính và bình phương trung bình cho biết giá trị của thuộc tính dao động trung bình bao nhiêu đối với các đơn vị dân số đang được nghiên cứu và được biểu thị bằng các đơn vị giống như các biến thể.

Trong thực hành thống kê, việc so sánh sự thay đổi của các đối tượng địa lý thường trở nên cần thiết. Ví dụ, rất quan tâm đến việc so sánh các biến thể về độ tuổi của nhân sự và trình độ chuyên môn, thời gian phục vụ và tiền lương của họ, v.v. . Trên thực tế, không thể so sánh sự dao động của kinh nghiệm làm việc, tính bằng năm, với sự dao động của tiền lương, tính bằng rúp và kopecks.

Khi so sánh sự biến đổi của các tính trạng khác nhau trong tổng thể, sẽ tiện lợi khi sử dụng các chỉ báo tương đối về sự biến đổi. Các chỉ tiêu này được tính bằng tỷ lệ giữa các chỉ tiêu tuyệt đối với trung bình cộng (hoặc trung vị). Sử dụng phạm vi biến thiên, độ lệch tuyến tính trung bình, độ lệch chuẩn làm chỉ báo tuyệt đối về sự biến đổi, người ta sẽ thu được các chỉ số dao động tương đối:


Là chỉ số được sử dụng phổ biến nhất về sự biến động tương đối, đặc trưng cho tính đồng nhất của quần thể. Tập hợp được coi là đồng nhất nếu hệ số biến thiên không vượt quá 33% đối với các phân phối gần với bình thường.

Giả sử rằng bạn cần tìm số ngày trung bình để các nhân viên khác nhau hoàn thành nhiệm vụ. Hoặc bạn muốn tính toán khoảng thời gian 10 năm Nhiệt độ trung bình vào một ngày cụ thể. Tính giá trị trung bình của một dãy số bằng một số cách.

Giá trị trung bình là một hàm của thước đo xu hướng trung tâm, là trung tâm của một chuỗi số trong phân phối thống kê. Ba tiêu chí phổ biến nhất cho xu hướng trung tâm là.

    Trung bình Trung bình cộng được tính bằng cách cộng một dãy số rồi chia cho số đó. Ví dụ, trung bình cộng của 2, 3, 3, 5, 7 và 10 có 30 chia hết cho 6, 5;

    Trung bình Số chính giữa của một dãy số. Một nửa số có giá trị lớn hơn Trung vị và một nửa số có giá trị nhỏ hơn Trung vị. Ví dụ: trung vị của 2, 3, 3, 5, 7 và 10 là 4.

    Cách thức Số xuất hiện thường xuyên nhất trong một nhóm số. Ví dụ: chế độ 2, 3, 3, 5, 7 và 10 - 3.

Ba thước đo xu hướng trung tâm của sự phân bố đối xứng của một dãy số là một và giống nhau. Trong phân phối không đối xứng của một số số, chúng có thể khác nhau.

Tính giá trị trung bình của các ô nằm liên tục trong một hàng hoặc một cột

Làm như sau.

Tính giá trị trung bình của các ô phân tán

Để hoàn thành nhiệm vụ này, hãy sử dụng hàm TRUNG BÌNH. Sao chép bảng dưới đây vào một trang giấy trắng.

Tính bình quân gia quyền

GIỚI THIỆUlượng. Ví dụ vThis tính toán đơn giá trung bình được trả cho ba lần mua, trong đó mỗi lần mua là một số lượng đơn vị đo lường khác nhau với các đơn giá khác nhau.

Sao chép bảng dưới đây vào một trang giấy trắng.

Tính giá trị trung bình của các số, bỏ qua các giá trị 0

Để hoàn thành nhiệm vụ này, hãy sử dụng các hàm TRUNG BÌNHnếu. Hãy sao chép bảng bên dưới và ghi nhớ rằng trong ví dụ này, để dễ hiểu hơn, hãy sao chép nó vào một trang giấy trắng.