Bình phương của độ lệch chuẩn. Sự phân tán

Các nhà toán học và thống kê thông minh đã đưa ra một chỉ số đáng tin cậy hơn, mặc dù với một mục đích hơi khác - có nghĩa là độ lệch tuyến tính. Chỉ số này đặc trưng cho phép đo mức độ lan truyền các giá trị của tập dữ liệu xung quanh giá trị trung bình của chúng.

Để hiển thị thước đo mức độ lan truyền dữ liệu, trước tiên bạn phải xác định mức độ chênh lệch này sẽ được coi là tương đối với giá trị nào - thường đây là giá trị trung bình. Tiếp theo, bạn cần tính toán xem các giá trị của tập dữ liệu được phân tích khác xa giá trị trung bình như thế nào. Rõ ràng là mỗi giá trị tương ứng với một lượng sai lệch nhất định, nhưng chúng tôi cũng quan tâm đến một ước tính chung bao gồm toàn bộ tổng thể. Do đó, độ lệch trung bình được tính bằng công thức của giá trị trung bình cộng thông thường. Nhưng mà! Nhưng để tính giá trị trung bình của các độ lệch, trước tiên chúng phải được cộng. Và nếu chúng ta cộng các số dương và số âm, chúng sẽ triệt tiêu lẫn nhau và tổng của chúng sẽ có xu hướng bằng không. Để tránh điều này, tất cả các độ lệch được lấy theo modulo, tức là tất cả các số âm đều trở thành số dương. Bây giờ độ lệch trung bình sẽ hiển thị một thước đo tổng quát về sự lây lan của các giá trị. Kết quả là, độ lệch tuyến tính trung bình sẽ được tính theo công thức:

một là độ lệch tuyến tính trung bình,

x- chỉ số được phân tích, với dấu gạch ngang ở trên cùng - giá trị trung bình của chỉ báo,

N là số lượng giá trị trong tập dữ liệu được phân tích,

Tôi hy vọng điều hành tổng kết không làm ai sợ.

Độ lệch tuyến tính trung bình được tính bằng công thức đã chỉ định phản ánh độ lệch tuyệt đối trung bình so với giá trị trung bình của tổng thể này.

Đường màu đỏ trong hình là giá trị trung bình. Độ lệch của mỗi quan sát so với giá trị trung bình được biểu thị bằng các mũi tên nhỏ. Chúng được lấy modulo và tổng hợp lại. Sau đó, mọi thứ được chia cho số lượng giá trị.

Để hoàn thành bức tranh, cần đưa ra một ví dụ nữa. Giả sử có một công ty sản xuất cây giâm xẻng. Mỗi vết cắt nên dài 1,5 mét, nhưng quan trọng hơn, tất cả phải như nhau, hoặc ít nhất cộng trừ 5 cm, tuy nhiên, người thợ cẩu thả sẽ cắt bỏ 1,2 m, rồi 1,8 m. Giám đốc công ty quyết định tiến hành thống kê độ dài của cành giâm. Tôi chọn 10 mảnh và đo chiều dài của chúng, tìm giá trị trung bình và tính toán độ lệch tuyến tính trung bình. Mức trung bình hóa ra là vừa phải - 1,5 m. Nhưng độ lệch tuyến tính trung bình hóa ra là 0,16 m. Vì vậy, hóa ra mỗi lần cắt dài hơn hoặc ngắn hơn mức cần thiết trung bình là 16 cm. Có điều gì đó để nói với người lao động . Thực ra tôi chưa thấy công dụng thực sự của chỉ báo này nên tôi tự nghĩ ra một ví dụ. Tuy nhiên, có một chỉ số như vậy trong số liệu thống kê.

Sự phân tán

Giống như độ lệch tuyến tính trung bình, phương sai cũng phản ánh mức độ lan truyền dữ liệu xung quanh giá trị trung bình.

Công thức tính phương sai có dạng như sau:

(đối với chuỗi biến thể (phương sai có trọng số))

(đối với dữ liệu chưa được nhóm (phương sai đơn giản))

Trong đó: σ 2 - độ phân tán, Xi- chúng tôi phân tích chỉ số sq (giá trị tính năng), - giá trị trung bình của chỉ báo, f i - số lượng giá trị trong tập dữ liệu được phân tích.

Phương sai là bình phương trung bình của độ lệch.

Đầu tiên, giá trị trung bình được tính toán, sau đó, sự khác biệt giữa mỗi đường cơ sở và giá trị trung bình được lấy, bình phương, nhân với tần suất của giá trị đối tượng địa lý tương ứng, được thêm vào, sau đó chia cho số lượng giá trị trong tổng thể.

Tuy nhiên, ở dạng thuần túy của nó, chẳng hạn như, chẳng hạn, độ phân tán trung bình số học, hoặc chỉ số, không được sử dụng. Nó đúng hơn là một chỉ báo phụ trợ và trung gian được sử dụng cho các loại phân tích thống kê khác.

Cách đơn giản để tính phương sai

độ lệch chuẩn

Để sử dụng phương sai cho phân tích dữ liệu, một căn bậc hai được lấy từ nó. Hóa ra cái gọi là độ lệch chuẩn.

Nhân tiện, độ lệch chuẩn còn được gọi là sigma - từ chữ cái Hy Lạp biểu thị nó.

Độ lệch chuẩn rõ ràng cũng đặc trưng cho phép đo độ phân tán dữ liệu, nhưng bây giờ (không giống độ phân tán) nó có thể được so sánh với dữ liệu ban đầu. Theo quy luật, các chỉ báo bình phương trung bình trong thống kê cho kết quả chính xác hơn các chỉ báo tuyến tính. Do đó, độ lệch chuẩn là thước đo độ phân tán dữ liệu chính xác hơn độ lệch tuyến tính trung bình.

Khi kiểm định thống kê các giả thuyết, khi đo lường mối quan hệ tuyến tính giữa các biến ngẫu nhiên.

Độ lệch chuẩn:

Độ lệch chuẩn(ước tính độ lệch chuẩn của biến ngẫu nhiên Sàn, tường xung quanh và trần nhà, x so với kỳ vọng toán học của nó dựa trên một ước tính không thiên vị về phương sai của nó):

ở đâu - phương sai; - Sàn nhà, tường xung quanh và trần nhà, tôi-thành phần mẫu; - cỡ mẫu; - trung bình cộng của mẫu:

Cần lưu ý rằng cả hai ước tính đều sai lệch. Trong trường hợp chung, không thể xây dựng một ước tính không chệch. Tuy nhiên, ước tính dựa trên ước tính phương sai không chệch là nhất quán.

quy tắc ba sigma

quy tắc ba sigma() - hầu hết tất cả các giá trị của một biến ngẫu nhiên có phân phối chuẩn nằm trong khoảng. Nghiêm ngặt hơn - với độ chắc chắn không dưới 99,7%, giá trị của một biến ngẫu nhiên có phân phối chuẩn nằm trong khoảng xác định (với điều kiện giá trị đó là đúng và không thu được do xử lý mẫu).

Nếu giá trị thực là không xác định, thì bạn không nên sử dụng, nhưng sàn nhà, các bức tường xung quanh chúng ta và trần nhà, S. Do đó, quy tắc ba sigma được dịch thành quy tắc ba Tầng, những bức tường xung quanh chúng ta và trần nhà, S .

Giải thích giá trị của độ lệch chuẩn

Một giá trị lớn của độ lệch chuẩn cho thấy một sự chênh lệch lớn của các giá trị trong tập hợp được trình bày với giá trị trung bình của tập hợp đó; một giá trị nhỏ, tương ứng, cho biết rằng các giá trị trong tập hợp được nhóm xung quanh giá trị trung bình.

Ví dụ, chúng ta có ba bộ số: (0, 0, 14, 14), (0, 6, 8, 14) và (6, 6, 8, 8). Cả ba tập hợp đều có giá trị trung bình là 7 và độ lệch chuẩn lần lượt là 7, 5 và 1. Tập hợp cuối cùng có độ lệch chuẩn nhỏ vì các giá trị trong tập hợp được nhóm xung quanh giá trị trung bình; tập hợp đầu tiên có giá trị lớn nhất của độ lệch chuẩn - các giá trị trong tập hợp phân biệt mạnh so với giá trị trung bình.

Theo nghĩa chung, độ lệch chuẩn có thể được coi là một thước đo của độ không đảm bảo. Ví dụ, trong vật lý, độ lệch chuẩn được sử dụng để xác định sai số của một loạt các phép đo liên tiếp của một đại lượng nào đó. Giá trị này rất quan trọng để xác định tính hợp lý của hiện tượng đang nghiên cứu so với giá trị dự đoán của lý thuyết: nếu giá trị trung bình của các phép đo khác nhiều với giá trị dự đoán của lý thuyết (độ lệch chuẩn lớn), thì các giá trị thu được hoặc phương pháp lấy chúng phải được kiểm tra lại.

Công dụng thực tế

Trên thực tế, độ lệch chuẩn cho phép bạn xác định các giá trị trong tập hợp có thể khác với giá trị trung bình bao nhiêu.

Khí hậu

Giả sử có hai thành phố có cùng nhiệt độ trung bình ngày, nhưng một thành phố nằm trên bờ biển và một thành phố nằm trong đất liền. Các thành phố ven biển được biết là có nhiều nhiệt độ tối đa hàng ngày khác nhau thấp hơn các thành phố trong đất liền. Do đó, độ lệch chuẩn của nhiệt độ tối đa hàng ngày ở thành phố ven biển sẽ nhỏ hơn ở thành phố thứ hai, mặc dù giá trị trung bình của giá trị này là như nhau đối với chúng, điều này trong thực tế có nghĩa là xác suất không khí tối đa nhiệt độ của từng ngày cụ thể trong năm sẽ mạnh hơn khác với giá trị trung bình, cao hơn đối với một thành phố nằm bên trong lục địa.

Thể thao

Giả sử rằng có một số đội bóng được xếp hạng theo một số tập hợp thông số, ví dụ, số bàn thắng ghi được và để thủng lưới, cơ hội ghi bàn, v.v. Rất có thể đội nhất bảng này sẽ có thành tích tốt nhất. giá trị trong nhiều tham số hơn. Độ lệch chuẩn của nhóm đối với mỗi thông số được trình bày càng nhỏ, thì kết quả của nhóm càng dễ dự đoán, các đội đó cân bằng. Ngược lại, một đội có độ lệch chuẩn lớn thì rất khó đoán trước kết quả, điều này được giải thích là do sự mất cân bằng, ví dụ như phòng ngự chắc chắn nhưng tấn công lại yếu.

Việc sử dụng độ lệch chuẩn của các tham số của đội cho phép người ta dự đoán kết quả trận đấu giữa hai đội ở một mức độ nào đó, đánh giá điểm mạnh và điểm yếu của các đội, từ đó đưa ra phương pháp đấu tranh được lựa chọn.

Phân tích kỹ thuật

Xem thêm

Văn chương

Bài báo này được đề xuất để xóa.

Có thể tìm thấy lời giải thích về lý do và một cuộc thảo luận tương ứng trên trang Wikipedia: Bị xóa / ngày 17 tháng 12 năm 2012.
Cho đến khi quá trình thảo luận hoàn tất, bài viết có thể được cải thiện, nhưng nên hạn chế việc đổi tên hoặc xóa nội dung, xem hướng dẫn thao tác tiếp theo để biết thêm chi tiết.
Không gỡ cờ xóa cho đến khi kết thúc cuộc thảo luận. Quản trị viên: liên kết ở đây, lịch sử (sửa đổi lần cuối), nhật ký, xóa.

* Borovikov, V. SỐ LIỆU THỐNG KÊ. Nghệ thuật phân tích dữ liệu máy tính: Dành cho các chuyên gia / V. Borovikov. - Xanh Pê-téc-bua. : Peter, 2003. - 688 tr. - ISBN 5-272-00078-1.

Các chỉ số thống kê

mô tả
số liệu thống kê

tiếp diễn
dữ liệu

Hệ số cắt	Trung bình (Số học, Hình học, Hài hòa) Dải chế độ Trung bình
Biến thể	Thứ hạng · độ lệch chuẩn Hệ số biến thiên Lượng tử (Decil, Percentile / Percentile / Centile)
Khoảnh khắc	Kỳ vọng toán học Độ lệch tán sắc Kurtosis

Rời rạc
dữ liệu

Bảng dự phòng tần số

Thống kê
rút tiền và
kiểm tra
giả thuyết

Thống kê phần kết luận	Khoảng tin cậy (Xác suất tần số) Khoảng tin cậy (Suy luận Bayes) Ý nghĩa thống kê Phân tích tổng hợp
Lập kế hoạch cuộc thí nghiệm	Dân số · Thiết kế mẫu · Lấy mẫu theo chế độ · Nhân rộng · Phân nhóm · Độ nhạy và độ đặc hiệu
Cỡ mẫu	Công suất thống kê Đo lường hiệu quả Sai số tiêu chuẩn
Đánh giá tổng thể	Đánh giá của Bayes về một giải pháp ·

Trong bài viết này, tôi sẽ nói về cách tìm độ lệch chuẩn. Tài liệu này cực kỳ quan trọng đối với sự hiểu biết đầy đủ về toán học, vì vậy một gia sư toán học nên dành một hoặc thậm chí một số bài học riêng biệt để nghiên cứu nó. Trong bài viết này, bạn sẽ tìm thấy liên kết đến video hướng dẫn chi tiết và dễ hiểu giải thích độ lệch chuẩn là gì và cách tìm nó.

độ lệch chuẩn giúp bạn có thể ước tính mức độ lan truyền của các giá trị thu được do đo lường một tham số nhất định. Nó được biểu thị bằng một ký hiệu (chữ cái Hy Lạp "sigma").

Công thức tính toán khá đơn giản. Để tìm độ lệch chuẩn, bạn cần lấy căn bậc hai của phương sai. Vì vậy, bây giờ bạn phải hỏi, "Phương sai là gì?"

Sự phân tán là gì

Định nghĩa của phương sai như sau. Độ phân tán là trung bình cộng của các độ lệch bình phương của các giá trị so với giá trị trung bình.

Để tìm phương sai, hãy thực hiện tuần tự các phép tính sau:

Xác định giá trị trung bình (trung bình cộng đơn giản của một loạt giá trị).
Sau đó, trừ trung bình của mỗi giá trị và bình phương cho sự khác biệt kết quả (chúng tôi nhận được bình phương chênh lệch).
Bước tiếp theo là tính giá trị trung bình cộng của các bình phương chênh lệch thu được (Bạn có thể tìm hiểu tại sao lại có chính xác các bình phương bên dưới).

Hãy xem một ví dụ. Giả sử bạn và bạn bè của bạn quyết định đo chiều cao của những chú chó của bạn (tính bằng milimét). Theo kết quả của các phép đo, bạn nhận được các số đo chiều cao sau (tính đến cả vai): 600 mm, 470 mm, 170 mm, 430 mm và 300 mm.

Hãy tính giá trị trung bình, phương sai và độ lệch chuẩn.

Trước tiên hãy tìm giá trị trung bình. Như bạn đã biết, đối với điều này, bạn cần phải cộng tất cả các giá trị đo được \ u200b \ u200band chia cho số lần đo. Tiến độ tính toán:

Trung bình mm.

Vì vậy, trung bình (trung bình cộng) là 394 mm.

Bây giờ chúng ta cần xác định độ lệch của chiều cao của mỗi con chó so với mức trung bình:

Cuối cùng, để tính toán phương sai, mỗi sự khác biệt thu được được bình phương, và sau đó chúng tôi tìm giá trị trung bình cộng của các kết quả thu được:

Độ phân tán mm 2.

Do đó, độ phân tán là 21704 mm 2.

Cách tìm độ lệch chuẩn

Vì vậy, làm thế nào bây giờ để tính toán độ lệch chuẩn, biết phương sai? Như chúng ta nhớ, hãy lấy căn bậc hai của nó. Đó là, độ lệch chuẩn là:

mm (làm tròn đến số nguyên gần nhất, tính bằng mm).

Sử dụng phương pháp này, chúng tôi nhận thấy rằng một số con chó (ví dụ như Rottweilers) là những con chó rất lớn. Nhưng cũng có những con chó rất nhỏ (ví dụ như chó dachshunds, nhưng bạn không nên nói với chúng điều này).

Điều thú vị nhất là độ lệch chuẩn mang thông tin hữu ích. Bây giờ chúng ta có thể chỉ ra kết quả thu được của việc đo lường sự tăng trưởng nằm trong khoảng mà chúng ta nhận được nếu chúng ta loại bỏ độ lệch chuẩn trung bình (ở cả hai phía của nó).

Nghĩa là, bằng cách sử dụng độ lệch chuẩn, chúng tôi nhận được một phương pháp "tiêu chuẩn" cho phép bạn tìm ra giá trị nào là bình thường (trung bình thống kê) và giá trị nào là cực kỳ lớn hoặc ngược lại, nhỏ.

Độ lệch chuẩn là gì

Nhưng ... mọi thứ sẽ khác một chút nếu chúng ta phân tích lấy mẫu dữ liệu. Trong ví dụ của chúng tôi, chúng tôi đã xem xét dân số chung.Đó là, 5 con chó của chúng tôi là những con chó duy nhất trên thế giới khiến chúng tôi thích thú.

Nhưng nếu dữ liệu là một mẫu (các giá trị được chọn từ một tập hợp lớn), thì các phép tính cần được thực hiện theo cách khác.

Nếu có các giá trị, thì:

Tất cả các phép tính khác được thực hiện theo cách tương tự, bao gồm cả việc xác định giá trị trung bình.

Ví dụ: nếu năm con chó của chúng ta chỉ là một mẫu của một quần thể chó (tất cả các loài chó trên hành tinh), chúng ta phải chia cho 4 thay vì 5 cụ thể là:

Phương sai mẫu = mm 2.

Trong trường hợp này, độ lệch chuẩn của mẫu bằng mm (làm tròn đến số nguyên gần nhất).

Có thể nói rằng chúng tôi đã thực hiện một số "điều chỉnh" trong trường hợp giá trị của chúng tôi chỉ là một mẫu nhỏ.

Ghi chú. Tại sao chính xác là các hình vuông của sự khác biệt?

Nhưng tại sao chúng ta lại lấy bình phương của sự khác biệt khi tính phương sai? Hãy thừa nhận khi đo một số tham số, bạn đã nhận được bộ giá trị sau: 4; bốn; -thứ tư; -thứ tư. Nếu chúng ta chỉ thêm các độ lệch tuyệt đối từ giá trị trung bình (chênh lệch) giữa chúng ... các giá trị âm sẽ bị loại bỏ bằng các giá trị dương:

Nó chỉ ra rằng tùy chọn này là vô ích. Sau đó, có lẽ nó đáng để thử các giá trị tuyệt đối của độ lệch (nghĩa là, mô-đun của những giá trị này)?

Thoạt nhìn, nó hóa ra không tệ (nhân tiện, giá trị kết quả được gọi là độ lệch tuyệt đối trung bình), nhưng không phải trong mọi trường hợp. Hãy thử một ví dụ khác. Cho kết quả của phép đo trong tập giá trị sau: 7; một; -6; -2. Khi đó, độ lệch tuyệt đối trung bình là:

Blimey! Chúng tôi lại nhận được kết quả 4, mặc dù sự khác biệt có mức chênh lệch lớn hơn nhiều.

Bây giờ chúng ta hãy xem điều gì sẽ xảy ra nếu chúng ta bình phương các chênh lệch (và sau đó lấy căn bậc hai của tổng của chúng).

Đối với ví dụ đầu tiên, bạn nhận được:

Đối với ví dụ thứ hai, bạn nhận được:

Bây giờ nó là một vấn đề hoàn toàn khác! Độ lệch gốc-trung bình-bình phương càng lớn, mức độ lan truyền của sự khác biệt càng lớn ... đó là những gì chúng tôi đang phấn đấu.

Trên thực tế, phương pháp này sử dụng ý tưởng tương tự như khi tính khoảng cách giữa các điểm, chỉ được áp dụng theo một cách khác.

Và từ quan điểm toán học, việc sử dụng bình phương và căn bậc hai hữu ích hơn chúng ta có thể lấy trên cơ sở các giá trị tuyệt đối của độ lệch, do đó độ lệch chuẩn có thể áp dụng cho các vấn đề toán học khác.

Sergey Valerievich đã cho bạn biết cách tìm độ lệch chuẩn

Đặc tính hoàn hảo nhất của sự biến đổi là độ lệch chuẩn, được gọi là tiêu chuẩn (hay độ lệch chuẩn). Độ lệch chuẩn() bằng căn bậc hai của bình phương trung bình của độ lệch của các giá trị đối tượng riêng lẻ so với giá trị trung bình số học:

Độ lệch chuẩn rất đơn giản:

Độ lệch chuẩn có trọng số được áp dụng cho dữ liệu được nhóm:

Giữa bình phương trung bình và độ lệch tuyến tính trung bình trong các điều kiện của phân phối chuẩn, có mối quan hệ sau: ~ 1,25.

Độ lệch chuẩn, là thước đo tuyệt đối chính của sự thay đổi, được sử dụng để xác định các giá trị của bậc của đường cong phân phối chuẩn, trong các tính toán liên quan đến việc tổ chức quan sát mẫu và thiết lập độ chính xác của các đặc trưng mẫu, cũng như trong đánh giá ranh giới của sự biến động của một tính trạng trong quần thể đồng nhất.

Độ phân tán, các dạng của nó, độ lệch chuẩn.

Phương sai của một biến ngẫu nhiên- thước đo mức độ lan truyền của một biến ngẫu nhiên nhất định, tức là độ lệch của nó so với kỳ vọng toán học. Trong thống kê, chỉ định hoặc thường được sử dụng. Căn bậc hai của phương sai được gọi là độ lệch chuẩn, độ lệch chuẩn, hoặc độ chênh lệch chuẩn.

Tổng phương sai (σ2) đo lường sự biến động của một tính trạng trong toàn bộ quần thể dưới tác động của tất cả các yếu tố gây ra sự biến đổi này. Đồng thời, nhờ phương pháp phân nhóm, có thể cô lập và đo lường sự biến đổi do đặc điểm phân nhóm và sự biến động xảy ra dưới ảnh hưởng của các yếu tố không được tính toán.

Phương sai giữa các nhóm (σ 2 m.gr) đặc trưng cho sự biến đổi có hệ thống, tức là, sự khác biệt về mức độ của đặc điểm đang nghiên cứu, phát sinh dưới ảnh hưởng của đặc điểm - yếu tố cơ bản của sự phân nhóm.

độ lệch chuẩn(từ đồng nghĩa: độ lệch chuẩn, độ lệch chuẩn, độ lệch chuẩn; các thuật ngữ tương tự: độ lệch chuẩn, độ chênh lệch chuẩn) - trong lý thuyết xác suất và thống kê, chỉ báo phổ biến nhất về sự phân tán các giá trị của một biến ngẫu nhiên so với kỳ vọng toán học của nó. Với dãy giá trị giới hạn của các mẫu, thay vì kỳ vọng toán học, giá trị trung bình cộng của tập mẫu được sử dụng.

Độ lệch chuẩn được đo bằng đơn vị của chính biến ngẫu nhiên và được sử dụng để tính toán sai số chuẩn của giá trị trung bình số học, xây dựng khoảng tin cậy, trong kiểm tra thống kê các giả thuyết và đo lường mối quan hệ tuyến tính giữa các biến ngẫu nhiên. Nó được định nghĩa là căn bậc hai của phương sai của một biến ngẫu nhiên.

Độ lệch chuẩn:

Độ lệch chuẩn(ước tính độ lệch chuẩn của một biến ngẫu nhiên x so với kỳ vọng toán học của nó dựa trên một ước tính không thiên vị về phương sai của nó):

sự phân tán ở đâu; - tôi-thành phần mẫu; - cỡ mẫu; - trung bình cộng của mẫu:

Bản chất, phạm vi và thủ tục xác định chế độ và trung vị.

Ngoài giá trị trung bình theo luật lũy thừa trong thống kê, đối với đặc tính tương đối về độ lớn của một thuộc tính khác nhau và cấu trúc bên trong của chuỗi phân phối, các giá trị trung bình cấu trúc được sử dụng, chủ yếu được biểu thị bằng chế độ và trung vị.

Thời trang- Đây là biến thể phổ biến nhất của bộ truyện. Ví dụ, thời trang được sử dụng để xác định kích cỡ của quần áo, giày dép, những thứ có nhu cầu lớn nhất ở người mua. Chế độ cho một chuỗi rời rạc là biến thể có tần số cao nhất. Khi tính toán chế độ cho chuỗi biến thiên khoảng thời gian, trước tiên bạn phải xác định khoảng phương thức (theo tần số tối đa), sau đó là giá trị của giá trị phương thức của thuộc tính theo công thức:

- - giá trị thời trang

- - giới hạn dưới của khoảng phương thức

- - giá trị khoảng thời gian

- - tần số khoảng phương thức

- - tần số của khoảng trước phương thức

- - tần số của khoảng thời gian tuân theo phương thức

Trung bình -đây là giá trị của đối tượng địa lý làm nền cho chuỗi được xếp hạng và chia chuỗi này thành hai phần bằng nhau về số lượng.

Để xác định giá trị trung bình trong một chuỗi rời rạc khi có tần số, trước tiên hãy tính tổng một nửa của các tần số, sau đó xác định giá trị của biến thể nằm trên đó. (Nếu hàng đã sắp xếp chứa một số đối tượng lẻ, thì số trung vị được tính theo công thức:

M e \ u003d (n (số tính năng trong tổng thể) + 1) / 2,

trong trường hợp số đối tượng là chẵn, giá trị trung vị sẽ bằng giá trị trung bình của hai đối tượng ở giữa hàng).

Khi tính toán trung gianđối với một chuỗi biến thiên theo khoảng, trước tiên hãy xác định khoảng trung bình mà trung vị nằm trong đó, sau đó xác định giá trị của trung vị theo công thức:

- là trung vị mong muốn

- là giới hạn dưới của khoảng có chứa trung vị

- - giá trị khoảng thời gian

- - tổng các tần số hoặc số lượng thành viên của chuỗi

Tổng tần số tích lũy của các khoảng trước trung vị

- là tần số của khoảng trung bình

Thí dụ. Tìm chế độ và trung vị.

Dung dịch:
Trong ví dụ này, khoảng phương thức nằm trong nhóm tuổi từ 25-30 tuổi, vì khoảng này chiếm tần suất cao nhất (1054).

Hãy tính toán giá trị chế độ:

Điều này có nghĩa là độ tuổi phương thức của học sinh là 27 tuổi.

Tính số trung vị. Khoảng trung vị là ở nhóm tuổi 25-30, vì trong khoảng này có một biến thể chia dân số thành hai phần bằng nhau (Σf i / 2 = 3462/2 = 1731). Tiếp theo, chúng tôi thay thế dữ liệu số cần thiết vào công thức và nhận giá trị của trung vị:

Điều này có nghĩa là một nửa số sinh viên dưới 27,4 tuổi và nửa còn lại trên 27,4 tuổi.

Ngoài chế độ và trung vị, có thể sử dụng các chỉ số như phần tư, chia chuỗi xếp hạng thành 4 phần bằng nhau, deciles- 10 phần và tỷ lệ phần trăm - trên 100 phần.

Khái niệm về quan sát chọn lọc và phạm vi của nó.

Quan sát có chọn lọcáp dụng khi áp dụng quan sát liên tục vật lý không thể do một lượng lớn dữ liệu hoặc kinh tế phi thực tế. Ví dụ, khi nghiên cứu luồng hành khách, giá thị trường, ngân sách gia đình. Tình trạng thiếu kinh tế xảy ra khi đánh giá chất lượng hàng hóa liên quan đến việc tiêu hủy chúng, ví dụ, nếm thử, thử độ bền của gạch, v.v.

Các đơn vị thống kê được chọn để quan sát tạo nên một mẫu hoặc mẫu và toàn bộ mảng của chúng - tổng thể chung (GS). Trong trường hợp này, số lượng đơn vị trong mẫu biểu thị N, và trong toàn bộ HS - N. Thái độ n / nđược gọi là kích thước tương đối hoặc tỷ lệ của mẫu.

Chất lượng của kết quả lấy mẫu phụ thuộc vào tính đại diện của mẫu, tức là tính đại diện của nó trong HS. Để đảm bảo tính đại diện của mẫu, cần phải quan sát nguyên tắc lựa chọn ngẫu nhiên các đơn vị, giả định rằng việc đưa một đơn vị HS vào mẫu không thể bị ảnh hưởng bởi bất kỳ yếu tố nào khác ngoài cơ hội.

Tồn tại 4 cách chọn ngẫu nhiênđể lấy mẫu:

Thực ra là ngẫu nhiên lựa chọn hoặc "phương pháp xổ số", khi số sê-ri được gán cho các giá trị thống kê, được nhập trên các đối tượng nhất định (ví dụ: thùng hàng), sau đó được trộn trong một số vật chứa (ví dụ: trong một túi) và được chọn ngẫu nhiên. Trong thực tế, phương pháp này được thực hiện bằng cách sử dụng một bộ tạo số ngẫu nhiên hoặc các bảng toán học của các số ngẫu nhiên.
Cơ khí lựa chọn, theo đó mỗi ( N / n) -giá trị thứ của dân số chung. Ví dụ: nếu nó chứa 100.000 giá trị và bạn muốn chọn 1.000, thì cứ 100.000 / 1000 = giá trị thứ 100 sẽ rơi vào mẫu. Hơn nữa, nếu họ không được xếp hạng, thì người đầu tiên được chọn ngẫu nhiên từ hàng trăm đầu tiên, và số của những người khác sẽ nhiều hơn một trăm. Ví dụ: nếu đơn vị số 19 là đơn vị đầu tiên, thì số 119 sẽ là số tiếp theo, sau đó đến số 219, sau đó đến số 319, v.v. Nếu các đơn vị dân số được xếp hạng, thì # 50 được chọn trước tiên, sau đó đến # 150, rồi đến # 250, v.v.
Việc lựa chọn các giá trị từ một mảng dữ liệu không đồng nhất được thực hiện phân tầng(phân tầng), khi dân số chung trước đây được chia thành các nhóm đồng nhất, mà lựa chọn ngẫu nhiên hoặc cơ học được áp dụng.
Một phương pháp lấy mẫu đặc biệt là nối tiếp lựa chọn, trong đó không phải các đại lượng riêng lẻ được chọn ngẫu nhiên hoặc máy móc, mà là chuỗi của chúng (chuỗi từ một số đến một số liên tiếp), trong đó quan sát liên tục được thực hiện.

Chất lượng của các quan sát mẫu cũng phụ thuộc vào loại lấy mẫu: lặp đi lặp lại hoặc không lặp đi lặp lại.

Tại lựa chọn lại các giá trị thống kê hoặc chuỗi của chúng rơi vào mẫu được trả lại cho tổng thể chung sau khi sử dụng, có cơ hội nhận được mẫu mới. Đồng thời, tất cả các giá trị của tổng thể chung đều có xác suất được đưa vào mẫu như nhau.

Lựa chọn không lặp lại có nghĩa là các giá trị thống kê hoặc chuỗi của chúng có trong mẫu không được trả lại cho tổng thể chung sau khi sử dụng, và do đó xác suất lọt vào mẫu tiếp theo tăng lên đối với các giá trị còn lại của mẫu sau.

Lấy mẫu không lặp lại cho kết quả chính xác hơn nên được sử dụng thường xuyên hơn. Nhưng có những tình huống không thể áp dụng (nghiên cứu luồng hành khách, nhu cầu tiêu dùng, v.v.) và sau đó phải tiến hành lựa chọn lại.

Sai số biên của mẫu quan sát, sai số trung bình của mẫu, thứ tự tính toán chúng.

Chúng ta hãy xem xét chi tiết các phương pháp trên để hình thành một tổng thể mẫu và các sai số phát sinh trong trường hợp này. tính đại diện .
Thực tế-ngẫu nhiên mẫu dựa trên việc lựa chọn ngẫu nhiên các đơn vị từ tổng thể chung mà không có bất kỳ yếu tố nhất quán nào. Về mặt kỹ thuật, lựa chọn ngẫu nhiên thích hợp được thực hiện bằng cách rút thăm (ví dụ, xổ số) hoặc bằng một bảng các số ngẫu nhiên.

Thực tế chọn lọc ngẫu nhiên "ở dạng thuần túy" trong thực hành quan sát chọn lọc hiếm khi được sử dụng, nhưng nó là bước khởi đầu trong số các kiểu chọn lọc khác, nó thực hiện các nguyên tắc cơ bản của quan sát chọn lọc. Chúng ta hãy xem xét một số câu hỏi về lý thuyết của phương pháp chọn mẫu và công thức sai số cho một mẫu ngẫu nhiên đơn giản.

Lỗi lấy mẫu- đây là sự khác biệt giữa giá trị của tham số trong tổng thể chung và giá trị của nó được tính toán từ kết quả quan sát mẫu. Đối với đặc tính định lượng trung bình, sai số lấy mẫu được xác định bằng

Chỉ báo này được gọi là sai số lấy mẫu biên.
Giá trị trung bình của mẫu là một biến ngẫu nhiên có thể nhận các giá trị khác nhau tùy thuộc vào đơn vị nào trong mẫu. Do đó, sai số lấy mẫu cũng là các biến ngẫu nhiên và có thể nhận các giá trị khác nhau. Do đó, hãy xác định giá trị trung bình của các lỗi có thể xảy ra - nghĩa là lỗi lấy mẫu, phụ thuộc vào:

Cỡ mẫu: số càng lớn thì sai số trung bình càng nhỏ;

Mức độ thay đổi của đặc điểm nghiên cứu: sự biến đổi của đặc điểm càng nhỏ và do đó, phương sai, sai số lấy mẫu trung bình càng nhỏ.

Tại lựa chọn lại ngẫu nhiên sai số trung bình được tính:
.
Trong thực tế, phương sai chung không được biết chính xác, nhưng trong lý thuyết xác suất Chứng minh rằng
.
Vì giá trị của n đủ lớn gần bằng 1, chúng ta có thể giả sử rằng. Sau đó, lỗi lấy mẫu trung bình có thể được tính toán:
.
Nhưng trong trường hợp một mẫu nhỏ (đối với n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Tại lấy mẫu ngẫu nhiên các công thức đã cho được sửa chữa bởi giá trị. Khi đó, sai số trung bình của việc không lấy mẫu là:
và .
Tại vì luôn nhỏ hơn, khi đó thừa số () luôn nhỏ hơn 1. Điều này có nghĩa là sai số trung bình trong phép chọn không lặp lại luôn nhỏ hơn trong phép chọn lặp lại.
Lấy mẫu cơ họcđược sử dụng khi dân số chung được sắp xếp theo một cách nào đó (ví dụ: danh sách cử tri theo thứ tự bảng chữ cái, số điện thoại, số nhà, căn hộ). Việc lựa chọn các đơn vị được thực hiện trong một khoảng thời gian nhất định, bằng nghịch đảo của phần trăm mẫu. Vì vậy, với mẫu 2%, cứ 50 đơn vị = 1 / 0,02 được chọn, với 5%, mỗi 1 / 0,05 = 20 đơn vị của tổng thể chung.

Điểm gốc được chọn theo những cách khác nhau: ngẫu nhiên, từ giữa khoảng thời gian, với sự thay đổi điểm gốc. Điều chính là để tránh lỗi hệ thống. Ví dụ: với mẫu 5%, nếu đơn vị thứ 13 được chọn làm đơn vị đầu tiên, thì đơn vị tiếp theo là 33, 53, 73, v.v.

Về độ chính xác, lựa chọn cơ học gần với chọn mẫu ngẫu nhiên thích hợp. Do đó, để xác định sai số trung bình của lấy mẫu cơ học, người ta sử dụng các công thức chọn ngẫu nhiên thích hợp.

Tại lựa chọn điển hình dân số điều tra được phân chia sơ bộ thành các nhóm thuần nhất, đơn loại. Ví dụ, khi khảo sát doanh nghiệp, đây có thể là các ngành, các phân ngành, đồng thời nghiên cứu dân số - khu vực, xã hội hoặc nhóm tuổi. Sau đó, một lựa chọn độc lập được thực hiện từ mỗi nhóm theo cách cơ học hoặc ngẫu nhiên thích hợp.

Lấy mẫu điển hình cho kết quả chính xác hơn các phương pháp khác. Việc phân loại tổng thể chung đảm bảo sự đại diện của từng nhóm điển hình trong mẫu, giúp loại trừ ảnh hưởng của phương sai giữa các nhóm đối với sai số trung bình của mẫu. Vì vậy, khi tìm sai số của một mẫu điển hình theo quy tắc cộng các phương sai (), chỉ cần tính đến giá trị trung bình của các phương sai nhóm. Khi đó, lỗi lấy mẫu trung bình là:
trong sự lựa chọn lại
,
với lựa chọn không lặp lại
,
ở đâu là giá trị trung bình của các phương sai trong nhóm trong mẫu.

Lựa chọn nối tiếp (hoặc lồng nhau) được sử dụng khi dân số được chia thành chuỗi hoặc nhóm trước khi bắt đầu điều tra mẫu. Các chuỗi này có thể là các gói thành phẩm, nhóm sinh viên, đội. Các loạt bài để kiểm tra được lựa chọn một cách máy móc hoặc ngẫu nhiên, và trong chuỗi một cuộc khảo sát hoàn chỉnh các đơn vị được thực hiện. Do đó, sai số lấy mẫu trung bình chỉ phụ thuộc vào phương sai giữa các nhóm (xen kẽ), được tính theo công thức:

trong đó r là số chuỗi được chọn;
- giá trị trung bình của chuỗi thứ i.

Sai số lấy mẫu nối tiếp trung bình được tính:

khi được chọn lại:
,
với lựa chọn không lặp lại:
,
trong đó R là tổng số chuỗi.

Kết hợp sự lựa chọn là sự kết hợp của các phương pháp lựa chọn được xem xét.

Sai số lấy mẫu trung bình đối với bất kỳ phương pháp lựa chọn nào phụ thuộc chủ yếu vào kích thước tuyệt đối của mẫu và ở mức độ thấp hơn, vào tỷ lệ phần trăm của mẫu. Giả sử rằng 225 quan sát được thực hiện trong trường hợp đầu tiên trên tổng thể 4.500 đơn vị và trong trường hợp thứ hai là trên 225.000 đơn vị. Phương sai trong cả hai trường hợp đều bằng 25. Sau đó, trong trường hợp đầu tiên, với lựa chọn 5%, sai số lấy mẫu sẽ là:

Trong trường hợp thứ hai, với lựa chọn 0,1%, nó sẽ bằng:

Theo cách này, với phần trăm mẫu giảm 50 lần, sai số mẫu tăng lên một chút, vì kích thước mẫu không thay đổi.
Giả sử rằng kích thước mẫu được tăng lên 625 quan sát. Trong trường hợp này, lỗi lấy mẫu là:

Việc tăng mẫu lên 2,8 lần với cùng kích thước của tổng thể chung làm giảm kích thước của sai số lấy mẫu hơn 1,6 lần.

Phương pháp và phương tiện hình thành tổng thể mẫu.

Trong thống kê, người ta sử dụng nhiều phương pháp hình thành tập mẫu khác nhau, được xác định bởi mục tiêu của nghiên cứu và phụ thuộc vào đặc điểm cụ thể của đối tượng nghiên cứu.

Điều kiện chính để tiến hành điều tra chọn mẫu là ngăn ngừa sự xuất hiện của sai số hệ thống phát sinh do vi phạm nguyên tắc cơ hội bình đẳng cho mỗi đơn vị dân số chung nhập mẫu. Việc ngăn ngừa các sai sót hệ thống đạt được là kết quả của việc sử dụng các phương pháp dựa trên cơ sở khoa học để hình thành tổng thể mẫu.

Có các cách sau để chọn đơn vị từ tổng thể chung:

1) lựa chọn cá nhân - các đơn vị riêng lẻ được chọn trong mẫu;

2) lựa chọn nhóm - các nhóm hoặc loạt đơn vị đồng nhất về chất lượng được đưa vào mẫu;

3) lựa chọn kết hợp là sự kết hợp giữa lựa chọn cá nhân và lựa chọn nhóm.
Phương pháp lựa chọn được xác định bởi các quy tắc hình thành dân số lấy mẫu.

Mẫu có thể là:

ngẫu nhiên thích hợp bao gồm thực tế là mẫu được hình thành là kết quả của sự lựa chọn ngẫu nhiên (không chủ ý) các đơn vị riêng lẻ từ tổng thể chung. Trong trường hợp này, số lượng đơn vị được chọn trong tập mẫu thường được xác định dựa trên tỷ lệ mẫu được chấp nhận. Tỷ lệ mẫu là tỷ số giữa số đơn vị trong tổng thể mẫu n với số đơn vị trong tổng thể chung N, tức là

cơ khí bao gồm thực tế là việc lựa chọn các đơn vị trong mẫu được thực hiện từ tổng thể chung, được chia thành các khoảng (nhóm) bằng nhau. Trong trường hợp này, kích thước của khoảng trong tổng thể chung bằng nghịch đảo của tỷ lệ mẫu. Vì vậy, với mẫu 2%, mỗi đơn vị thứ 50 được chọn (1: 0,02), với mẫu 5%, mỗi đơn vị thứ 20 (1: 0,05), v.v. Do đó, theo đúng tỷ lệ chọn lọc được chấp nhận, dân số nói chung được chia một cách máy móc thành các nhóm bằng nhau. Chỉ một đơn vị được chọn từ mỗi nhóm trong mẫu.
đặc trưng - trong đó quần thể chung đầu tiên được chia thành các nhóm điển hình đồng nhất. Sau đó, từ mỗi nhóm điển hình, một lựa chọn riêng lẻ các đơn vị vào mẫu được thực hiện bằng mẫu ngẫu nhiên hoặc mẫu cơ học. Đặc điểm quan trọng của mẫu điển hình là nó cho kết quả chính xác hơn so với các phương pháp chọn đơn vị khác trong mẫu;
nối tiếp- trong đó quần thể nói chung được chia thành các nhóm có cùng kích thước - hàng loạt. Dòng được chọn trong bộ mẫu. Trong chuỗi, việc quan sát liên tục các đơn vị rơi vào chuỗi được thực hiện;
kết hợp- lấy mẫu có thể là hai giai đoạn. Trong trường hợp này, dân số chung đầu tiên được chia thành các nhóm. Sau đó, các nhóm được chọn và trong phần sau, các đơn vị riêng lẻ được chọn.

Trong thống kê, các phương pháp chọn đơn vị trong mẫu sau đây được phân biệt::

giai đoạn đơn mẫu - mỗi đơn vị được chọn sẽ được nghiên cứu ngay lập tức trên một cơ sở nhất định (thực tế là các mẫu ngẫu nhiên và nối tiếp);
nhiều tầng lấy mẫu - lựa chọn được thực hiện từ tổng thể chung của các nhóm riêng lẻ, và các đơn vị riêng lẻ được chọn từ các nhóm (một mẫu điển hình với phương pháp cơ học là chọn các đơn vị trong tổng thể mẫu).

Ngoài ra, còn có:

sự lựa chọn lại- theo sơ đồ của quả bóng trả lại. Trong trường hợp này, mỗi đơn vị hoặc loạt đã rơi vào mẫu được trả lại cho tổng thể chung và do đó có cơ hội được đưa vào mẫu một lần nữa;
lựa chọn không lặp lại- theo sơ đồ của quả bóng không quay lại. Nó có kết quả chính xác hơn cho cùng một cỡ mẫu.

Xác định cỡ mẫu cần thiết (sử dụng bảng của Học sinh).

Một trong những nguyên tắc khoa học trong lý thuyết chọn mẫu là đảm bảo chọn đủ số lượng đơn vị. Về mặt lý thuyết, sự cần thiết phải tuân thủ nguyên tắc này được trình bày trong phần chứng minh các định lý giới hạn của lý thuyết xác suất, cho phép bạn thiết lập bao nhiêu đơn vị nên được chọn từ tổng thể chung sao cho đủ và đảm bảo tính đại diện của mẫu.

Việc giảm sai số tiêu chuẩn của mẫu và do đó, sự gia tăng độ chính xác của ước lượng luôn đi kèm với sự gia tăng kích thước mẫu, do đó, đã ở giai đoạn tổ chức quan sát mẫu, cần phải quyết định cỡ mẫu nên là bao nhiêu để đảm bảo độ chính xác cần thiết của các kết quả quan sát. Việc tính toán cỡ mẫu yêu cầu được xây dựng bằng cách sử dụng các công thức rút ra từ các công thức cho sai số lấy mẫu biên (A), tương ứng với một hoặc một loại và phương pháp lựa chọn khác. Vì vậy, đối với cỡ mẫu lặp lại ngẫu nhiên (n), chúng ta có:

Bản chất của công thức này là với việc chọn lại ngẫu nhiên số lượng cần thiết, kích thước mẫu tỷ lệ thuận với bình phương của hệ số tin cậy (t2) và phương sai của đặc trưng biến thiên (? 2) và tỷ lệ nghịch với bình phương sai số lấy mẫu biên (? 2). Đặc biệt, bằng cách nhân đôi sai số biên, cỡ mẫu yêu cầu có thể giảm đi một phần bốn. Trong ba tham số, hai tham số (t và?) Được thiết lập bởi nhà nghiên cứu.

Đồng thời, nhà nghiên cứuĐối với mục đích của cuộc điều tra mẫu, câu hỏi nên được quyết định: kết hợp định lượng nào thì tốt hơn nên đưa các tham số này vào để đưa ra phương án tối ưu? Trong một trường hợp, anh ta có thể hài lòng với độ tin cậy của kết quả thu được (t) hơn là với thước đo độ chính xác (?), Ngược lại - ngược lại. Khó khăn hơn để giải quyết vấn đề liên quan đến giá trị của sai số lấy mẫu cận biên, vì nhà nghiên cứu không có chỉ số này ở giai đoạn thiết kế quan sát mẫu, do đó, trong thực tế, thường đặt sai số lấy mẫu biên, như một quy tắc, trong phạm vi 10% mức trung bình dự kiến của đặc điểm. Việc thiết lập mức trung bình giả định có thể được tiếp cận theo nhiều cách khác nhau: sử dụng dữ liệu từ các cuộc điều tra tương tự trước đó hoặc sử dụng dữ liệu từ khung lấy mẫu và lấy một mẫu thử nghiệm nhỏ.

Điều khó khăn nhất để thiết lập khi thiết kế một quan sát mẫu là tham số thứ ba trong công thức (5.2) - phương sai của tổng thể mẫu. Trong trường hợp này, cần phải sử dụng tất cả các thông tin có sẵn cho người điều tra, thu được từ các cuộc điều tra tương tự và thí điểm trước đó.

Câu hỏi định nghĩa Cỡ mẫu yêu cầu trở nên phức tạp hơn nếu cuộc điều tra mẫu liên quan đến việc nghiên cứu một số đặc điểm của các đơn vị lấy mẫu. Trong trường hợp này, mức độ trung bình của mỗi đặc điểm và sự biến đổi của chúng, như một quy luật, là khác nhau, và do đó có thể quyết định mức độ phân tán của đặc điểm nào sẽ được ưu tiên hơn nếu chỉ tính đến mục đích và mục tiêu của cuộc khảo sát.

Khi thiết kế quan sát mẫu, giá trị xác định trước của sai số lấy mẫu cho phép được giả định phù hợp với mục tiêu của một nghiên cứu cụ thể và xác suất kết luận dựa trên kết quả của quan sát.

Nói chung, công thức cho sai số biên của giá trị trung bình mẫu cho phép bạn xác định:

Mức độ sai lệch có thể có của các chỉ số của dân số chung so với các chỉ số của tổng thể mẫu;

Cỡ mẫu yêu cầu, cung cấp độ chính xác cần thiết, trong đó các giới hạn của sai số có thể xảy ra sẽ không vượt quá một giá trị xác định nhất định;

Xác suất lỗi trong mẫu sẽ có một giới hạn nhất định.

Phân phối của sinh viên trong lý thuyết xác suất, nó là một họ một tham số của các phân phối liên tục tuyệt đối.

Chuỗi động lực học (khoảng thời gian, thời điểm), đóng chuỗi động lực học.

Loạt động lực học- Đây là các giá trị của các chỉ tiêu thống kê được trình bày theo một trình tự thời gian nhất định.

Mỗi chuỗi thời gian chứa hai thành phần:

1) các chỉ số về khoảng thời gian (năm, quý, tháng, ngày hoặc ngày);

2) các chỉ số đặc trưng cho đối tượng được nghiên cứu trong các khoảng thời gian hoặc vào các ngày tương ứng, được gọi là các mức của chuỗi.

Các cấp độ của chuỗi được thể hiện cả giá trị tuyệt đối và giá trị trung bình hoặc giá trị tương đối. Tùy thuộc vào bản chất của các chỉ tiêu, chuỗi động của các giá trị tuyệt đối, tương đối và trung bình được xây dựng. Chuỗi giá trị tương đối và trung bình động được xây dựng trên cơ sở đạo hàm của chuỗi giá trị tuyệt đối. Có khoảng thời gian và chuỗi thời điểm của động lực học.

Chuỗi khoảng thời gian động chứa các giá trị của các chỉ số trong những khoảng thời gian nhất định. Trong chuỗi khoảng thời gian, các mức có thể được tổng hợp lại, thu được khối lượng của hiện tượng trong một khoảng thời gian dài hơn, hoặc cái gọi là tổng tích lũy.

Chuỗi khoảnh khắc động phản ánh giá trị của các chỉ tiêu tại một thời điểm nhất định (ngày giờ). Trong chuỗi thời điểm, nhà nghiên cứu có thể chỉ quan tâm đến sự khác biệt của hiện tượng, phản ánh sự thay đổi mức độ của chuỗi giữa các ngày nhất định, vì tổng các mức ở đây không có nội dung thực. Tổng tích lũy không được tính toán ở đây.

Điều kiện quan trọng nhất để xây dựng đúng chuỗi động là khả năng so sánh giữa các mức của chuỗi liên quan đến các thời kỳ khác nhau. Các mức độ phải được trình bày với số lượng đồng nhất, phải có cùng mức độ bao quát các phần khác nhau của hiện tượng.

ĐếnĐể tránh làm sai lệch động lực học thực, các tính toán sơ bộ được thực hiện trong nghiên cứu thống kê (kết thúc chuỗi động lực học), trước khi phân tích thống kê chuỗi động lực học. Việc đóng chuỗi thời gian được hiểu là sự kết hợp của hai hay nhiều chuỗi thành một chuỗi, các mức được tính theo phương pháp luận khác nhau hoặc không tương ứng với biên giới lãnh thổ, v.v. Việc kết thúc chuỗi động lực cũng có thể ngụ ý việc giảm mức tuyệt đối của chuỗi động xuống một cơ sở chung, điều này giúp loại bỏ sự không tương thích của các cấp trong chuỗi động.

Khái niệm về khả năng so sánh của chuỗi thời gian, hệ số, tốc độ tăng trưởng và tốc độ tăng trưởng.

Loạt động lực học- Đây là những dãy chỉ tiêu thống kê đặc trưng cho sự phát triển của các hiện tượng tự nhiên và xã hội trong thời gian. Các bộ sưu tập thống kê do Ủy ban Thống kê Nhà nước của Nga xuất bản chứa một số lượng lớn các chuỗi thời gian dưới dạng bảng. Chuỗi động lực cho phép tiết lộ các mô hình phát triển của các hiện tượng được nghiên cứu.

Chuỗi thời gian chứa hai loại chỉ số. Các chỉ số thời gian(năm, quý, tháng, v.v.) hoặc thời điểm (đầu năm, đầu tháng, v.v.). Chỉ báo mức hàng. Các chỉ số về mức độ của chuỗi thời gian có thể được biểu thị bằng giá trị tuyệt đối (sản lượng tính bằng tấn hoặc rúp), giá trị tương đối (tỷ trọng dân số thành thị tính bằng%) và giá trị trung bình (lương trung bình của công nhân trong ngành theo năm, vân vân.). Ở dạng bảng, chuỗi thời gian chứa hai cột hoặc hai hàng.

Việc xây dựng đúng chuỗi thời gian liên quan đến việc đáp ứng một số yêu cầu:

tất cả các chỉ số của một loạt các động lực phải được chứng minh một cách khoa học, đáng tin cậy;
các chỉ số của một loạt các động lực phải được so sánh theo thời gian, tức là phải được tính trong cùng khoảng thời gian hoặc vào cùng ngày;
các chỉ số về một số động lực nên có thể so sánh được trên toàn lãnh thổ;
các chỉ số của một loạt các động lực phải có nội dung so sánh được, tức là được tính toán theo một phương pháp luận duy nhất, theo cùng một cách thức;
Các chỉ số của một loạt các động thái nên có thể so sánh được trong phạm vi các trang trại được xem xét. Tất cả các chỉ số của một loạt các động lực phải được đưa ra theo cùng một đơn vị đo lường.

Các chỉ số thống kê có thể mô tả kết quả của quá trình đang nghiên cứu trong một khoảng thời gian hoặc trạng thái của hiện tượng đang nghiên cứu tại một thời điểm nhất định, tức là các chỉ số có thể là khoảng thời gian (định kỳ) và tức thời. Theo đó, ban đầu chuỗi động lực học có thể là khoảng thời gian hoặc thời điểm. Đến lượt mình, chuỗi thời điểm của động lực học có thể có những khoảng thời gian bằng nhau và không bằng nhau.

Chuỗi động lực ban đầu có thể được chuyển đổi thành chuỗi giá trị trung bình và chuỗi giá trị tương đối (chuỗi và cơ sở). Chuỗi thời gian như vậy được gọi là chuỗi thời gian xuất phát.

Phương pháp tính mức trung bình trong chuỗi động lực là khác nhau, do loại chuỗi động lực. Sử dụng các ví dụ, hãy xem xét các loại chuỗi thời gian và công thức tính mức trung bình.

Lợi nhuận tuyệt đối (Δy) cho biết mức độ tiếp theo của chuỗi đã thay đổi bao nhiêu đơn vị so với mức trước đó (cột 3 - mức tăng tuyệt đối của chuỗi) hoặc so với mức ban đầu (cột 4 - mức tăng tuyệt đối cơ bản). Các công thức tính toán có thể được viết như sau:

Với sự giảm các giá trị tuyệt đối của chuỗi sẽ có “giảm”, “giảm” tương ứng.

Các chỉ tiêu về tăng trưởng tuyệt đối chỉ ra rằng, chẳng hạn, năm 1998 sản lượng sản phẩm "A" tăng 4.000 tấn so với năm 1997 và 34.000 tấn so với năm 1994; cho các năm khác, xem bảng. 11,5 gr. 3 và 4.

Yếu tố tăng trưởng cho biết mức độ của chuỗi đã thay đổi bao nhiêu lần so với mức trước đó (cột 5 - hệ số tăng trưởng hoặc suy giảm của chuỗi) hoặc so với mức ban đầu (cột 6 - hệ số tăng trưởng hoặc suy giảm cơ bản). Các công thức tính toán có thể được viết như sau:

Tỷ lệ tăng trưởng cho biết mức độ tiếp theo của chuỗi so với mức trước đó (cột 7 - tốc độ tăng trưởng chuỗi) hoặc so với mức ban đầu (cột 8 - tốc độ tăng trưởng cơ bản) là bao nhiêu phần trăm. Các công thức tính toán có thể được viết như sau:

Vì vậy, ví dụ, năm 1997, khối lượng sản xuất sản phẩm "A" so với năm 1996 là 105,5% (

Tốc độ tăng trưởng cho biết mức độ của kỳ báo cáo tăng bao nhiêu phần trăm so với kỳ trước (cột 9 - tốc độ tăng trưởng chuỗi) hoặc so với mức ban đầu (cột 10 - tốc độ tăng trưởng cơ bản). Các công thức tính toán có thể được viết như sau:

T pr \ u003d T p - 100% hoặc T pr \ u003d mức / mức tăng tuyệt đối của giai đoạn trước * 100%

Vì vậy, ví dụ, vào năm 1996, so với năm 1995, sản phẩm "A" được sản xuất nhiều hơn 3,8% (103,8% - 100%) hoặc (8: 210) x 100%, và so với năm 1994 - bằng 9% ( 109% - 100%).

Nếu các mức tuyệt đối trong chuỗi giảm, thì tỷ lệ sẽ nhỏ hơn 100% và theo đó, sẽ có một tỷ lệ suy giảm (tỷ lệ tăng trưởng với một dấu trừ).

Giá trị tuyệt đối của mức tăng 1%(cột 11) cho biết trong một thời kỳ nhất định phải sản xuất bao nhiêu đơn vị để mức của kỳ trước tăng 1%. Trong ví dụ của chúng tôi, năm 1995 cần sản xuất 2,0 nghìn tấn và năm 1998 - 2,3 nghìn tấn, tức là to hơn nhiều.

Có hai cách để xác định độ lớn của giá trị tuyệt đối của mức tăng trưởng 1%:

Chia mức của kỳ trước cho 100;

Chia tỷ lệ tăng trưởng chuỗi tuyệt đối cho tỷ lệ tăng trưởng chuỗi tương ứng.

Giá trị tuyệt đối của mức tăng 1% =

Trong động lực học, đặc biệt là trong một thời kỳ dài, điều quan trọng là phải cùng nhau phân tích tốc độ tăng trưởng với nội dung của từng phần trăm tăng hoặc giảm.

Lưu ý rằng phương pháp được xem xét để phân tích chuỗi thời gian có thể áp dụng cho cả chuỗi thời gian, các mức được biểu thị bằng giá trị tuyệt đối (t, nghìn rúp, số lượng nhân viên, v.v.) và đối với chuỗi thời gian, các mức của được thể hiện bằng các chỉ tiêu tương đối (% phế liệu,% tro của than, v.v.) hoặc giá trị trung bình (năng suất bình quân tính bằng c / ha, tiền công bình quân, v.v.).

Cùng với các chỉ tiêu phân tích được xem xét tính toán cho từng năm so với trước đó hoặc ban đầu, khi phân tích chuỗi thời gian cần tính các chỉ tiêu phân tích bình quân cả kỳ: mức bình quân của chuỗi, mức tăng tuyệt đối bình quân hàng năm. (giảm) và tốc độ phát triển và tốc độ tăng trưởng bình quân hàng năm.

Các phương pháp tính toán mức độ trung bình của một loạt các động lực đã được thảo luận ở trên. Trong chuỗi động lực theo khoảng thời gian mà chúng ta đang xem xét, mức trung bình của chuỗi được tính bằng công thức trung bình cộng đơn giản:

Sản lượng trung bình hàng năm của sản phẩm trong giai đoạn 1994-1998. lên tới 218,4 nghìn tấn.

Mức tăng tuyệt đối trung bình hàng năm cũng được tính bằng công thức của trung bình cộng đơn giản:

Mức tăng tuyệt đối hàng năm thay đổi qua các năm từ 4 đến 12 nghìn tấn (xem mục 3), và mức tăng sản lượng bình quân hàng năm trong giai đoạn 1995 - 1998. lên tới 8,5 nghìn tấn.

Các phương pháp tính tốc độ tăng trưởng bình quân và tốc độ tăng trưởng bình quân đòi hỏi phải xem xét chi tiết hơn. Hãy xem xét chúng trên ví dụ về các chỉ số hàng năm của cấp độ chuỗi được cho trong bảng.

Mức độ giữa của dãy động lực học.

Chuỗi động lực (hoặc chuỗi thời gian)- đây là các giá trị số của một chỉ tiêu thống kê nhất định tại các thời điểm hoặc khoảng thời gian liên tiếp (tức là được sắp xếp theo thứ tự thời gian).

Các giá trị số của một chỉ số thống kê cụ thể tạo nên một chuỗi các động lực được gọi là mức độ của một số và thường được ký hiệu bằng chữ cái y. Thành viên đầu tiên của bộ truyện y 1được gọi là ban đầu hoặc đường cơ sở, và cuối cùng y n - cuối cùng. Các khoảnh khắc hoặc khoảng thời gian mà các cấp tham chiếu được biểu thị bằng t.

Chuỗi động, theo quy luật, được trình bày dưới dạng bảng hoặc đồ thị và thang thời gian được xây dựng dọc theo trục x t và dọc theo thứ tự - quy mô của các cấp độ của chuỗi y.

Các chỉ số trung bình của một loạt các động lực

Mỗi dãy động có thể coi là một tập hợp nhất định N các chỉ số thay đổi theo thời gian có thể được tóm tắt dưới dạng giá trị trung bình. Các chỉ số tổng quát (trung bình) như vậy đặc biệt cần thiết khi so sánh sự thay đổi của một hoặc một chỉ tiêu khác trong các thời kỳ khác nhau, ở các quốc gia khác nhau, v.v.

Đặc điểm tổng quát của một loạt các động lực trước hết có thể là mức hàng trung bình. Phương pháp tính mức độ trung bình phụ thuộc vào việc đó là chuỗi thời điểm hay chuỗi khoảng (chu kỳ).

Khi nào khoảng thời gian chuỗi, mức trung bình của nó được xác định bằng công thức của trung bình cộng đơn giản của các mức của chuỗi, tức là

=
Nếu có khoảng khăc hàng có chứa N cấp độ ( y1, y2,…, yn) với khoảng thời gian bằng nhau giữa các ngày (thời điểm), thì một chuỗi như vậy có thể dễ dàng chuyển đổi thành một chuỗi các giá trị trung bình. Đồng thời, chỉ tiêu (mức) đầu kỳ đồng thời là chỉ tiêu cuối kỳ trước. Sau đó, giá trị trung bình của chỉ báo cho mỗi khoảng thời gian (khoảng thời gian giữa các ngày) có thể được tính bằng một nửa tổng của các giá trị tại vào đầu và cuối kỳ, tức là thế nào . Số lượng trung bình như vậy sẽ là. Như đã đề cập trước đó, đối với chuỗi số trung bình, mức trung bình được tính từ trung bình số học.

Do đó, chúng ta có thể viết:
.
Sau khi chuyển đổi tử số, chúng tôi nhận được:
,

ở đâu Y1 và Yn- cấp độ đầu tiên và cấp độ cuối cùng của chuỗi; Yi- các cấp độ trung gian.

Mức trung bình này được biết đến trong thống kê là trình tự thời gian trung bình cho chuỗi thời điểm. Cô nhận được tên này từ từ "cronos" (thời gian, vĩ độ), vì nó được tính từ các chỉ số thay đổi theo thời gian.

Trong trường hợp không bình đẳng khoảng thời gian giữa các ngày, giá trị trung bình theo thứ tự thời gian cho chuỗi thời điểm có thể được tính bằng giá trị trung bình số học của các giá trị trung bình của các mức cho mỗi cặp thời điểm, được tính trọng số bởi khoảng cách (khoảng thời gian) giữa các ngày, tức là
.
Trong trường hợp này giả định rằng trong khoảng thời gian giữa các ngày, các cấp đã nhận các giá trị khác nhau và chúng ta từ hai đã biết ( yi và yi + 1) chúng tôi xác định giá trị trung bình, từ đó chúng tôi tính giá trị trung bình tổng thể cho toàn bộ thời kỳ được phân tích.
Nếu giả định rằng mỗi giá trị yi vẫn không thay đổi cho đến khi tiếp theo (tôi + 1)- thời điểm thứ, tức là Ngày chính xác của sự thay đổi trong các mức được biết, sau đó có thể thực hiện phép tính bằng cách sử dụng công thức trung bình số học có trọng số:
,

đâu là thời gian mà mức không thay đổi.

Ngoài mức trung bình trong chuỗi động lực, các chỉ tiêu trung bình khác còn được tính toán - mức thay đổi trung bình trong các mức của chuỗi (phương pháp cơ bản và chuỗi), tốc độ thay đổi trung bình.

Đường cơ sở có nghĩa là thay đổi tuyệt đối là thương số của sự thay đổi tuyệt đối cơ bản cuối cùng chia cho số lần thay đổi. Đó là

Chuỗi có nghĩa là thay đổi tuyệt đối mức của một chuỗi là thương số của phép chia tổng của tất cả các thay đổi tuyệt đối của chuỗi cho số lần thay đổi, tức là

Bằng dấu hiệu của những thay đổi tuyệt đối trung bình, bản chất của sự thay đổi của hiện tượng cũng được đánh giá trung bình: tăng trưởng, suy giảm hay ổn định.

Từ quy tắc kiểm soát các thay đổi cơ bản và tuyệt đối theo chuỗi, các thay đổi cơ bản và trung bình chuỗi phải bằng nhau.

Cùng với sự thay đổi tuyệt đối trung bình, giá trị tương đối trung bình cũng được tính theo phương pháp cơ bản và phương pháp dây chuyền.

Thay đổi tương đối trung bình cơ bảnđược xác định theo công thức:

Chuỗi có nghĩa là thay đổi tương đốiđược xác định theo công thức:

Đương nhiên, các thay đổi tương đối cơ bản và trung bình chuỗi phải giống nhau, và bằng cách so sánh chúng với giá trị tiêu chí 1, một kết luận được đưa ra về bản chất của sự thay đổi trong hiện tượng trung bình: tăng trưởng, suy giảm hay ổn định.
Bằng cách trừ đi 1 từ thay đổi tương đối cơ sở hoặc trung bình chuỗi, giá trị tương ứng tỷ lệ thay đổi trung bình, bằng dấu hiệu nào người ta cũng có thể phán đoán bản chất của sự thay đổi trong hiện tượng đang nghiên cứu, được phản ánh bởi chuỗi động lực này.

Biến động theo mùa và các chỉ số thời vụ.

Biến động theo mùa là những biến động ổn định trong nội bộ hàng năm.

Nguyên tắc cơ bản của quản lý để đạt được hiệu quả tối đa là tối đa hóa thu nhập và tối thiểu hóa chi phí. Bằng cách nghiên cứu các biến động theo mùa, bài toán về phương trình cực đại ở mỗi mức trong năm được giải quyết.

Khi nghiên cứu sự biến động theo mùa, hai nhiệm vụ có liên quan với nhau được giải quyết:

1. Xác định các chi tiết cụ thể của sự phát triển của hiện tượng trong động lực hàng năm;

2. Đo lường dao động theo mùa với việc xây dựng mô hình sóng theo mùa;

Gà tây theo mùa thường được tính để đo tính thời vụ. Nói chung, chúng được xác định bằng tỷ số của phương trình ban đầu của một loạt động lực học với phương trình lý thuyết để làm cơ sở so sánh.

Vì độ lệch ngẫu nhiên được chồng lên các biến động theo mùa, nên các chỉ số thời vụ được tính trung bình để loại bỏ chúng.

Trong trường hợp này, đối với từng thời kỳ của chu kỳ hàng năm, các chỉ tiêu tổng quát được xác định dưới dạng các chỉ số trung bình theo mùa:

Các chỉ số trung bình của biến động theo mùa không bị ảnh hưởng bởi độ lệch ngẫu nhiên của xu hướng phát triển chính.

Tùy thuộc vào bản chất của xu hướng, công thức cho chỉ số thời vụ trung bình có thể có các dạng sau:

1.Đối với một loạt các động lực trong năm với xu hướng phát triển chính rõ rệt:

2. Đối với một loạt các động thái trong năm mà không có xu hướng tăng hoặc giảm hoặc không đáng kể:

Trung bình chung ở đâu;

Phương pháp phân tích xu hướng chính.

Sự phát triển của hiện tượng theo thời gian chịu ảnh hưởng của các yếu tố khác nhau về bản chất và mức độ ảnh hưởng. Một số có bản chất ngẫu nhiên, một số khác có ảnh hưởng gần như không đổi và tạo thành một xu hướng phát triển nhất định trong chuỗi động lực.

Một nhiệm vụ quan trọng của thống kê là xác định một xu hướng trong chuỗi các động lực, giải phóng khỏi tác động của các yếu tố ngẫu nhiên khác nhau. Với mục đích này, chuỗi thời gian được xử lý bằng các phương pháp mở rộng khoảng thời gian, đường trung bình động và căn chỉnh phân tích, v.v.

Phương pháp thô khoảng thời gian dựa trên sự mở rộng của các khoảng thời gian, bao gồm các mức của một loạt các động lực, tức là là sự thay thế dữ liệu liên quan đến các khoảng thời gian nhỏ bằng dữ liệu từ các khoảng thời gian lớn hơn. Nó đặc biệt hiệu quả khi các cấp độ ban đầu của chuỗi trong khoảng thời gian ngắn. Ví dụ: chuỗi chỉ số liên quan đến các sự kiện hàng ngày được thay thế bằng chuỗi liên quan đến hàng tuần, hàng tháng, v.v. Điều này sẽ hiển thị rõ ràng hơn "Trục phát triển của hiện tượng". Giá trị trung bình, được tính toán trên cơ sở các khoảng mở rộng, giúp xác định được hướng và đặc điểm (tăng hoặc giảm tốc độ tăng trưởng) của xu hướng phát triển chính.

phương pháp trung bình động tương tự như trước đó, nhưng trong trường hợp này, các mức thực tế được thay thế bằng các mức trung bình được tính toán cho các khoảng mở rộng di chuyển (trượt) liên tiếp bao trùm m mức hàng.

Ví dụ nếu được chấp nhận m = 3, sau đó, trước tiên, giá trị trung bình của ba cấp độ đầu tiên của chuỗi được tính, sau đó - từ cùng một số cấp độ, nhưng bắt đầu từ cấp độ thứ hai liên tiếp, sau đó - bắt đầu từ cấp độ thứ ba, v.v. Do đó, giá trị trung bình, như nó vốn có, "trượt" dọc theo chuỗi động lực, di chuyển trong một khoảng thời gian. Tính từ m các thành viên của đường trung bình động đề cập đến phần giữa (trung tâm) của mỗi khoảng.

Phương pháp này chỉ loại bỏ các biến động ngẫu nhiên. Nếu chuỗi có sóng theo mùa, thì nó sẽ vẫn còn sau khi làm mịn bằng phương pháp trung bình động.

Căn chỉnh phân tích. Để loại bỏ các biến động ngẫu nhiên và xác định xu hướng, các mức của chuỗi được căn chỉnh theo công thức phân tích (hoặc căn chỉnh phân tích). Bản chất của nó là thay thế mức thực nghiệm (thực tế) bằng mức lý thuyết, được tính toán theo một phương trình nhất định, được coi là mô hình toán học của xu hướng, trong đó mức lý thuyết được coi là một hàm của thời gian:. Trong trường hợp này, mỗi mức thực tế được coi là tổng của hai thành phần:, trong đó là một thành phần có hệ thống và được biểu thị bằng một phương trình nhất định, và là một biến ngẫu nhiên gây ra biến động xung quanh xu hướng.

Nhiệm vụ của việc liên kết phân tích như sau:

1. Xác định trên cơ sở dữ liệu thực tế loại hàm giả định có thể phản ánh đầy đủ nhất xu hướng phát triển của chỉ tiêu đang nghiên cứu.

2. Tìm các tham số của hàm (phương trình) được chỉ định từ dữ liệu thực nghiệm

3. Tính toán theo phương trình đã tìm được của các cấp lý thuyết (đã cấp).

Việc lựa chọn một chức năng cụ thể được thực hiện, như một quy luật, trên cơ sở biểu diễn đồ họa của dữ liệu thực nghiệm.

Các mô hình là phương trình hồi quy, các tham số được tính bằng phương pháp bình phương nhỏ nhất

Dưới đây là các phương trình hồi quy được sử dụng phổ biến nhất để san bằng chuỗi thời gian, cho biết xu hướng phát triển nào phù hợp nhất để phản ánh chúng.

Để tìm các tham số của các phương trình trên, cần có các thuật toán và chương trình máy tính đặc biệt. Đặc biệt, để tìm các tham số của phương trình của một đường thẳng, có thể sử dụng thuật toán sau:

Nếu các khoảng thời gian hoặc khoảnh khắc của thời gian được đánh số để thu được St = 0, thì các thuật toán trên sẽ được đơn giản hóa đáng kể và biến thành

Các mức được căn chỉnh trên biểu đồ sẽ nằm trên một đường thẳng đi qua ở khoảng cách gần nhất so với các mức thực của chuỗi động này. Tổng bình phương độ lệch là sự phản ánh mức độ ảnh hưởng của các yếu tố ngẫu nhiên.

Với sự trợ giúp của nó, chúng tôi tính toán sai số trung bình (tiêu chuẩn) của phương trình:

Ở đây n là số quan sát, và m là số tham số trong phương trình (chúng ta có hai trong số chúng - b 1 và b 0).

Xu hướng chính (xu hướng) cho thấy các yếu tố có hệ thống ảnh hưởng như thế nào đến các mức của chuỗi thời gian và sự biến động của các mức xung quanh xu hướng () đóng vai trò là thước đo tác động của các yếu tố còn lại.

Để đánh giá chất lượng của mô hình chuỗi thời gian được sử dụng, nó cũng được sử dụng Kiểm tra F của Fisher. Nó là tỷ số của hai phương sai, cụ thể là tỷ số của phương sai gây ra bởi hồi quy, tức là yếu tố được nghiên cứu, đến sự phân tán do các nguyên nhân ngẫu nhiên, tức là phương sai còn lại:

Ở dạng mở rộng, công thức cho tiêu chí này có thể được biểu diễn như sau:

trong đó n là số lần quan sát, tức là số cấp độ hàng,

m là số tham số trong phương trình, y là cấp thực tế của chuỗi,

Mức được căn chỉnh của hàng, - mức trung bình của hàng.

Thành công hơn những người khác, mô hình có thể không phải lúc nào cũng đạt yêu cầu. Nó chỉ có thể được công nhận như vậy nếu tiêu chí F của nó vượt qua một giới hạn tới hạn nhất định. Ranh giới này được thiết lập bằng cách sử dụng bảng phân phối F.

Bản chất và phân loại các chỉ số.

Chỉ số trong thống kê được hiểu là một chỉ số tương đối đặc trưng cho sự thay đổi mức độ của một hiện tượng theo thời gian, không gian hoặc so với bất kỳ tiêu chuẩn nào.

Phần tử chính của quan hệ chỉ mục là giá trị được lập chỉ mục. Giá trị được lập chỉ mục được hiểu là giá trị của một dấu hiệu của tổng thể thống kê, sự thay đổi của dấu hiệu đó là đối tượng nghiên cứu.

Các chỉ mục phục vụ ba mục đích chính:

1) đánh giá những thay đổi trong một hiện tượng phức tạp;

2) xác định ảnh hưởng của các yếu tố riêng lẻ đến sự thay đổi của một hiện tượng phức tạp;

3) so sánh mức độ của một số hiện tượng với mức độ của thời kỳ đã qua, mức độ của một vùng lãnh thổ khác, cũng như với các tiêu chuẩn, kế hoạch, dự báo.

Các chỉ số được phân loại theo 3 tiêu chí:

2) theo mức độ bao phủ của các yếu tố của quần thể;

3) bằng các phương pháp tính toán các chỉ số chung.

Theo nội dung của các giá trị được lập chỉ mục, các chỉ số được chia thành chỉ số của chỉ số định lượng (thể tích) và chỉ số của chỉ số định tính. Chỉ số chỉ tiêu định lượng - chỉ số về khối lượng vật chất của sản xuất công nghiệp, khối lượng vật chất bán ra, số lượng, v.v. Chỉ số chỉ tiêu định tính - chỉ số giá cả, chi phí, năng suất lao động, tiền lương bình quân, v.v.

Theo mức độ bao phủ của các đơn vị dân số, các chỉ số được chia thành hai loại: riêng lẻ và chung. Để mô tả đặc điểm của chúng, chúng tôi giới thiệu các quy ước sau được áp dụng trong thực tế áp dụng phương pháp chỉ mục:

q- số lượng (khối lượng) của bất kỳ sản phẩm nào bằng hiện vật ; R- đơn giá sản xuất; z- chi phí sản xuất đơn vị; t- thời gian dành cho việc sản xuất một đơn vị sản lượng (cường độ lao động) ; w- sản lượng sản xuất tính theo giá trị trên một đơn vị thời gian; v- đầu ra theo điều kiện vật lý trên một đơn vị thời gian; T- tổng thời gian đã sử dụng hoặc số lượng nhân viên.

Để phân biệt các giá trị được lập chỉ mục thuộc về chu kỳ hoặc đối tượng nào, thông thường người ta đặt các chỉ số sau ký hiệu tương ứng ở dưới cùng bên phải. Vì vậy, ví dụ, trong các chỉ số động lực học, theo quy luật, cho các thời kỳ được so sánh (hiện tại, báo cáo), chỉ số con 1 được sử dụng và cho các thời kỳ mà phép so sánh được thực hiện,

Các chỉ số riêng lẻ dùng để mô tả sự thay đổi các yếu tố riêng lẻ của một hiện tượng phức tạp (ví dụ, sự thay đổi khối lượng đầu ra của một loại sản phẩm). Chúng đại diện cho các giá trị tương đối của động lực, thực hiện nghĩa vụ, so sánh các giá trị được lập chỉ mục.

Chỉ số riêng của khối lượng vật chất sản xuất được xác định

Từ quan điểm phân tích, các chỉ số động lực riêng lẻ đã cho tương tự với các hệ số (tốc độ) tăng trưởng và đặc trưng cho sự thay đổi của giá trị được lập chỉ mục trong giai đoạn hiện tại so với giá trị cơ sở, tức là cho biết giá trị đã tăng (giảm) bao nhiêu lần. ) hoặc bao nhiêu phần trăm nó là tăng trưởng (giảm). Giá trị chỉ số được biểu thị bằng hệ số hoặc tỷ lệ phần trăm.

Chỉ mục chung (tổng hợp) phản ánh sự thay đổi tất cả các yếu tố của một hiện tượng phức tạp.

Chỉ số tổng hợp là dạng cơ bản của chỉ mục. Nó được gọi là tổng hợp vì tử số và mẫu số của nó là một tập hợp các "tổng thể"

Các chỉ số trung bình, định nghĩa của chúng.

Ngoài các chỉ số tổng hợp, một dạng khác của chúng được sử dụng trong thống kê - chỉ số bình quân gia quyền. Tính toán của họ được sử dụng khi thông tin có sẵn không cho phép tính chỉ số tổng hợp chung. Vì vậy, nếu không có số liệu về giá cả, nhưng có thông tin về giá thành sản phẩm trong kỳ hiện tại và chỉ số giá riêng của từng sản phẩm thì không thể xác định chỉ số giá chung là tổng hợp, nhưng có thể để tính giá trị trung bình của từng cá nhân. Tương tự như vậy, nếu không biết số lượng sản phẩm riêng lẻ được sản xuất ra mà biết được các chỉ số riêng lẻ và chi phí sản xuất của kỳ gốc thì chỉ tiêu tổng hợp của khối lượng sản xuất hiện vật có thể được xác định là bình quân gia quyền.

Chỉ số trung bình -đây là một chỉ số được tính bằng giá trị trung bình của các chỉ số riêng lẻ. Chỉ số tổng hợp là hình thức cơ bản của chỉ số tổng hợp, vì vậy chỉ tiêu bình quân phải đồng nhất với chỉ tiêu tổng hợp. Khi tính toán các chỉ số trung bình, hai hình thức trung bình được sử dụng: số học và điều hòa.

Chỉ số trung bình cộng giống với chỉ số tổng hợp nếu trọng số của các chỉ số riêng lẻ là số hạng của mẫu số của chỉ số tổng hợp. Chỉ trong trường hợp này, giá trị của chỉ số được tính bằng công thức trung bình cộng sẽ bằng với chỉ số tổng hợp.

Từ Wikipedia, bách khoa toàn thư miễn phí

độ lệch chuẩn(từ đồng nghĩa: độ lệch chuẩn, độ lệch chuẩn, độ lệch chuẩn; các điều khoản liên quan: độ lệch chuẩn, tiêu chuẩn lây lan) - trong lý thuyết xác suất và thống kê, chỉ số phổ biến nhất về sự phân tán các giá trị của một biến ngẫu nhiên so với kỳ vọng toán học của nó. Với dãy giá trị giới hạn của các mẫu, thay vì kỳ vọng toán học, giá trị trung bình số học của tập hợp các mẫu được sử dụng.

Thông tin cơ bản

Độ lệch chuẩn được đo bằng đơn vị của chính biến ngẫu nhiên và được sử dụng khi tính sai số chuẩn của giá trị trung bình số học, khi xây dựng khoảng tin cậy, khi kiểm định thống kê các giả thuyết, khi đo lường mối quan hệ tuyến tính giữa các biến ngẫu nhiên. Được xác định là căn bậc hai của phương sai của một biến ngẫu nhiên.

Độ lệch chuẩn:

$\ sigma = \ sqrt (\ frac (1) (n) \ sum_ (i = 1) ^ n \ left (x_i- \ bar (x) \ right) ^ 2).$

Độ lệch chuẩn(ước tính độ lệch chuẩn của một biến ngẫu nhiên x so với kỳ vọng toán học của nó dựa trên một ước tính không thiên vị về phương sai của nó) $S$ :

$s = \ sqrt (\ frac (n) (n-1) \ sigma ^ 2) = \ sqrt (\ frac (1) (n-1) \ sum_ (i = 1) ^ n \ left (x_i- \ bar (x) \ right) ^ 2);$

quy tắc ba sigma

quy tắc ba sigma ( $3 \ sigma$ ) - hầu như tất cả các giá trị của một biến ngẫu nhiên có phân phối chuẩn nằm trong khoảng $\ left (\ bar (x) -3 \ sigma; \ bar (x) +3 \ sigma \ right)$ . Nghiêm túc hơn - xấp xỉ với xác suất 0,9973 giá trị của một biến ngẫu nhiên có phân phối chuẩn nằm trong khoảng xác định (với điều kiện là giá trị $\ bar (x)$ true, và không thu được do xử lý mẫu).

Nếu giá trị thực $\ bar (x)$ không rõ, thì bạn nên sử dụng $\ sigma$ , một S. Do đó, quy tắc ba sigma được chuyển thành quy tắc ba S .

Giải thích giá trị của độ lệch chuẩn

Giá trị lớn hơn của độ lệch chuẩn cho thấy mức chênh lệch lớn hơn của các giá trị trong tập hợp được trình bày với giá trị trung bình của tập hợp đó; một giá trị nhỏ hơn, tương ứng, chỉ ra rằng các giá trị trong tập hợp được nhóm xung quanh giá trị trung bình.

Công dụng thực tế

Trên thực tế, độ lệch chuẩn cho phép bạn ước tính giá trị từ một tập hợp có thể khác với giá trị trung bình bao nhiêu.

Kinh tế và tài chính

Độ lệch chuẩn của lợi tức danh mục đầu tư $\ sigma = \ sqrt (D [X])$ được xác định với rủi ro danh mục đầu tư.

Khí hậu

Giả sử có hai thành phố có cùng nhiệt độ trung bình hàng ngày, nhưng một thành phố nằm trên bờ biển và một thành phố ở đồng bằng. Các thành phố ven biển được biết là có nhiều nhiệt độ tối đa hàng ngày khác nhau thấp hơn các thành phố trong đất liền. Do đó, độ lệch chuẩn của nhiệt độ tối đa hàng ngày ở thành phố ven biển sẽ nhỏ hơn ở thành phố thứ hai, mặc dù giá trị trung bình của giá trị này là như nhau đối với chúng, điều này trong thực tế có nghĩa là xác suất không khí tối đa nhiệt độ của từng ngày cụ thể trong năm sẽ mạnh hơn khác với giá trị trung bình, cao hơn đối với một thành phố nằm bên trong lục địa.

Thể thao

Xem thêm

Viết nhận xét về bài báo "Độ lệch chuẩn"

Văn chương

Borovikov V. SỐ LIỆU THỐNG KÊ. Nghệ thuật phân tích dữ liệu máy tính: Dành cho các chuyên gia / V. Borovikov. - Xanh Pê-téc-bua. : Peter, 2003. - 688 tr. - ISBN 5-272-00078-1..

Các chỉ số thống kê

mô tả
số liệu thống kê

Thống kê
rút tiền và
kiểm tra
giả thuyết







Đánh giá tổng thể

Tương quan và
hồi quy

Đồ họa
phương pháp

Một đoạn trích đặc trưng cho độ lệch chuẩn

Và, nhanh chóng mở cửa, anh kiên quyết bước ra ban công. Cuộc trò chuyện đột nhiên dừng lại, mũ và mũ được tháo ra, và mọi ánh mắt đổ dồn về phía đếm xem ai là người bước ra.
- Xin chào các bạn! nói đếm nhanh và to. - Cảm ơn vì đã đến. Tôi sẽ ra tay với bạn ngay bây giờ, nhưng trước hết chúng ta cần phải đối phó với kẻ ác. Chúng ta cần trừng trị kẻ thủ ác đã giết chết Mátxcơva. Chờ tôi! - Và người đếm vừa nhanh chóng quay trở lại phòng, vừa đóng sầm cửa lại.
Một tiếng xì xào tán thành chạy qua đám đông. “Vậy thì anh ta sẽ kiểm soát việc sử dụng của những kẻ phản diện! Và bạn nói một người Pháp ... anh ta sẽ tháo gỡ toàn bộ khoảng cách cho bạn! người ta nói như trách móc nhau thiếu niềm tin.
Vài phút sau, một sĩ quan vội vã ra khỏi cửa trước, gọi món gì đó, và những người kéo dài ra. Đám đông di chuyển một cách thèm thuồng từ ban công đến hiên nhà. Bước ra ngoài hiên với những bước nhanh đầy tức giận, Rostopchin vội vàng nhìn quanh mình, như thể đang tìm kiếm ai đó.
- Anh ta ở đâu? - ông đếm nói, và ngay lúc ông nói điều này, ông nhìn thấy từ xung quanh góc nhà bước ra giữa hai con rồng, một người đàn ông trẻ với chiếc cổ dài, gầy, đầu cạo trọc và rậm rạp. Người đàn ông trẻ tuổi này mặc một bộ đồ từng là một người bảnh bao, mặc áo khoác da cừu tồi tàn, màu xanh da trời và trong chiếc quần dài của tù nhân bẩn thỉu, nhét vào trong đôi ủng mỏng sờn rách, bẩn thỉu. Xiềng xích đè nặng lên đôi chân gầy gò, yếu ớt, gây khó khăn cho dáng đi ngập ngừng của chàng trai trẻ.
- NHƯNG! - Rostopchin nói, vội vàng ngoảnh mặt khỏi người thanh niên mặc áo khoác cáo và chỉ tay về phía bậc thềm cuối cùng của hiên nhà. - Đặt nó ở đây! - Người thanh niên, cùm cùm chân, bước nặng nề lên bậc đã chỉ định, dùng ngón tay giữ cổ áo khoác da cừu đang ép, xoay chiếc cổ dài hai lần và thở dài, chắp hai bàn tay gầy guộc không hoạt động trước bụng. với một cử chỉ phục tùng.
Im lặng trong vài giây khi người đàn ông trẻ ổn định trên bậc thang. Chỉ có thể nghe thấy ở những hàng ghế sau, những người chen chúc nhau đến một chỗ, tiếng rên rỉ, rên rỉ, xóc nảy và tiếng lách cách của những đôi chân sắp xếp lại.
Rostopchin, đợi anh dừng lại ở nơi đã chỉ định, cau mày đưa tay xoa mặt.
- Các bạn ơi! - Rostopchin nói bằng một giọng kim loại, - người đàn ông này, Vereshchagin, cũng chính là tên vô lại mà Moscow đã chết.
Người thanh niên mặc áo bào đứng trong tư thế phục tùng, hai tay chắp trước bụng và hơi khom người xuống. Khuôn mặt hốc hác, vô vọng, khuôn mặt bị cạo trọc đầu, khuôn mặt trẻ thơ của anh cúi xuống. Những từ đầu tiên của số đếm, anh từ từ ngẩng đầu lên và nhìn xuống số đếm, như thể anh muốn nói điều gì đó với anh ta hoặc ít nhất là bắt gặp ánh mắt của anh ta. Nhưng Rostopchin không nhìn anh ta. Trên cổ thanh niên gầy dài như sợi dây thừng, tĩnh mạch sau tai căng lên tái xanh, đột nhiên mặt đỏ lên.
Mọi ánh mắt đều đổ dồn vào anh. Anh ta nhìn đám đông, và như thể trấn an bởi biểu hiện mà anh ta đọc được trên khuôn mặt của mọi người, anh ta mỉm cười buồn bã và rụt rè, và lại cúi đầu xuống, đứng thẳng trên bậc thềm.
“Anh ta đã phản bội sa hoàng và tổ quốc của mình, anh ta tự giao nộp mình cho Bonaparte, một mình anh ta trong số tất cả người Nga đã làm ô danh tên của một người Nga, và Moscow đang chết vì anh ta,” Rastopchin nói với một giọng đều đều, sắc bén; nhưng đột nhiên anh ta nhanh chóng liếc xuống Vereshchagin, người vẫn tiếp tục đứng trong tư thế phục tùng như cũ. Như thể cái nhìn này làm anh ta nổ tung, anh ta, giơ tay lên, gần như hét lên, quay sang mọi người: - Hãy đối phó với anh ta theo phán quyết của bạn! Tôi trao nó cho bạn!
Mọi người im lặng và chỉ càng ngày càng ép vào nhau nhiều hơn. Việc ôm nhau, hít thở trong sự gần gũi bị nhiễm trùng này, không còn sức để di chuyển và chờ đợi một thứ gì đó không rõ, không thể hiểu nổi và khủng khiếp trở nên không thể chịu đựng nổi. Những người đứng ở hàng trước, những người đã nhìn thấy và nghe thấy tất cả những gì xảy ra trước mặt, tất cả đều kinh hãi mở to mắt và há hốc mồm, cố gắng dùng hết sức để giữ sức ép của những người phía sau trên lưng.
- Đánh nó đi! .. Cho kẻ phản bội chết đi đừng hổ thẹn tên nga! Rastopchin hét lên. - Ruby! Tôi đặt hàng! - Không phải lời nói, mà là âm thanh giận dữ của giọng nói của Rostopchin, đám đông rên rỉ và tiến về phía trước, nhưng lại dừng lại.
- Đếm! .. - Giọng sân khấu vừa rụt rè vừa cất lên của Vereshchagin cất lên giữa khoảng lặng nhất thời. “Bá tước, một vị thần đang ở trên chúng ta…” Vereshchagin ngẩng đầu lên nói, và một lần nữa tĩnh mạch dày trên chiếc cổ gầy của anh trở nên đầy máu, và màu sắc nhanh chóng biến mất khỏi khuôn mặt anh. Anh ấy chưa nói hết những gì anh ấy muốn nói.
- Cắt anh ta! Tôi gọi món! .. - Rostopchin hét lên, đột nhiên tái mặt như Vereshchagin.
- Ra ngoài! Viên cảnh sát hét lên với những người lính kéo, tự rút thanh kiếm của mình.
Một làn sóng khác thậm chí còn mạnh hơn lao qua mọi người, và khi đã đến hàng ghế phía trước, làn sóng này làm di chuyển những người phía trước, loạng choạng, đưa họ đến các bậc thềm của hiên nhà. Một người đàn ông cao lớn, với biểu hiện hóa đá trên khuôn mặt và với một bàn tay đang ngừng giơ lên, đứng cạnh Vereshchagin.
- Ruby! gần như thì thầm một sĩ quan với lính ngự lâm, và một trong những người lính đột nhiên, với khuôn mặt méo mó vì tức giận, dùng một thanh trường kiếm cùn đập vào đầu Vereshchagin.
"NHƯNG!" - Vereshchagin kêu lên một tiếng ngắn và ngạc nhiên, sợ hãi nhìn xung quanh và như thể không hiểu tại sao điều này lại xảy ra với mình. Cùng một tiếng rên rỉ kinh ngạc và kinh hoàng chạy qua đám đông.
"Ôi chúa ơi!" - ai đó cảm thán buồn bã vang lên.
Nhưng sau tiếng kêu kinh ngạc thoát ra từ Vereshchagin, anh ta kêu lên một cách đau đớn, và tiếng kêu này đã hủy hoại anh ta. Rào cản cảm giác của con người, được kéo dài đến mức cao nhất, thứ vẫn còn giữ được đám đông, đã phá vỡ ngay lập tức. Tội ác đã bắt đầu, cần phải hoàn thành nó. Tiếng rên rỉ ai oán bị át đi bởi tiếng gầm thét ghê gớm và giận dữ của đám đông. Giống như con sóng thứ bảy cuối cùng làm vỡ tàu, con sóng cuối cùng không thể ngăn cản này bay lên từ hàng sau, đến hàng trước, hạ gục chúng và nuốt chửng mọi thứ. Dragoon đã tấn công muốn lặp lại đòn của mình. Vereshchagin với tiếng kêu kinh hoàng, lấy tay che chắn, lao tới đám người. Người đàn ông cao lớn mà anh ta vấp phải, nắm lấy chiếc cổ gầy guộc của Vereshchagin bằng tay và cùng với anh ta, với một tiếng kêu hoang dã, ngã xuống dưới chân của những người đang gầm thét đang dồn lên.
Một số đánh và xé nát Vereshchagin, những người khác là những người cao thủ. Và tiếng kêu của những người bị nghiền nát và những người cố gắng cứu đồng loại cao chỉ khơi dậy cơn thịnh nộ của đám đông. Trong một thời gian dài, những kẻ lang thang không thể giải thoát cho công nhân nhà máy đẫm máu, bị đánh đến chết. Và trong một thời gian dài, bất chấp tất cả những cơn sốt mà đám đông cố gắng hoàn thành công việc khi đã bắt đầu, những kẻ đánh đập, bóp cổ và xé xác Vereshchagin không thể giết được anh ta; nhưng đám đông đè bẹp họ từ mọi phía, với họ ở giữa, giống như một khối, lắc lư từ bên này sang bên kia và không cho họ cơ hội để kết liễu anh ta hoặc bỏ anh ta.