Tiểu sử Đặc trưng Phân tích

Công thức tính độ lệch chuẩn là gì. Ngoài ra, phân biệt

Chương trình Excel được đánh giá cao bởi cả chuyên gia và nghiệp dư, bởi vì người dùng ở bất kỳ trình độ đào tạo nào cũng có thể làm việc với nó. Ví dụ, bất kỳ ai có kỹ năng tối thiểu về "giao tiếp" với Excel đều có thể vẽ một biểu đồ đơn giản, tạo một dấu hiệu đẹp, v.v.

Đồng thời, chương trình này thậm chí còn cho phép bạn thực hiện nhiều loại tính toán khác nhau, chẳng hạn như tính toán, nhưng điều này đã yêu cầu một mức độ đào tạo hơi khác. Tuy nhiên, nếu bạn mới bắt đầu làm quen với chương trình này và quan tâm đến mọi thứ sẽ giúp bạn trở thành người dùng nâng cao hơn, thì bài viết này là dành cho bạn. Hôm nay tôi sẽ cho bạn biết công thức độ lệch chuẩn trong excel là gì, tại sao nó lại cần thiết và trên thực tế, nó được áp dụng khi nào. Đi!

Nó là gì

Hãy bắt đầu với lý thuyết. Độ lệch chuẩn thường được gọi là căn bậc hai, thu được từ trung bình cộng của tất cả các chênh lệch bình phương giữa các giá trị có sẵn, cũng như trung bình cộng của chúng. Nhân tiện, giá trị này thường được gọi là chữ cái Hy Lạp "sigma". Độ lệch chuẩn được tính bằng công thức STDEV, tương ứng, chương trình thực hiện điều đó cho chính người dùng.

Bản chất của khái niệm này là xác định mức độ thay đổi của công cụ, theo cách riêng của nó, là một chỉ số từ thống kê mô tả. Nó tiết lộ những thay đổi về sự biến động của công cụ trong bất kỳ khoảng thời gian nào. Sử dụng công thức STDEV, bạn có thể ước tính độ lệch chuẩn của một mẫu, trong khi giá trị boolean và văn bản bị bỏ qua.

Công thức

Giúp tính toán độ lệch chuẩn trong công thức excel, được cung cấp tự động trong Excel. Để tìm nó, bạn cần tìm phần công thức trong Excel, và chọn phần công thức có tên STDEV, rất đơn giản.

Sau đó, một cửa sổ sẽ xuất hiện trước mặt bạn, trong đó bạn sẽ cần nhập dữ liệu để tính toán. Đặc biệt, hai số nên được nhập vào các trường đặc biệt, sau đó chương trình sẽ tự động tính toán độ lệch chuẩn cho mẫu.

Không nghi ngờ gì nữa, các công thức và phép tính toán học là một vấn đề khá phức tạp và không phải người dùng nào cũng có thể giải quyết nó ngay lập tức. Tuy nhiên, nếu bạn đào sâu hơn một chút và hiểu vấn đề chi tiết hơn một chút, hóa ra không phải mọi thứ đều đáng buồn như vậy. Tôi hy vọng bạn bị thuyết phục về điều này bằng ví dụ về tính toán độ lệch chuẩn.

Video để giúp đỡ

Các nhà toán học và thống kê thông minh đã đưa ra một chỉ số đáng tin cậy hơn, mặc dù với một mục đích hơi khác - có nghĩa là độ lệch tuyến tính. Chỉ số này đặc trưng cho phép đo mức độ lan truyền các giá trị của tập dữ liệu xung quanh giá trị trung bình của chúng.

Để hiển thị thước đo mức độ lan truyền dữ liệu, trước tiên bạn phải xác định mức độ chênh lệch này sẽ được coi là tương đối với giá trị nào - thường đây là giá trị trung bình. Tiếp theo, bạn cần tính toán xem các giá trị của tập dữ liệu được phân tích khác xa giá trị trung bình như thế nào. Rõ ràng là mỗi giá trị tương ứng với một lượng sai lệch nhất định, nhưng chúng tôi cũng quan tâm đến một ước tính chung bao gồm toàn bộ tổng thể. Do đó, độ lệch trung bình được tính bằng công thức của giá trị trung bình cộng thông thường. Nhưng! Nhưng để tính giá trị trung bình của các độ lệch, trước tiên chúng phải được cộng. Và nếu chúng ta cộng các số dương và số âm, chúng sẽ triệt tiêu lẫn nhau và tổng của chúng sẽ có xu hướng bằng không. Để tránh điều này, tất cả các độ lệch được lấy theo modulo, tức là tất cả các số âm đều trở thành số dương. Bây giờ độ lệch trung bình sẽ hiển thị một thước đo tổng quát về sự lây lan của các giá trị. Kết quả là, độ lệch tuyến tính trung bình sẽ được tính theo công thức:

một là độ lệch tuyến tính trung bình,

x- chỉ số được phân tích, với dấu gạch ngang ở trên cùng - giá trị trung bình của chỉ báo,

N là số lượng giá trị trong tập dữ liệu được phân tích,

Tôi hy vọng rằng toán tử tổng kết không làm ai sợ.

Độ lệch tuyến tính trung bình được tính bằng công thức đã chỉ định phản ánh độ lệch tuyệt đối trung bình so với giá trị trung bình của tập hợp này.

Đường màu đỏ trong hình là giá trị trung bình. Độ lệch của mỗi quan sát so với giá trị trung bình được biểu thị bằng các mũi tên nhỏ. Chúng được lấy modulo và tổng hợp lại. Sau đó, mọi thứ được chia cho số lượng giá trị.

Để hoàn thành bức tranh, cần đưa ra một ví dụ nữa. Giả sử có một công ty sản xuất cây giâm xẻng. Mỗi vết cắt nên dài 1,5 mét, nhưng quan trọng hơn, tất cả phải như nhau, hoặc ít nhất cộng trừ 5 cm, tuy nhiên, người thợ cẩu thả sẽ cắt bỏ 1,2 m, rồi 1,8 m. Giám đốc công ty quyết định tiến hành thống kê độ dài của cành giâm. Tôi chọn 10 mảnh và đo chiều dài của chúng, tìm giá trị trung bình và tính toán độ lệch tuyến tính trung bình. Mức trung bình hóa ra là chính xác những gì cần thiết - 1,5 m. Nhưng độ lệch tuyến tính trung bình hóa ra là 0,16 m. Vì vậy, hóa ra mỗi lần cắt dài hơn hoặc ngắn hơn mức cần thiết trung bình là 16 cm. Có điều gì đó để nói chuyện với người lao động. Thực ra tôi chưa thấy công dụng thực sự của chỉ báo này nên tôi tự nghĩ ra một ví dụ. Tuy nhiên, có một chỉ số như vậy trong số liệu thống kê.

Sự phân tán

Giống như độ lệch tuyến tính trung bình, phương sai cũng phản ánh mức độ lan truyền dữ liệu xung quanh giá trị trung bình.

Công thức tính phương sai có dạng như sau:

(đối với chuỗi biến thể (phương sai có trọng số))

(đối với dữ liệu chưa được nhóm (phương sai đơn giản))

Trong đó: σ 2 - độ phân tán, Xi- chúng tôi phân tích chỉ số sq (giá trị tính năng), - giá trị trung bình của chỉ số, f i - số lượng giá trị trong tập dữ liệu được phân tích.

Phương sai là bình phương trung bình của độ lệch.

Đầu tiên, giá trị trung bình được tính toán, sau đó, sự khác biệt giữa mỗi đường cơ sở và giá trị trung bình được lấy, bình phương, nhân với tần suất của giá trị đối tượng địa lý tương ứng, được thêm vào, sau đó chia cho số lượng giá trị trong tổng thể.

Tuy nhiên, ở dạng thuần túy của nó, chẳng hạn như, chẳng hạn, độ phân tán trung bình số học, hoặc chỉ số, không được sử dụng. Nó đúng hơn là một chỉ báo phụ trợ và trung gian được sử dụng cho các loại phân tích thống kê khác.

Cách đơn giản để tính phương sai

độ lệch chuẩn

Để sử dụng phương sai cho phân tích dữ liệu, một căn bậc hai được lấy từ nó. Hóa ra cái gọi là độ lệch chuẩn.

Nhân tiện, độ lệch chuẩn còn được gọi là sigma - từ chữ cái Hy Lạp biểu thị nó.

Độ lệch chuẩn rõ ràng cũng đặc trưng cho phép đo độ phân tán dữ liệu, nhưng bây giờ (không giống độ phân tán) nó có thể được so sánh với dữ liệu ban đầu. Theo quy luật, các chỉ báo bình phương trung bình trong thống kê cho kết quả chính xác hơn các chỉ báo tuyến tính. Do đó, độ lệch chuẩn là thước đo độ phân tán dữ liệu chính xác hơn độ lệch tuyến tính trung bình.

Hướng dẫn

Giả sử có một số số đặc trưng - hoặc các đại lượng đồng nhất. Ví dụ, kết quả của các phép đo, cân, quan sát thống kê, v.v. Tất cả các đại lượng được trình bày phải được đo bằng cùng một phép đo. Để tìm độ lệch chuẩn, hãy làm như sau.

Xác định trung bình cộng của tất cả các số: cộng tất cả các số và chia tổng cho tổng các số.

Xác định độ phân tán (tán xạ) của các số: cộng các bình phương của các độ lệch tìm được trước đó và chia tổng kết quả cho số lượng các số.

Khoa có bảy bệnh nhân với nhiệt độ 34, 35, 36, 37, 38, 39 và 40 độ C.

Yêu cầu xác định độ lệch trung bình so với giá trị trung bình.
Quyết định:
"trong phường": (34 + 35 + 36 + 37 + 38 + 39 + 40) / 7 = 37 ºС;

Độ lệch nhiệt độ so với mức trung bình (trong trường hợp này là giá trị bình thường): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, hóa ra là: -3, -2, -1, 0, 1, 2, 3 (ºС);

Chia tổng các số có được trước đó cho số của chúng. Để tính chính xác của phép tính, tốt hơn là sử dụng máy tính bỏ túi. Kết quả của phép chia là trung bình cộng của các tổng.

Hãy chú ý đến tất cả các giai đoạn của phép tính, vì một sai sót trong ít nhất một trong các phép tính sẽ dẫn đến chỉ số cuối cùng không chính xác. Kiểm tra các phép tính nhận được ở mỗi giai đoạn. Trung bình số học có cùng thước đo với tổng và các số, nghĩa là, nếu bạn xác định được số người tham gia trung bình, thì tất cả các chỉ số sẽ là “người”.

Phương pháp tính toán này chỉ được sử dụng trong các phép tính toán học và thống kê. Vì vậy, ví dụ, trung bình cộng trong khoa học máy tính có một thuật toán tính toán khác. Trung bình cộng là một chỉ số rất có điều kiện. Nó cho thấy xác suất của một sự kiện, với điều kiện là nó chỉ có một yếu tố hoặc chỉ số. Để phân tích chuyên sâu nhất, phải tính đến nhiều yếu tố. Đối với điều này, việc tính toán các đại lượng tổng quát hơn được sử dụng.

Trung bình cộng là một trong những thước đo có xu hướng trung tâm, được sử dụng rộng rãi trong toán học và tính toán thống kê. Việc tìm giá trị trung bình cộng của một số giá trị rất đơn giản, nhưng mỗi nhiệm vụ có những sắc thái riêng, mà chỉ cần biết để thực hiện các phép tính chính xác là rất cần thiết.

Kết quả định lượng của các thí nghiệm đó.

Cách tìm giá trị trung bình cộng

Việc tìm kiếm trung bình cộng cho một mảng số nên bắt đầu bằng việc xác định tổng đại số của các giá trị này. Ví dụ: nếu mảng chứa các số 23, 43, 10, 74 và 34, thì tổng đại số của chúng sẽ là 184. Khi viết, giá trị trung bình cộng được ký hiệu bằng chữ μ (mu) hoặc x (x với một thanh) . Tiếp theo, tổng đại số nên được chia cho số lượng các số trong mảng. Trong ví dụ này, có năm số, vì vậy trung bình cộng sẽ là 184/5 và sẽ là 36,8.

Tính năng làm việc với số âm

Nếu có số âm trong mảng, thì giá trị trung bình số học được tìm thấy bằng cách sử dụng một thuật toán tương tự. Chỉ có sự khác biệt khi tính toán trong môi trường lập trình, hoặc nếu có các điều kiện bổ sung trong nhiệm vụ. Trong những trường hợp này, việc tìm trung bình cộng của các số có các dấu hiệu khác nhau có ba bước:

1. Tìm trung bình cộng theo phương pháp chuẩn;
2. Tìm trung bình cộng của số âm.
3. Tính trung bình cộng của các số dương.

Câu trả lời của mỗi hành động được viết cách nhau bằng dấu phẩy.

Phân số tự nhiên và thập phân

Nếu dãy số được biểu diễn bằng phân số thập phân thì lời giải xảy ra theo phương pháp tính trung bình cộng của số nguyên, nhưng kết quả lại giảm theo yêu cầu của đề bài về độ chính xác của câu trả lời.

Khi làm việc với các phân số tự nhiên, chúng nên được quy về một mẫu số chung, nhân với số lượng các số trong mảng. Tử số của câu trả lời sẽ là tổng các tử số đã cho của các phần tử của phân số ban đầu.

Sự phân tán. Độ lệch chuẩn

Sự phân tán là trung bình cộng của độ lệch bình phương của từng giá trị đối tượng so với tổng giá trị. Tùy thuộc vào dữ liệu nguồn, phương sai có thể không có trọng số (đơn giản) hoặc có trọng số.

Độ phân tán được tính bằng các công thức sau:

cho dữ liệu chưa được phân nhóm

cho dữ liệu được nhóm

Quy trình tính toán phương sai có trọng số:

1. xác định giá trị trung bình cộng

2. Độ lệch của các biến thể so với giá trị trung bình được xác định

3. bình phương độ lệch của mỗi tùy chọn so với giá trị trung bình

4. nhân độ lệch bình phương với trọng số (tần số)

5. tóm tắt các tác phẩm đã nhận

6. số tiền kết quả được chia cho tổng trọng lượng

Công thức xác định phương sai có thể được chuyển đổi thành công thức sau:

- giản dị

Quy trình tính toán phương sai rất đơn giản:

1. xác định giá trị trung bình cộng

2. bình phương số học trung bình

3. vuông từng hàng tùy chọn

4. tìm tổng bình phương tùy chọn

5. chia tổng các bình phương của tùy chọn cho số của chúng, tức là xác định bình phương trung bình

6. xác định sự khác biệt giữa bình phương trung bình của đối tượng địa lý và bình phương trung bình

Ngoài ra, công thức xác định phương sai có trọng số có thể được chuyển đổi thành công thức sau:

những thứ kia. phương sai bằng hiệu giữa trung bình của các bình phương của các giá trị đối tượng và bình phương của trung bình số học. Khi sử dụng công thức được chuyển đổi, một quy trình bổ sung để tính toán độ lệch của các giá trị riêng lẻ của thuộc tính từ x sẽ bị loại trừ và lỗi trong phép tính liên quan đến việc làm tròn các độ lệch sẽ bị loại trừ

Sự phân tán có một số đặc tính, một số đặc tính giúp tính toán dễ dàng hơn:

1) độ phân tán của một giá trị không đổi bằng không;

2) nếu tất cả các biến thể của các giá trị thuộc tính được giảm đi một số giống nhau, thì phương sai sẽ không giảm;

3) nếu tất cả các biến thể của các giá trị thuộc tính đều giảm cùng một số lần (lần), thì phương sai sẽ giảm theo hệ số

Độ lệch chuẩn- là căn bậc hai của phương sai:

Đối với dữ liệu chưa được nhóm:

;

Đối với một chuỗi biến thể:

Phạm vi biến thiên, tuyến tính trung bình và độ lệch bình phương trung bình là các đại lượng được đặt tên. Chúng có cùng đơn vị đo lường như các giá trị đặc trưng riêng lẻ.

Độ phân tán và độ lệch chuẩn là những thước đo độ biến thiên được sử dụng rộng rãi nhất. Điều này được giải thích bởi thực tế là chúng được bao gồm trong hầu hết các định lý của lý thuyết xác suất, đóng vai trò là nền tảng của thống kê toán học. Ngoài ra, phương sai có thể được phân tách thành các yếu tố cấu thành của nó, cho phép đánh giá mức độ ảnh hưởng của các yếu tố khác nhau gây ra sự biến đổi của một tính trạng.

Việc tính toán các chỉ số biến động cho các ngân hàng được phân nhóm theo lợi nhuận được trình bày trong bảng.

Lợi nhuận, triệu rúp Số lượng ngân hàng các chỉ số tính toán
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Toàn bộ: 121,70 17,640 23,126

Độ lệch trung bình tuyến tính và bình phương trung bình cho biết giá trị của thuộc tính dao động trung bình như thế nào đối với các đơn vị và dân số đang được nghiên cứu. Vì vậy, trong trường hợp này, giá trị trung bình của sự biến động về lượng lợi nhuận là: theo độ lệch tuyến tính trung bình, 0,882 triệu rúp; theo độ lệch chuẩn - 1,075 triệu rúp. Độ lệch chuẩn luôn lớn hơn độ lệch tuyến tính trung bình. Nếu sự phân bố của tính trạng gần với bình thường, thì có mối quan hệ giữa S và d: S = 1,25d, hoặc d = 0,8S. Độ lệch chuẩn cho biết vị trí của phần lớn các đơn vị dân số so với giá trị trung bình số học. Bất kể dạng phân phối là gì, 75 giá trị của thuộc tính rơi vào khoảng x 2S và ít nhất 89 trong số tất cả các giá trị rơi vào khoảng x 3S (định lý P.L. Chebyshev).

Kỳ vọng toán học và phương sai

Hãy đo lường một biến ngẫu nhiên N lần, ví dụ, chúng tôi đo tốc độ gió mười lần và muốn tìm giá trị trung bình. Giá trị trung bình có liên quan như thế nào đến hàm phân phối?

Chúng ta sẽ tung xúc xắc nhiều lần. Số điểm rơi ra trên con súc sắc trong mỗi lần ném là một biến ngẫu nhiên và có thể nhận bất kỳ giá trị tự nhiên nào từ 1 đến 6. N nó có xu hướng đến một con số rất cụ thể - kỳ vọng toán học M x. Trong trường hợp này M x = 3,5.

Giá trị này đến như thế nào? Cho vào N Các bài kiểm tra một lần bỏ 1 điểm, một lần - 2 điểm, v.v. sau đó N→ ∞ số lượng kết quả mà một điểm đã giảm, Tương tự, Từ đây

Mô hình 4.5. Xúc xắc

Bây giờ chúng ta hãy giả sử rằng chúng ta biết luật phân phối của biến ngẫu nhiên x nghĩa là chúng ta biết rằng biến ngẫu nhiên x có thể nhận các giá trị x 1 , x 2 , ..., x k với xác suất P 1 , P 2 , ..., p k.

Gia trị được ki vọng M x biến ngẫu nhiên x bằng:

Trả lời. 2,8.

Kỳ vọng toán học không phải lúc nào cũng là một ước lượng hợp lý của một số biến ngẫu nhiên. Vì vậy, để ước tính mức lương trung bình, sẽ hợp lý hơn khi sử dụng khái niệm giá trị trung bình, nghĩa là, một giá trị sao cho số người nhận ít hơn mức lương trung bình và nhiều hơn, là như nhau.

Trung bình một biến ngẫu nhiên được gọi là một số x 1/2 như vậy P (x < x 1/2) = 1/2.

Nói cách khác, xác suất P 1 rằng biến ngẫu nhiên x Sẽ ít hơn x 1/2 và xác suất P 2 rằng một biến ngẫu nhiên x sẽ lớn hơn x 1/2 bằng nhau và bằng 1/2. Giá trị trung bình không được xác định duy nhất cho tất cả các phân phối.

Quay lại biến ngẫu nhiên x, có thể nhận các giá trị x 1 , x 2 , ..., x k với xác suất P 1 , P 2 , ..., p k.

sự phân tán biến ngẫu nhiên x là giá trị trung bình của độ lệch bình phương của một biến ngẫu nhiên so với kỳ vọng toán học của nó:

Ví dụ 2

Trong các điều kiện của ví dụ trước, hãy tính phương sai và độ lệch chuẩn của một biến ngẫu nhiên x.

Trả lời. 0,16, 0,4.

Mô hình 4.6. bắn mục tiêu

Ví dụ 3

Tìm phân phối xác suất của số điểm lăn trên xúc xắc từ lần ném đầu tiên, giá trị trung bình, kỳ vọng toán học, phương sai và độ lệch chuẩn.

Việc đánh rơi bất kỳ khuôn mặt nào cũng có thể xảy ra như nhau, vì vậy phân phối sẽ như thế này:

Độ lệch chuẩn Có thể thấy rằng độ lệch của giá trị so với giá trị trung bình là rất lớn.

Các thuộc tính của kỳ vọng toán học:

  • Kỳ vọng toán học của tổng các biến ngẫu nhiên độc lập bằng tổng kỳ vọng toán học của chúng:

Ví dụ 4

Tìm kỳ vọng toán học của tổng và tích của các điểm lăn trên hai con súc sắc.

Trong ví dụ 3, chúng tôi thấy rằng đối với một khối lập phương M (x) = 3,5. Vì vậy, đối với hai khối

Thuộc tính phân tán:

  • Phương sai của tổng các biến ngẫu nhiên độc lập bằng tổng các phương sai:

D x + y = D x + Dy.

Để cho N cuộn xúc xắc yđiểm. sau đó

Kết quả này không chỉ đúng với các cuộn xúc xắc. Trong nhiều trường hợp, nó xác định độ chính xác của việc đo lường kỳ vọng toán học theo kinh nghiệm. Có thể thấy rằng với việc tăng số đo N sự lây lan của các giá trị xung quanh giá trị trung bình, tức là độ lệch chuẩn, giảm theo tỷ lệ

Phương sai của một biến ngẫu nhiên có liên quan đến kỳ vọng toán học về bình phương của biến ngẫu nhiên này theo quan hệ sau:

Chúng ta hãy tìm các kỳ vọng toán học của cả hai phần của đẳng thức này. A-priory,

Kỳ vọng toán học của vế phải của đẳng thức, theo tính chất của kỳ vọng toán học, bằng

Độ lệch chuẩn

độ lệch chuẩn bằng căn bậc hai của phương sai:
Khi xác định độ lệch chuẩn cho một khối lượng đủ lớn của dân số được nghiên cứu (n> 30), các công thức sau được sử dụng:

Thông tin tương tự.