Tiểu sử Đặc điểm Phân tích

Tính toán tương quan trong excel. Cách tính tương quan trong Microsoft Excel

Phân tích tương quan là một phương pháp phổ biến nghiên cứu thống kê, được sử dụng để xác định mức độ phụ thuộc của một chỉ số vào chỉ số khác. TẠI Microsoft Excel có một công cụ đặc biệt được thiết kế để thực hiện loại phân tích này. Hãy cùng tìm hiểu cách sử dụng tính năng này.

Bản chất của phân tích tương quan

mục đích phân tích tương quan là xác định mối quan hệ giữa các yếu tố khác nhau. Có nghĩa là, nó được xác định liệu sự giảm hoặc tăng của một chỉ số có ảnh hưởng đến sự thay đổi của chỉ số khác hay không.

Nếu sự phụ thuộc được thiết lập, thì hệ số tương quan được xác định. không giống Phân tích hồi quy, là chỉ số duy nhất tính toán phương pháp này nghiên cứu thống kê. Hệ số tương quan nằm trong khoảng từ +1 đến -1. Nếu có mối tương quan thuận, sự gia tăng của một chỉ số sẽ góp phần vào sự gia tăng của chỉ số thứ hai. Với mối tương quan nghịch, sự gia tăng của một chỉ số kéo theo sự giảm xuống của chỉ số kia. Môđun của hệ số tương quan càng lớn thì sự thay đổi của một chỉ tiêu càng được phản ánh trong sự thay đổi trong giây. Với hệ số bằng 0, sự phụ thuộc giữa chúng hoàn toàn không có.

Tính toán hệ số tương quan

Bây giờ chúng ta hãy thử tính toán hệ số tương quan trên ví dụ cụ thể. Chúng tôi có một bảng, trong đó chi phí quảng cáo và số tiền bán hàng hàng tháng được vẽ trong các cột riêng biệt. Chúng ta phải tìm ra mức độ phụ thuộc của số lượng bán hàng vào số tiền đã chi cho quảng cáo.

Phương pháp 1: Xác định mối tương quan thông qua trình hướng dẫn hàm

Một trong những cách mà bạn có thể tiến hành phân tích tương quan là sử dụng hàm CORREL. Bản thân chức năng có hình thức chung CORREL (mảng1, mảng2).

  1. Chọn ô mà kết quả của phép tính sẽ được hiển thị. Nhấp vào nút "Chèn Hàm", nằm ở bên trái của thanh công thức.
  2. Trong danh sách được trình bày trong cửa sổ Trình hướng dẫn chức năng, hãy tìm và chọn chức năng CORREL. Nhấp vào nút "OK".
  3. Cửa sổ đối số hàm mở ra. Trong trường "Mảng 1", hãy nhập tọa độ của phạm vi ô của một trong các giá trị, sự phụ thuộc của giá trị đó sẽ được xác định. Trong trường hợp của chúng tôi, đây sẽ là các giá trị trong cột "Số tiền bán hàng". Để nhập địa chỉ của mảng vào trường, chỉ cần chọn tất cả các ô có dữ liệu trong cột trên.

    Trong trường "Array2", bạn cần nhập tọa độ của cột thứ hai. Chúng tôi có chi phí quảng cáo. Tương tự như trong trường hợp trước, chúng tôi nhập dữ liệu vào trường.

    Nhấp vào nút "OK".

Như bạn có thể thấy, hệ số tương quan ở dạng số xuất hiện trong ô mà chúng ta đã chọn trước đó. TẠI trường hợp này nó bằng 0,97, rất dấu hiệu cao sự phụ thuộc của đại lượng này vào đại lượng khác.

Phương pháp 2: Tính toán mối tương quan bằng cách sử dụng gói phân tích

Ngoài ra, mối tương quan có thể được tính toán bằng cách sử dụng một trong các công cụ được cung cấp trong gói phân tích. Nhưng trước tiên chúng ta cần kích hoạt công cụ này.

  1. Chuyển đến tab "Tệp".
  2. Trong cửa sổ mở ra, chuyển đến phần "Cài đặt".
  3. Tiếp theo, chuyển đến mục "Tiện ích bổ sung".
  4. Ở cuối cửa sổ tiếp theo, trong phần "Quản lý", hãy chuyển nút gạt sang vị trí "Phần bổ trợ Excel", nếu nút này ở vị trí khác. Nhấp vào nút "OK".
  5. Trong cửa sổ tiện ích bổ sung, hãy chọn hộp bên cạnh mục "Gói phân tích". Nhấp vào nút "OK".
  6. Sau đó, gói phân tích được kích hoạt. Chuyển đến tab "Dữ liệu". Như bạn có thể thấy, ở đây một khối công cụ mới xuất hiện trên dải băng - "Phân tích". Nhấp vào nút "Phân tích dữ liệu", nằm trong đó.
  7. Danh sách mở ra với Các tùy chọn khác nhau phân tích dữ liệu. Chọn "Tương quan". Nhấp vào nút "OK".
  8. Một cửa sổ với các tham số phân tích tương quan sẽ mở ra. Không giống như phương pháp trước, trong trường "Khoảng đầu vào", chúng tôi nhập khoảng không cho từng cột riêng biệt mà cho tất cả các cột tham gia phân tích. Trong trường hợp của chúng tôi, đây là dữ liệu trong cột "Chi tiêu quảng cáo" và "Doanh số".

    Chúng tôi giữ nguyên thông số “Nhóm” - “Theo cột”, vì nhóm dữ liệu của chúng tôi được chia thành hai cột. Nếu chúng bị đứt từng dòng, thì công tắc phải được chuyển sang vị trí “Theo dòng”.

    Theo mặc định, các tùy chọn đầu ra được đặt thành "New Worksheet", tức là dữ liệu sẽ được hiển thị trên một trang tính khác. Bạn có thể thay đổi vị trí bằng cách di chuyển công tắc. Đây có thể là trang tính hiện tại (sau đó bạn sẽ cần chỉ định tọa độ của các ô đầu ra thông tin) hoặc một sổ làm việc (tệp) mới.

    Khi tất cả các cài đặt được thiết lập, hãy nhấp vào nút "OK".

Vì vị trí đầu ra của kết quả phân tích được để theo mặc định, chúng tôi chuyển sang lá mới. Như bạn thấy, đây là hệ số tương quan. Đương nhiên, nó giống như khi sử dụng phương pháp đầu tiên - 0,97. Điều này là do cả hai tùy chọn đều thực hiện các phép tính giống nhau, chúng chỉ có thể được thực hiện theo những cách khác nhau.

Như bạn có thể thấy, ứng dụng Excel cung cấp hai phương pháp phân tích tương quan cùng một lúc. Kết quả của các phép tính, nếu bạn làm đúng mọi thứ, sẽ hoàn toàn giống hệt nhau. Tuy nhiên, mỗi người dùng có thể chọn một tùy chọn tính toán thuận tiện hơn cho mình.

Chúng tôi rất vui vì chúng tôi có thể giúp bạn giải quyết vấn đề.

Đặt câu hỏi của bạn trong phần bình luận, mô tả chi tiết bản chất của vấn đề. Các chuyên gia của chúng tôi sẽ cố gắng giải đáp nhanh nhất có thể.

Bài báo này hữu ích với bạn?

Phân tích hồi quy và tương quan - phương pháp thống kê nghiên cứu. Đây là những cách phổ biến nhất để chỉ ra sự phụ thuộc của một tham số vào một hoặc nhiều biến độc lập.

Dưới đây về cụ thể ví dụ thực tế Chúng ta hãy xem xét hai phân tích rất phổ biến trong số các nhà kinh tế học. Chúng tôi cũng sẽ đưa ra một ví dụ về việc thu được kết quả khi chúng được kết hợp với nhau.

Phân tích hồi quy trong Excel

Cho biết mức độ ảnh hưởng của một số giá trị (độc lập, không phụ thuộc) đến biến phụ thuộc. Ví dụ, số lượng dân số hoạt động kinh tế phụ thuộc vào số lượng doanh nghiệp, tiền lương và các thông số khác như thế nào. Hoặc: đầu tư nước ngoài, giá năng lượng, ... ảnh hưởng như thế nào đến mức GDP.

Kết quả phân tích cho phép bạn sắp xếp thứ tự ưu tiên. Và dựa trên các yếu tố chính, để dự đoán, lập kế hoạch phát triển lĩnh vực ưu tiênđể đưa ra các quyết định của người quản lý.

Hồi quy xảy ra:

  • tuyến tính (y = a + bx);
  • parabol (y = a + bx + cx2);
  • lũy thừa (y = a * exp (bx));
  • power (y = a * x ^ b);
  • hypebol (y = b / x + a);
  • logarit (y = b * 1n (x) + a);
  • hàm mũ (y = a * b ^ x).

Hãy xem xét ví dụ về việc xây dựng mô hình hồi quy trong Excel và giải thích kết quả. Hãy lấy loại tuyến tính hồi quy.

Một nhiệm vụ. Tại 6 doanh nghiệp, trung bình hàng tháng tiền công và số lượng nhân viên đã nghỉ hưu. Cần xác định sự phụ thuộc của số lao động nghỉ hưu vào mức lương bình quân.

Mô hình hồi quy tuyến tính có dạng sau:

Y \ u003d a0 + a1x1 + ... + akhk.

Trong đó a là các hệ số hồi quy, x là các biến ảnh hưởng và k là số nhân tố.

Trong ví dụ của chúng tôi, Y là chỉ số công nhân nghỉ việc. Yếu tố ảnh hưởng là tiền lương (x).

Excel có các hàm tích hợp có thể được sử dụng để tính toán các tham số của mô hình hồi quy tuyến tính. Nhưng phần bổ trợ Analysis ToolPak sẽ làm việc đó nhanh hơn.

Kích hoạt một công cụ phân tích mạnh mẽ:

  1. Nhấp vào nút "Văn phòng" và chuyển đến tab "Tùy chọn Excel". "Tiện ích bổ sung".
  2. Ở dưới cùng, dưới danh sách thả xuống, trong trường "Quản lý", sẽ có một dòng chữ "Excel Add-in" (nếu không có, hãy nhấp vào hộp kiểm bên phải và chọn). Và một nút Bắt đầu. Nhấp chuột.
  3. Một danh sách các tiện ích bổ sung có sẵn sẽ mở ra. Chọn "Gói phân tích" và nhấp vào OK.

Sau khi được kích hoạt, tiện ích bổ sung sẽ có sẵn trong tab Dữ liệu.

Bây giờ chúng ta sẽ giải quyết trực tiếp với phân tích hồi quy.

  1. Mở menu công cụ Phân tích dữ liệu. Chọn "Hồi quy".
  2. Một menu sẽ mở ra để chọn các giá trị đầu vào và các tùy chọn đầu ra (nơi hiển thị kết quả). Trong các trường cho dữ liệu ban đầu, chúng tôi chỉ ra phạm vi của tham số được mô tả (Y) và yếu tố ảnh hưởng đến nó (X). Phần còn lại có thể hoàn thành hoặc không.
  3. Sau khi nhấn OK, chương trình sẽ hiển thị các phép tính trên trang tính mới (bạn có thể chọn khoảng thời gian hiển thị trên trang tính hiện tại hoặc gán kết quả cho sổ làm việc mới).

Trước hết, chúng ta chú ý đến bình phương R và các hệ số.

R-square là hệ số xác định. Trong ví dụ của chúng tôi, nó là 0,755 hoặc 75,5%. Điều này có nghĩa là các tham số tính toán của mô hình giải thích mối quan hệ giữa các tham số nghiên cứu là 75,5%. Hệ số xác định càng cao thì mô hình càng tốt. Tốt - trên 0,8. Kém - dưới 0,5 (phân tích như vậy khó có thể được coi là hợp lý). Trong ví dụ của chúng tôi - "không tệ".

Hệ số 64.1428 cho thấy Y sẽ là bao nhiêu nếu tất cả các biến trong mô hình đang xét đều bằng 0. Nghĩa là các yếu tố khác không được mô tả trong mô hình cũng ảnh hưởng đến giá trị của tham số được phân tích.

Hệ số -0,16285 cho thấy trọng số của biến X đối với Y. Tức là, mức lương trung bình hàng tháng trong mô hình này ảnh hưởng đến số người bỏ việc với trọng số -0,16285 (đây là mức độ ảnh hưởng nhỏ). Dấu "-" cho biết ảnh hưởng xấu: thế nào lương cao hơn càng ít người bỏ thuốc lá. Đó là công bằng.

Phân tích tương quan trong Excel

Phân tích tương quan giúp xác định liệu có mối quan hệ giữa các chỉ tiêu trong một hoặc hai mẫu hay không. Ví dụ, giữa thời gian hoạt động của máy và chi phí sửa chữa, giá thiết bị và thời gian hoạt động, chiều cao và cân nặng của trẻ em, v.v.

Nếu có một mối quan hệ, thì liệu sự gia tăng một tham số sẽ dẫn đến tăng (tương quan thuận) hay giảm (tiêu cực) trong tham số kia. Phân tích tương quan giúp nhà phân tích xác định liệu giá trị của một chỉ số có thể dự đoán giá trị có thể có của chỉ số khác hay không.

Hệ số tương quan được ký hiệu là r. Thay đổi từ +1 đến -1. Việc phân loại các mối tương quan cho các khu vực khác nhau sẽ khác nhau. Với giá trị hệ số là 0 phụ thuộc tuyến tính không tồn tại giữa các mẫu.

Hãy xem cách sử dụng Công cụ Excel tìm hệ số tương quan.

Hàm CORREL được sử dụng để tìm các hệ số được ghép nối.

Nhiệm vụ: Xác định xem có mối quan hệ giữa thời gian hoạt động của máy tiện và chi phí bảo dưỡng máy tiện hay không.

Đặt con trỏ vào ô bất kỳ và nhấn nút fx.

  1. Trong danh mục "Thống kê", chọn chức năng CORREL.
  2. Đối số "Mảng 1" - dãy giá trị đầu tiên - thời gian của máy: A2: A14.
  3. Đối số "Mảng 2" - phạm vi giá trị thứ hai - chi phí sửa chữa: B2: B14. Bấm OK.

Để xác định loại kết nối, bạn cần xem số tuyệt đối hệ số (mỗi lĩnh vực hoạt động có thang điểm riêng).

Để phân tích tương quan của một số tham số (nhiều hơn 2), sẽ thuận tiện hơn khi sử dụng "Phân tích dữ liệu" (tiện ích bổ sung "Gói phân tích"). Trong danh sách, bạn cần chọn một mối tương quan và chỉ định một mảng. Tất cả các.

Các hệ số kết quả sẽ được hiển thị trong ma trận tương quan. Giống như cái này:

Phân tích hồi quy tương quan

Trong thực tế, hai kỹ thuật này thường được sử dụng cùng nhau.

  1. Chúng tôi xây dựng một trường tương quan: "Chèn" - "Sơ đồ" - "Biểu đồ phân tán" (cho phép bạn so sánh các cặp). Phạm vi giá trị là tất cả dữ liệu số trong bảng.
  2. Nhấp chuột trái vào bất kỳ điểm nào trên sơ đồ. Sau đó, phải. Trong menu mở ra, hãy chọn "Thêm đường xu hướng".
  3. Gán các tham số cho dòng. Loại - "Tuyến tính". Ở dưới cùng - "Hiển thị phương trình trong sơ đồ."
  4. Nhấp vào "Đóng".

Bây giờ, dữ liệu phân tích hồi quy đã hiển thị.

1.Mở chương trình Excel

2. Tạo cột với dữ liệu. Trong ví dụ của chúng tôi, chúng tôi sẽ xem xét mối quan hệ, hoặc mối tương quan, giữa tính hiếu chiến và sự thiếu tự tin ở học sinh lớp một. Thí nghiệm có sự tham gia của 30 trẻ em, dữ liệu được trình bày trong bảng Excel:

1 cột - số của chủ đề

Cột thứ 2 - tính hiếu chiến tính bằng điểm

Cột 3 - điểm tự nghi ngờ

3. Sau đó, bạn cần chọn một ô trống bên cạnh bảng và nhấp vào biểu tượng f (x) trong bảng điều khiển Excel

4. Menu các chức năng sẽ mở ra, trong số các danh mục bạn cần chọn Thống kê, và sau đó trong danh sách các hàm tìm thấy theo thứ tự bảng chữ cái CORREL và bấm OK

5. Sau đó, menu đối số hàm sẽ mở ra, cho phép chúng ta chọn các cột dữ liệu mà chúng ta cần. Để chọn cột đầu tiên Tính hiếu chiến bạn cần nhấp vào nút màu xanh lam bên cạnh dòng Array1

6. Hãy chọn dữ liệu cho array1 từ một cột Tính hiếu chiến và nhấp vào nút màu xanh lam trong hộp thoại

7. Sau đó, tương tự với Mảng 1, nhấp vào nút màu xanh lam bên cạnh dòng Array2

8. Hãy chọn dữ liệu cho array2- cột Thiếu lòng tự trọng và nhấn lại nút màu xanh lam, sau đó OK

9. Ở đây, hệ số tương quan r-Pearson được tính toán và viết trong ô đã chọn, trong trường hợp của chúng ta, hệ số tương quan là dương và xấp xỉ bằng nhau. Điều này nói về tích cực vừa phải mối liên hệ giữa tính hiếu chiến và sự thiếu tự tin ở học sinh lớp một

Bằng cách này, suy luận thống kê thử nghiệm sẽ là: r = 0,225, một mối quan hệ tích cực vừa phải giữa các biến đã được tiết lộ tính hiếu chiếnthiếu lòng tự trọng.

Trong một số nghiên cứu, yêu cầu chỉ ra mức ý nghĩa p của hệ số tương quan, tuy nhiên Chương trình Excel, không giống như SPSS, không cung cấp khả năng này. Không sao cả, có những bảng các giá trị tương quan quan trọng (A.D. Nasledov).

Bạn cũng có thể xây dựng một đường hồi quy trong Excel và đính kèm nó vào kết quả của nghiên cứu.

Hệ số tương quan phản ánh mức độ quan hệ giữa hai chỉ tiêu. Luôn nhận giá trị từ -1 đến 1. Nếu hệ số nằm gần 0, thì họ nói rằng không có kết nối giữa các biến.

Nếu giá trị gần bằng một (ví dụ: từ 0,9), thì có một mối quan hệ trực tiếp chặt chẽ giữa các đối tượng được quan sát. Nếu hệ số gần với một hệ số khác điểm cao nhất phạm vi (-1), thì có một mối quan hệ nghịch đảo mạnh mẽ giữa các biến. Khi giá trị nằm trong khoảng từ 0 đến 1 hoặc 0 đến -1, thì chúng tôi đang nói chuyện Về kết nối yếu(trực tiếp hoặc ngược lại). Mối quan hệ này thường không được tính đến: coi như nó không tồn tại.

Tính toán hệ số tương quan trong Excel

Ví dụ, hãy xem xét các phương pháp tính toán hệ số tương quan, các đặc điểm của mối quan hệ trực tiếp và nghịch đảo giữa các biến.

Giá trị của các chỉ số x và y:

Y là biến độc lập, x là biến phụ thuộc. Cần phải tìm ra độ mạnh (mạnh / yếu) và chiều hướng (thuận / nghịch) của mối quan hệ giữa chúng. Công thức cho hệ số tương quan có dạng như sau:


Để đơn giản hóa sự hiểu biết của nó, chúng tôi sẽ chia nó thành một số yếu tố đơn giản.

Có một mối quan hệ trực tiếp chặt chẽ giữa các biến.

Hàm CORREL tích hợp giúp tránh các phép tính phức tạp. Hãy tính toán hệ số tương quan cặp trong Excel bằng cách sử dụng nó. Chúng tôi gọi là bậc thầy của các chức năng. Chúng tôi tìm thấy những gì chúng tôi cần. Các đối số của hàm là một mảng các giá trị y và một mảng các giá trị x:

Hãy hiển thị giá trị của các biến trên biểu đồ:


Có một mối quan hệ chặt chẽ giữa y và x, bởi vì Các đường chạy gần như song song với nhau. Mối quan hệ trực tiếp: tăng y - tăng x, giảm y - giảm x.



Ma trận hệ số tương quan theo cặp trong Excel

Ma trận tương quan là một bảng, tại giao điểm của các hàng và cột có hệ số tương quan giữa các giá trị tương ứng. Nó là hợp lý để xây dựng nó cho một số biến.

Ma trận hệ số tương quan trong Excel được xây dựng bằng công cụ "Tương quan" từ gói "Phân tích dữ liệu".


Một mối quan hệ trực tiếp mạnh mẽ đã được tìm thấy giữa các giá trị của y và x1. Giữa x1 và x2 có một Nhận xét. Thực tế không có kết nối nào với các giá trị trong cột x3.

1.Mở chương trình Excel

2. Tạo cột với dữ liệu. Trong ví dụ của chúng tôi, chúng tôi sẽ xem xét mối quan hệ, hoặc mối tương quan, giữa tính hiếu chiến và sự thiếu tự tin ở học sinh lớp một. Thí nghiệm có sự tham gia của 30 trẻ em, dữ liệu được trình bày trong bảng Excel:

1 cột - số của chủ đề

2 cột - tính hiếu chiến tính bằng điểm

3 cột - thiếu lòng tự trọng tính bằng điểm

3. Sau đó, bạn cần chọn một ô trống bên cạnh bảng và nhấp vào biểu tượng f (x) trong bảng điều khiển Excel

4. Menu các chức năng sẽ mở ra, trong số các danh mục bạn cần chọn Thống kê , và sau đó trong danh sách các hàm tìm thấy theo thứ tự bảng chữ cái CORREL và bấm OK

5. Sau đó, menu đối số hàm sẽ mở ra, cho phép chúng ta chọn các cột dữ liệu mà chúng ta cần. Để chọn cột đầu tiên Tính hiếu chiến bạn cần nhấp vào nút màu xanh lam bên cạnh dòng Array1

6. Hãy chọn dữ liệu cho array1 từ một cột Tính hiếu chiến và nhấp vào nút màu xanh lam trong hộp thoại

7. Sau đó, tương tự với Mảng 1, nhấp vào nút màu xanh lam bên cạnh dòng Array2

8. Hãy chọn dữ liệu cho array2- cột Thiếu lòng tự trọng và nhấn lại nút màu xanh lam, sau đó OK

9. Ở đây, hệ số tương quan r-Pearson được tính toán và ghi vào ô đã chọn. Trong trường hợp của chúng tôi, hệ số tương quan là dương và xấp xỉ bằng 0,225 . Điều này nói về tích cực vừa phải mối liên hệ giữa tính hiếu chiến và sự thiếu tự tin ở học sinh lớp một

Bằng cách này, suy luận thống kê thử nghiệm sẽ là: r = 0,225, một mối quan hệ tích cực vừa phải giữa các biến đã được tiết lộ tính hiếu chiếnthiếu lòng tự trọng.

Trong một số nghiên cứu, yêu cầu chỉ ra mức ý nghĩa p của hệ số tương quan, nhưng Excel, không giống như SPSS, không cung cấp cơ hội như vậy. Không sao đâu, có (A.D. Nasledov).

Bạn cũng có thể đính kèm nó vào kết quả của nghiên cứu.

Hệ số tương quan (hoặc hệ số tuyến tính tương quan) được ký hiệu là "r" (trong trường hợp hiếm hoi là "ρ") và đặc trưng cho mối tương quan tuyến tính (nghĩa là mối quan hệ được cho bởi một số giá trị và hướng) của hai hoặc nhiều biến. Giá trị của hệ số nằm giữa -1 và +1, có nghĩa là, mối tương quan có thể là cả tích cực và tiêu cực. Nếu hệ số tương quan là -1, có một mối tương quan âm hoàn hảo; nếu hệ số tương quan là +1, thì có một mối tương quan thuận hoàn toàn. Trong các trường hợp khác, có mối tương quan thuận, tương quan nghịch hoặc không có mối tương quan giữa hai biến. Hệ số tương quan có thể được tính theo cách thủ công, bằng máy tính trực tuyến miễn phí hoặc bằng máy tính vẽ đồ thị tốt.

Các bước

Tính toán hệ số tương quan theo cách thủ công

    Thu thập dữ liệu. Trước khi bạn bắt đầu tính toán hệ số tương quan, hãy kiểm tra cặp số đã cho. Tốt hơn là viết chúng ra một bảng có thể được sắp xếp theo chiều dọc hoặc chiều ngang. Gắn nhãn mỗi hàng hoặc cột là "x" và "y".

    • Ví dụ, cho trước bốn cặp giá trị (số) của các biến "x" và "y". Bạn có thể tạo bảng sau:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Tính trung bình cộng "x".Để thực hiện việc này, hãy cộng tất cả các giá trị \ u200b \ u200bof “x”, sau đó chia kết quả cho số giá trị.

    • Trong ví dụ của chúng tôi, chúng tôi được cung cấp bốn giá trị cho biến "x". Để tính giá trị trung bình cộng "x", hãy cộng các giá trị này, rồi chia tổng cho 4. Các phép tính sẽ được viết như sau:
    • μ x = (1 + 2 + 4 + 5) / 4 (\ displaystyle \ mu _ (x) = (1 + 2 + 4 + 5) / 4)
    • μ x = 12/4 (\ displaystyle \ mu _ (x) = 12/4)
    • μ x = 3 (\ displaystyle \ mu _ (x) = 3)
  2. Tìm trung bình cộng "y".Để thực hiện việc này, hãy làm theo các bước tương tự, nghĩa là cộng tất cả các giá trị \ u200b \ u200bof “y”, rồi chia tổng cho số giá trị.

    • Trong ví dụ của chúng tôi, chúng tôi được cung cấp bốn giá trị cho biến "y". Cộng các giá trị này, rồi chia tổng cho 4. Các phép tính sẽ được viết như sau:
    • μ y = (1 + 3 + 5 + 7) / 4 (\ displaystyle \ mu _ (y) = (1 + 3 + 5 + 7) / 4)
    • μ y = 16/4 (\ displaystyle \ mu _ (y) = 16/4)
    • μ y = 4 (\ displaystyle \ mu _ (y) = 4)
  3. Tính độ lệch chuẩn của "x". Sau khi tính giá trị trung bình của "x" và "y", hãy tìm độ lệch chuẩn các biến này. Độ lệch chuẩn được tính theo công thức sau:

    • σ x = 1 n - 1 Σ (x - μ x) 2 (\ displaystyle \ sigma _ (x) = (\ sqrt ((\ frac (1) (n-1)) \ Sigma (x- \ mu _ ( x)) ^ (2))))
    • σ x = 1 4 - 1 ∗ ((1 - 3) 2 + (2 - 3) 2 + (4 - 3) 2 + (5 - 3) 2) (\ displaystyle \ sigma _ (x) = (\ sqrt ((\ frac (1) (4-1)) * ((1-3) ^ (2) + (2-3) ^ (2) + (4-3) ^ (2) + (5-3) ^ (2))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\ displaystyle \ sigma _ (x) = (\ sqrt ((\ frac (1) (3)) * (4 + 1 + 1 + 4)) ))
    • σ x = 1 3 ∗ (10) (\ displaystyle \ sigma _ (x) = (\ sqrt ((\ frac (1) (3)) * (10))))
    • σ x = 10 3 (\ displaystyle \ sigma _ (x) = (\ sqrt (\ frac (10) (3))))
    • σ x = 1, 83 (\ displaystyle \ sigma _ (x) = 1,83)
  4. Tính độ lệch chuẩn "y". Làm theo các bước ở bước trước. Sử dụng cùng một công thức, nhưng thay thế các giá trị "y" vào nó.

    • Trong ví dụ của chúng tôi, các phép tính sẽ được viết như sau:
    • σ y = 1 4 - 1 ∗ ((1 - 4) 2 + (3 - 4) 2 + (5 - 4) 2 + (7 - 4) 2) (\ displaystyle \ sigma _ (y) = (\ sqrt ((\ frac (1) (4-1)) * ((1-4) ^ (2) + (3-4) ^ (2) + (5-4) ^ (2) + (7-4) ^ (2))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\ displaystyle \ sigma _ (y) = (\ sqrt ((\ frac (1) (3)) * (9 + 1 + 1 + 9)) ))
    • σ y = 1 3 ∗ (20) (\ displaystyle \ sigma _ (y) = (\ sqrt ((\ frac (1) (3)) * (20))))
    • σ y = 20 3 (\ displaystyle \ sigma _ (y) = (\ sqrt (\ frac (20) (3))))
    • σ y = 2, 58 (\ displaystyle \ sigma _ (y) = 2,58)
  5. Viết công thức cơ bản để tính hệ số tương quan. Công thức này bao gồm giá trị trung bình, độ lệch chuẩn và số lượng (n) cặp số của cả hai biến. Hệ số tương quan được ký hiệu là "r" (trong trường hợp hiếm hoi, là "ρ"). Bài viết này sử dụng công thức để tính hệ số tương quan Pearson.

    • Ở đây và trong các nguồn khác, đại lượng có thể được biểu thị theo nhiều cách khác nhau. Ví dụ, một số công thức có "ρ" và "σ", trong khi những công thức khác có "r" và "s". Một số sách giáo khoa đưa ra các công thức khác, nhưng chúng toán học tương tự công thức trên.
  6. Bạn đã tính toán trung bình và độ lệch chuẩn của cả hai biến, vì vậy bạn có thể sử dụng công thức để tính hệ số tương quan. Nhớ lại rằng "n" là số cặp giá trị của cả hai biến. Giá trị của các đại lượng khác đã được tính toán trước đó.

    • Trong ví dụ của chúng tôi, các phép tính sẽ được viết như sau:
    • ρ = (1 n - 1) Σ (x - μ x σ x) ∗ (y - μ y σ y) (\ displaystyle \ rho = \ left ((\ frac (1) (n-1)) \ right) \ Sigma \ left ((\ frac (x- \ mu _ (x)) (\ sigma _ (x))) \ right) * \ left ((\ frac (y- \ mu _ (y)) (\ sigma _ (y))) \ đúng))
    • ρ = (1 3) ∗ (\ displaystyle \ rho = \ left ((\ frac (1) (3)) \ right) *)[ (1 - 3 1, 83) ∗ (1 - 4 2, 58) + (2 - 3 1, 83) ∗ (3 - 4 2, 58) (\ displaystyle \ left ((\ frac (1-3) ( 1.83)) \ right) * \ left ((\ frac (1-4) (2.58)) \ right) + \ left ((\ frac (2-3) (1.83)) \ right) * \ left ((\ frac (3-4) (2,58)) \ right))
      + (4 - 3 1, 83) ∗ (5 - 4 2, 58) + (5 - 3 1, 83) ∗ (7 - 4 2, 58) (\ displaystyle + \ left ((\ frac (4-3 ) (1.83)) \ phải) * \ left ((\ frac (5-4) (2.58)) \ right) + \ left ((\ frac (5-3) (1.83)) \ right) * \ left ( (\ frac (7-4) (2,58)) \ phải))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4, 721) (\ displaystyle \ rho = \ left ((\ frac (1) (3)) \ right) * \ left ((\ frac (6 + 1 + 1 + 6) (4,721)) \ phải))
    • ρ = (1 3) ∗ 2, 965 (\ displaystyle \ rho = \ left ((\ frac (1) (3)) \ right) * 2.965)
    • ρ = (2, 965 3) (\ displaystyle \ rho = \ left ((\ frac (2,965) (3)) \ right))
    • ρ = 0. 988 (\ displaystyle \ rho = 0.988)
  7. Phân tích kết quả. Trong ví dụ của chúng tôi, hệ số tương quan là 0,988. Giá trị này theo một cách nào đó đặc trưng cho một tập hợp các cặp số nhất định. Chú ý đến dấu và độ lớn của giá trị.

    • Vì giá trị của hệ số tương quan là dương nên có mối tương quan thuận giữa các biến "x" và "y". Tức là khi giá trị của "x" tăng lên thì giá trị của "y" cũng tăng theo.
    • Vì giá trị của hệ số tương quan rất gần với +1, nên giá trị của các biến x và y có tương quan cao. Nếu bạn đặt dấu chấm trên mặt phẳng tọa độ, chúng sẽ nằm gần với một đường thẳng nào đó.

    Sử dụng Máy tính Trực tuyến để Tính Hệ số Tương quan

    1. Tìm một máy tính trên Internet để tính hệ số tương quan. Hệ số này thường được tính toán trong thống kê. Nếu có nhiều cặp số, thực tế không thể tính hệ số tương quan theo cách thủ công. Do đó, có các máy tính trực tuyến để tính hệ số tương quan. Trong công cụ tìm kiếm, hãy nhập "máy tính hệ số tương quan" (không có dấu ngoặc kép).

    2. Nhập dữ liệu.Đọc hướng dẫn trên trang web để nhập dữ liệu chính xác (các cặp số). Việc nhập các cặp số thích hợp là cực kỳ quan trọng; nếu không bạn sẽ nhận được kết quả sai. Hãy nhớ rằng các trang web khác nhau có các định dạng nhập dữ liệu khác nhau.

      • Ví dụ: trên trang web http://ncalculators.com/stosystem/correlation-coeosystem-calculator.htm, giá trị của các biến "x" và "y" được nhập vào hai dòng ngang. Các giá trị được phân tách bằng dấu phẩy. Nghĩa là, trong ví dụ của chúng tôi, các giá trị của "x" được nhập như sau: 1,2,4,5 và các giá trị của "y" như thế này: 1,3,5,7.
      • Trên một trang web khác, http://www.alcula.com/calculators/stosystem/correlation-coeosystem/, dữ liệu được nhập theo chiều dọc; trong trường hợp này, đừng nhầm lẫn giữa các cặp số tương ứng.
    3. Tính hệ số tương quan. Sau khi nhập dữ liệu, bạn chỉ cần bấm vào nút "Tính toán", "Tính toán" hoặc tương tự để nhận kết quả.

      Sử dụng Máy tính Vẽ đồ thị

      1. Nhập dữ liệu. Lấy một máy tính vẽ đồ thị, chuyển sang chế độ tính toán thống kê và chọn lệnh Chỉnh sửa.

        • Trên các máy tính khác nhau, bạn cần nhấn các phím khác nhau. Bài viết này tập trung vào máy tính TI-86 của Texas Instruments.
        • Để chuyển sang chế độ tính toán thống kê, nhấn - Stat (phía trên phím "+"). Sau đó nhấn F2 - Chỉnh sửa (Edit).
      2. Xóa dữ liệu đã lưu trước đó. Hầu hết các máy tính sẽ giữ lại số liệu thống kê đã nhập của bạn cho đến khi bạn xóa chúng. Để tránh nhầm lẫn dữ liệu cũ với dữ liệu mới, trước tiên hãy xóa mọi thông tin được lưu trữ.

        • Sử dụng các phím mũi tên để di chuyển con trỏ và đánh dấu tiêu đề "xStat". Sau đó nhấn Clear và Enter để xóa tất cả các giá trị đã nhập vào cột xStat.
        • Sử dụng các phím mũi tên để đánh dấu tiêu đề "yStat". Sau đó nhấn Clear và Enter để xóa tất cả các giá trị đã nhập trong cột yStat.
      3. Nhập dữ liệu ban đầu. Sử dụng các phím mũi tên để di chuyển con trỏ đến ô đầu tiên dưới tiêu đề "xStat". Nhập giá trị đầu tiên và nhấn Enter. Ở cuối màn hình, "xStat (1) = __" sẽ được hiển thị, với giá trị đã nhập thay vì dấu cách. Sau khi bạn nhấn Enter, giá trị đã nhập sẽ xuất hiện trong bảng và con trỏ sẽ di chuyển đến dòng tiếp theo; điều này sẽ hiển thị "xStat (2) = __" ở cuối màn hình.

        • Nhập tất cả các giá trị của biến "x".
        • Khi bạn đã nhập tất cả các giá trị cho biến x, hãy sử dụng các phím mũi tên để điều hướng đến cột yStat và nhập các giá trị cho biến y.
        • Sau khi nhập tất cả các cặp số, nhấn Thoát để xóa màn hình và thoát khỏi chế độ tổng hợp.
      4. Tính hệ số tương quan. Nó đặc trưng cho mức độ gần của dữ liệu với một số đường thẳng. Máy tính đồ thị có thể nhanh chóng xác định đường thẳng thích hợp và tính toán hệ số tương quan.

        • Nhấp vào Stat (Thống kê) - Calc (Tính toán). Trên TI-86, nhấn - -.
        • Chọn chức năng "Hồi quy tuyến tính" ( Hồi quy tuyến tính). Trên TI-86, nhấn, được gắn nhãn "LinR". Dòng “LinR _” sẽ được hiển thị trên màn hình với con trỏ nhấp nháy.
        • Bây giờ nhập tên của hai biến: xStat và yStat.
          • Trên TI-86, mở danh sách tên; để thực hiện việc này, nhấn - -.
          • Các biến có sẵn được hiển thị ở dòng dưới cùng của màn hình. Chọn (rất có thể bằng cách nhấn F1 hoặc F2), nhập dấu phẩy, sau đó chọn.
          • Nhấn Enter để xử lý dữ liệu đã nhập.
      5. Phân tích kết quả. Bằng cách nhấn Enter, thông tin sau sẽ được hiển thị trên màn hình:

        • y = a + b x (\ displaystyle y = a + bx): là một hàm mô tả một đường thẳng. Lưu ý rằng hàm không được viết ở dạng chuẩn (y = kx + b).
        • a = (\ displaystyle a =). Đây là tọa độ y của điểm mà đường thẳng giao với trục y.
        • b = (\ displaystyle b =). nó dốc dài.
        • corr = (\ displaystyle (\ text (corr)) =). Đây là hệ số tương quan.
        • n = (\ displaystyle n =). Đây là số cặp số đã được sử dụng trong các phép tính.

Trong đó x y, x, y là giá trị trung bình của các mẫu; σ (x), σ (y) - độ lệch chuẩn.
Ngoài ra, hệ số tương quan cặp tuyến tính có thể được xác định thông qua hệ số hồi quy b: a + bx.

Các tùy chọn công thức khác:
hoặc

K xy - mô men tương quan (hệ số hiệp phương sai)

Hệ số tương quan tuyến tính nhận các giá trị từ -1 đến +1 (xem thang đo Chaddock). Ví dụ, khi phân tích độ chặt chẽ của mối tương quan tuyến tính giữa hai biến, một hệ số tương quan tuyến tính của cặp bằng –1 đã thu được. Điều này có nghĩa là có một mối quan hệ tuyến tính nghịch đảo chính xác giữa các biến.

Ý nghĩa hình học của hệ số tương quan: r xy cho biết hệ số góc của hai đường hồi quy: y (x) và x (y) khác nhau bao nhiêu thì kết quả tối thiểu hoá độ lệch theo x và theo y khác nhau bấy nhiêu. Góc giữa các đường càng lớn thì r xy càng lớn.
Dấu của hệ số tương quan trùng với dấu của hệ số hồi quy và xác định độ dốc của đường hồi quy, tức là định hướng chung sự phụ thuộc (tăng hoặc giảm). Giá trị tuyệt đối của hệ số tương quan được xác định bởi mức độ gần nhau của các điểm đối với đường hồi quy.

Tính chất của hệ số tương quan

  1. | r xy | ≤ 1;
  2. nếu X và Y độc lập thì r xy = 0, điều ngược lại không phải lúc nào cũng đúng;
  3. nếu | r xy | = 1, thì Y = aX + b, | r xy (X, aX + b) | = 1, trong đó a và b là hằng số và ≠ 0;
  4. | r xy (X, Y) | = | r xy (a 1 X + b 1, a 2 X + b 2) |, trong đó a 1, a 2, b 1, b 2 là các hằng số.

Hướng dẫn. Chỉ định số lượng dữ liệu nguồn. Giải pháp kết quả được lưu trong tệp Word (xem Ví dụ về tìm phương trình hồi quy). Mẫu giải pháp cũng được tạo tự động trong Excel. .

Số dòng (dữ liệu ban đầu)
Giá trị cuối cùng của các đại lượng đã cho (∑x, ∑x 2, ∑xy, ∑y, ∑y 2)