Підрахунок кореляції в екселі. Як розрахувати кореляцію в Microsoft Excel

Кореляційний аналіз – популярний метод статистичного дослідженнящо використовується для виявлення ступеня залежності одного показника від іншого. У Microsoft Excelє спеціальний інструмент, призначений до виконання цього аналізу. Давайте з'ясуємо, як користуватися цією функцією.

Суть кореляційного аналізу

Призначення кореляційного аналізузводиться до виявлення наявності залежності між різними факторами. Тобто визначається, чи впливає зменшення або збільшення одного показника на зміну іншого.

Якщо залежність встановлена, визначається коефіцієнт кореляції. На відміну від регресійного аналізу, це єдиний показник, який розраховує даний методстатистичного дослідження. Коефіцієнт кореляції варіюється в діапазоні від +1 до -1. За наявності позитивної кореляції збільшення одного показника сприяє збільшенню другого. При негативної кореляції збільшення одного показника спричиняє зменшення іншого. Чим більший модуль коефіцієнта кореляції, тим помітніша зміна одного показника відбивається на зміні другого. При коефіцієнті 0 залежність між ними відсутня повністю.

Розрахунок коефіцієнта кореляції

Тепер давайте спробуємо порахувати коефіцієнт кореляції на конкретному прикладі. Маємо таблицю, у якій помісячно розписано окремих колонках витрата рекламу і величина продажів. Нам належить з'ясувати рівень залежності кількості продажів від суми коштів, яка була витрачена на рекламу.

Спосіб 1: визначення кореляції через Майстер функцій

Одним із способів, за допомогою якого можна провести кореляційний аналіз, є використання функції Корел. Сама функція має загальний виглядКорел (масив1; масив2).

Виділяємо комірку, в якій має виводитися результат розрахунку. Клацаємо по кнопці «Вставити функцію», яка розміщується ліворуч від рядка формул.
У списку, який представлений у вікні Майстра функцій, шукаємо та виділяємо функцію КОРРЕЛ. Тиснемо на кнопку «OK».
Відкриється вікно аргументів функції. У полі «Масив1» вводимо координати діапазону осередків одного із значень, залежність якого слід визначити. У нашому випадку це будуть значення у колонці «Величина продажу». Для того, щоб внести адресу масиву в поле, просто виділяємо всі осередки з даними у вказаному вище стовпці.
У полі Масив2 потрібно внести координати другого стовпця. У нас це витрати на рекламу. Так само, як і в попередньому випадку, заносимо дані в поле.

Тиснемо на кнопку «OK».

Як бачимо, коефіцієнт кореляції у вигляді числа з'являється в заздалегідь вибраному комірці. У даному випадкувін дорівнює 0,97, що є дуже високою ознакоюзалежності однієї величини від іншої.

Спосіб 2: обчислення кореляції за допомогою пакета аналізу

Крім того, кореляцію можна обчислити за допомогою одного з інструментів, представленого в пакеті аналізу. Але насамперед нам потрібно цей інструмент активувати.

Переходимо у вкладку "Файл".
У вікні переміщуємося в розділ «Параметри».
Далі переходимо до пункту «Надбудови».
У нижній частині наступного вікна в розділі «Керування» переставляємо перемикач у позицію «Надбудови Excel», якщо він знаходиться в іншому положенні. Тиснемо на кнопку «OK».
У вікні надбудов встановлюємо галочку біля пункту «Пакет аналізу». Тиснемо на кнопку «OK».
Після цього пакет аналізу активовано. Переходимо у вкладку «Дані». Як бачимо, тут на стрічці з'являється новий блок інструментів – «Аналіз». Тиснемо на кнопку «Аналіз даних», яка розташована в ньому.
Відкривається список з різними варіантамианалізу даних. Вибираємо пункт "Кореляція". Клацаємо по кнопці «OK».
Відкривається вікно із параметрами кореляційного аналізу. На відміну від попереднього способу, у полі "Вхідний інтервал" ми вводимо інтервал не кожного стовпця окремо, а всіх стовпців, які беруть участь у аналізі. У нашому випадку це дані у стовпцях «Витрати на рекламу» та «Величина продажу».
Параметр «Групування» залишаємо без змін – «Стовпцями», тому що у нас групи даних розбиті саме на два стовпці. Якби вони були розбиті рядково, тоді слід було б переставити перемикач у позицію «По рядках».

У параметрах виводу за замовчуванням встановлено пункт «Новий робочий лист», тобто дані виводитимуться на іншому аркуші. Можна змінити місце, переставивши перемикач. Це може бути поточний лист (тоді ви повинні вказати координати осередків виведення інформації) або нова робоча книга (файл).

Коли всі налаштування встановлені, натискаємо на кнопку «OK».

Оскільки місце виведення результатів аналізу залишили за замовчуванням, ми переміщуємося на новий лист. Як бачимо, тут вказано коефіцієнт кореляції. Звичайно, він той самий, що і при використанні першого методу - 0,97. Це тим, що обидва варіанти виконують одні й самі обчислення, просто зробити їх можна різними способами.

Як бачимо, програма Ексель пропонує відразу два способи кореляційного аналізу. Результат обчислень, якщо ви все зробите правильно, буде цілком ідентичним. Але, кожен користувач може вибрати зручніший для нього варіант здійснення розрахунку.

Ми раді, що змогли допомогти Вам у вирішенні проблеми.

Задайте своє питання у коментарях, детально розписавши суть проблеми. Наші фахівці намагатимуться відповісти максимально швидко.

Чи допомогла вам ця стаття?

Регресійний та кореляційний аналіз – статистичні методидослідження. Це найпоширеніші способи показати залежність будь-якого параметра від однієї чи кількох незалежних змінних.

Нижче на конкретних практичні прикладирозглянемо ці два дуже популярні серед економістів аналізу. А також наведемо приклад отримання результатів при їх об'єднанні.

Регресійний аналіз у Excel

Показує вплив одних значень (самостійних, незалежних) на залежну змінну. Наприклад, як залежить кількість економічно активного населення кількості підприємств, величини зарплати та інших. властивостей. Або як впливають іноземні інвестиції, ціни на енергоресурси та ін на рівень ВВП.

Результат аналізу дає змогу виділяти пріоритети. І ґрунтуючись на головних факторах, прогнозувати, планувати розвиток пріоритетних напрямків, ухвалювати управлінські рішення.

Регресія буває:

лінійної (у = а + bx);
параболічній (y = a + bx + cx2);
експоненційною (y = a * exp (bx));
статечної (y = a * x ^ b);
гіперболічної (y = b/x + a);
логарифмічної (y = b * 1n(x) + a);
показовою (y = a * b^x).

Розглянемо з прикладу побудова регресійної моделів Excel та інтерпретацію результатів. Візьмемо лінійний типрегресії.

Завдання. На 6 підприємствах було проаналізовано середньомісячну заробітня платаі кількість співробітників, що звільнилися. Необхідно визначити залежність кількості співробітників, що звільнилися, від середньої зарплати.

Модель лінійної регресії має такий вигляд:

У = а0 + а1х1 + ... + Акхк.

Де а – коефіцієнти регресії, х – що впливають змінні, до – число чинників.

У нашому прикладі як У виступає показник працівників, що звільнилися. фактор, що впливає - заробітна плата (х).

У Excel існують інтегровані функції, з допомогою яких можна розрахувати параметри моделі лінійної регресії. Але найшвидше це зробить надбудова «Пакет аналізу».

Активуємо потужний аналітичний інструмент:

Натискаємо кнопку «Офіс» та переходимо на вкладку «Параметри Excel». "Надбудови".
Внизу, під випадаючим списком, у полі «Управління» буде напис «Надбудови Excel» (якщо його немає, натисніть прапорець праворуч і виберіть). І кнопка "Перейти". Тиснемо.
Відкривається список доступних надбудов. Вибираємо «Пакет аналізу» та натискаємо ОК.

Після активації надбудова буде доступна на вкладці "Дані".

Тепер візьмемося безпосередньо регресійним аналізом.

Відкриваємо меню інструмента «Аналіз даних». Вибираємо "Регресія".
Відкриється меню для вибору вхідних значень та параметрів виводу (де відобразити результат). У полях для вихідних даних вказуємо діапазон описуваного параметра (У) і фактора (Х), що впливає на нього. Решту можна не заповнювати.
Після натискання ОК програма відобразить розрахунки на новому аркуші (можна вибрати інтервал для відображення на поточному аркуші або призначити виведення в нову книгу).

Насамперед звертаємо увагу на R-квадрат та коефіцієнти.

R-квадрат – коефіцієнт детермінації. У прикладі – 0,755, чи 75,5%. Це означає, що розрахункові параметри моделі на 75,5% пояснюють залежність між параметрами, що вивчаються. Що коефіцієнт детермінації, то якісніша модель. Добре – понад 0,8. Погано – менше 0,5 (такий аналіз навряд можна вважати резонним). У нашому прикладі - "непогано".

Коефіцієнт 64,1428 показує, яким буде Y, якщо всі змінні в моделі, що розглядається, будуть рівні 0. Тобто на значення аналізованого параметра впливають і інші фактори, не описані в моделі.

p align="justify"> Коефіцієнт -0,16285 показує вагомість змінної Х на Y. Тобто середньомісячна заробітна плата в межах даної моделі впливає на кількість звільнених з вагою -0,16285 (це невеликий ступінь впливу). Знак «-» вказує на негативний вплив: чим більше зарплата, тим менше звільнених. Що слушно.

Кореляційний аналіз у Excel

Кореляційний аналіз допомагає встановити, чи між показниками в одній або двох вибірках є зв'язок. Наприклад, між часом роботи верстата та вартістю ремонту, ціною техніки та тривалістю експлуатації, зростанням та вагою дітей тощо.

Якщо зв'язок є, то чи тягне збільшення одного параметра підвищення (позитивна кореляція) чи зменшення (негативна) іншого. Кореляційний аналіз допомагає аналітику визначитися, чи можна за величиною одного показника передбачити можливе значення іншого.

Коефіцієнт кореляції позначається r. Варіюється в межах від +1 до -1. Класифікація кореляційних зв'язків для різних сфер відрізнятиметься. При значенні коефіцієнта 0 лінійної залежностіміж вибірками немає.

Розглянемо як за допомогою засобів Excelвизначити коефіцієнт кореляції.

Для знаходження парних коефіцієнтів застосовується функція Корел.

Завдання: Визначити, чи є взаємозв'язок між часом роботи токарного верстата та вартістю його обслуговування.

Ставимо курсор у будь-яку комірку і натискаємо кнопку fx.

У категорії «Статистичні» вибираємо функцію КОРРЕЛ.
Аргумент "Масив 1" - перший діапазон значень - час роботи верстата: А2: А14.
Аргумент "Масив 2" - другий діапазон значень - вартість ремонту: В2: В14. Тиснемо ОК.

Щоб визначити тип зв'язку, потрібно переглянути абсолютне числокоефіцієнта (кожної сфери діяльності є своя шкала).

Для кореляційного аналізу кількох параметрів (більше 2) зручніше застосовувати "Аналіз даних" (надбудова "Пакет аналізу"). У списку потрібно вибрати кореляцію та позначити масив. Всі.

Отримані коефіцієнти відобразяться у кореляційній матриці. На кшталт такий:

Кореляційно-регресійний аналіз

Насправді ці дві методики часто застосовуються разом.

Будуємо кореляційне поле: "Вставка" - "Діаграма" - "Точкова діаграма" (дає порівнювати пари). Діапазон значень – усі числові дані таблиці.
Клацаємо лівою кнопкою миші по будь-якій точці на діаграмі. Потім правою. У меню вибираємо «Додати лінію тренда».
Призначаємо параметри лінії. Тип - "Лінійна". Внизу – "Показати рівняння на діаграмі".
Тиснемо «Закрити».

Тепер стали помітні й дані регресійного аналізу.

1.Відкрити програму Excel

2.Створити стовпці з даними. У прикладі ми вважатимемо взаємозв'язок, чи кореляцію, між агресивністю і невпевненістю у собі в дітей-першокласників. В експерименті брали участь 30 дітей, дані представлені в таблиці ексель:

1 стовпчик - № випробуваного

2 стовпчик - агресивність у балах

3 стовпчик - невпевненість у собі в балах

3. Потім необхідно вибрати порожню комірку поряд з таблицею і натиснути на значок f(x)у панелі Excel

4. Відкриється меню функцій, серед категорій необхідно вибрати Статистичні, а потім серед списку функцій за абеткою знайти Корелта натиснути ОК

5. Потім відкриється меню аргументів функції, яке дозволить вибрати потрібні нам стовпчики з даними. Для вибору першого стовпчика Агресивністьпотрібно натиснути на синю кнопочку біля рядка Масив1

6. Виберемо дані для Масиву1зі стовпчика Агресивністьі натиснемо на синю кнопку в діалоговому вікні

7. Потім аналогічно Масиву 1 натиснемо на синю кнопочку біля рядка Масив2

8. Виберемо дані для Масиву2- стовпчик Невпевненість в собіі знову натиснемо синю кнопку, потім ОК

9.От, коефіцієнт кореляції r-Пірсона порахований і записаний у вибраній комірці. У нашому випадку він позитивний і приблизно дорівнює. Це говорить про помірною позитивноюзв'язки між агресивністю та невпевненістю у собі у дітей-першокласників

Таким чином, статистичним висновкомексперименту буде: r = 0,225, виявлено помірний позитивний взаємозв'язок між змінними агресивністьі невпевненість в собі.

У деяких дослідженнях потрібно вказувати рівень значущості коефіцієнта кореляції, однак програма Excel, на відміну від SPSS, не надає такої можливості. Нічого страшного, є таблиці критичних значень кореляцій (А.Д. Спадкоємців).

Також Ви можете побудувати в ексель лінію регресії та докласти її до результатів дослідження.

Коефіцієнт кореляції відбиває ступінь взаємозв'язку між двома показниками. Завжди набуває значення від -1 до 1. Якщо коефіцієнт розташувався близько 0, то говорять про відсутність зв'язку між змінними.

Якщо значення близько до одиниці (від 0,9, наприклад), між спостерігаються об'єктами існує сильна пряма взаємозв'язок. Якщо коефіцієнт близький до іншої крайній точцідіапазону (-1), то між змінними є сильний зворотний зв'язок. Коли значення знаходиться десь посередині від 0 до 1 або від 0 до -1, то мова йдепро слабкого зв'язку(Прямої або зворотної). Такий взаємозв'язок зазвичай не враховують: вважається, що його немає.

Розрахунок коефіцієнта кореляції в Excel

Розглянемо з прикладу способи розрахунку коефіцієнта кореляції, особливості прямої та зворотної взаємозв'язку між змінними.

Значення показників x та y:

Y – незалежна змінна, x – залежна. Необхідно знайти силу (сильна/слабка) та напрямок (прямий/зворотний) зв'язок між ними. Формула коефіцієнта кореляції виглядає так:

Щоб спростити її розуміння, розіб'ємо кілька нескладних елементів.

Між змінними визначається сильний прямий зв'язок.

Вбудована функція Корел дозволяє уникнути складних розрахунків. Розрахуємо коефіцієнт парної кореляції Excel з її допомогою. Викликаємо майстер функцій. Знаходимо необхідну. Аргументи функції – масив значень y та масив значень х:

Покажемо значення змінних на графіку:

Видно сильний зв'язок між y та х, т.к. лінії йдуть практично паралельно одна одній. Взаємозв'язок прямий: росте y – росте х, зменшується y – зменшується х.

Матриця парних коефіцієнтів кореляції в Excel

Кореляційна матриця є таблицею, на перетині рядків і стовпців якої знаходяться коефіцієнти кореляції між відповідними значеннями. Має сенс її будувати для кількох змінних.

Матриця коефіцієнтів кореляції в Excel будується за допомогою інструмента Кореляція з пакета Аналіз даних.

Між значеннями y та х1 виявлено сильний прямий взаємозв'язок. Між х1 та х2 є сильна Зворотній зв'язок. Зв'язок із значеннями в стовпці х3 практично відсутній.

1.Відкрити програму Excel

1 стовпчик - № випробуваного

2 стовпчик агресивністьу балах

3 стовпчик невпевненість в собіу балах

3. Потім необхідно вибрати порожню комірку поряд з таблицею і натиснути на значок f(x)у панелі Excel

4. Відкриється меню функцій, серед категорій необхідно вибрати Статистичні , а потім серед списку функцій за абеткою знайти Корелта натиснути ОК

6. Виберемо дані для Масиву1зі стовпчика Агресивністьі натиснемо на синю кнопку в діалоговому вікні

7. Потім аналогічно Масиву 1 натиснемо на синю кнопочку біля рядка Масив2

8. Виберемо дані для Масиву2- Стовпчик Невпевненість в собіі знову натиснемо синю кнопку, потім ОК

9.От, коефіцієнт кореляції r-Пірсона порахований і записаний в обраному осередку. У нашому випадку він позитивний і приблизно дорівнює 0,225 . Це говорить про помірною позитивноюзв'язки між агресивністю та невпевненістю у собі у дітей-першокласників

У деяких дослідженнях потрібно вказувати рівень значущості коефіцієнта кореляції, проте програма Excel, на відміну від SPSS, не надає такої можливості. Нічого страшного, є (А.Д. Спадкоємців).

Також Ви можете додати її до результатів дослідження.

Коефіцієнт кореляції (або лінійний коефіцієнткореляції) позначається як «r» (у поодиноких випадках як «ρ») і характеризує лінійну кореляцію (тобто взаємозв'язок, що задається деяким значенням та напрямком) двох або більше змінних. Значення коефіцієнта лежить між -1 та +1, тобто кореляція буває як позитивною, так і негативною. Якщо коефіцієнт кореляції дорівнює -1, має місце ідеальна негативна кореляція; якщо коефіцієнт кореляції дорівнює +1, має місце ідеальна позитивна кореляція. В інших випадках між двома змінними спостерігається позитивна кореляція, негативна кореляція або відсутність кореляції. Коефіцієнт кореляції можна обчислити вручну за допомогою безкоштовних онлайн-калькуляторів або за допомогою гарного графічного калькулятора.

Кроки

Обчислення коефіцієнта кореляції вручну

Зберіть дані.Перед тим як розпочати обчислення коефіцієнта кореляції, вивчіть дані пари чисел. Краще записати їх у таблицю, яку можна розташувати вертикально чи горизонтально. Кожен рядок чи стовпець позначте як «х» і «у».

Наприклад, дано чотири пари значень (чисел) змінних «х» і «у». Можна створити таку таблицю:
- x || y
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7

Обчисліть середнє арифметичне «х».Для цього складіть всі значення "х", а потім отриманий результат поділіть на кількість значень.
- У прикладі дано чотири значення змінної «х». Щоб обчислити середнє арифметичне «х», складіть ці значення, а потім суму розділіть на 4. Обчислення запишуться так:
- μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
- μ x = 12/4 (\displaystyle \mu _(x)=12/4)
- μ x = 3 (\displaystyle \mu _(x)=3)
Знайдіть середнє арифметичне "у".Для цього виконайте аналогічні дії, тобто складіть всі значення у, а потім суму розділіть на кількість значень.
- У нашому прикладі наведено чотири значення змінної «у». Складіть ці значення, потім суму розділіть на 4. Обчислення запишуться так:
- μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
- μ y = 16/4 (\displaystyle \mu _(y)=16/4)
- μ y = 4 (\displaystyle \mu _(y)=4)
Обчисліть стандартне відхилення "х".Обчисливши середні значення «х» та «у», знайдіть стандартні відхиленняцих змінних. Стандартне відхилення обчислюється за такою формулою:
- σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac(1)(n-1)))\Sigma (x-\mu _( x))^(2))))
- σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2)))))
- σ x = 1 3 * (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
- σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
- σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
- x = 1 , 83 (\displaystyle \sigma _(x)=1,83)
Обчисліть стандартне відхилення "у".Виконайте дії, описані в попередньому кроці. Скористайтеся тією ж формулою, але підставте значення «у».
- У прикладі обчислення запишуться так:
- σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2)))))
- y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
- σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
- σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
- σ y = 2,58 (\displaystyle \sigma _(y)=2,58)
Запишіть основну формулу обчислення коефіцієнта кореляції.У цю формулу входять середні значення, стандартні відхилення та кількість (n) пар чисел обох змінних. Коефіцієнт кореляції позначається як «r» (у поодиноких випадках як «ρ»). У статті використовується формула для обчислення коефіцієнта кореляції Пірсона.
- Тут та інших джерелах величини можуть позначатися по-різному. Наприклад, у деяких формулах присутні «ρ» та «σ», а в інших «r» та «s». У деяких підручниках наводяться інші формули, але вони є математичними аналогаминаведеної вище формули.
Ви обчислили середні значення та стандартні відхилення обох змінних, тому можна скористатися формулою для обчислення коефіцієнта кореляції. Нагадаємо, що «n» – це кількість пар значень обох змінних. Значення інших величин було обчислено раніше.
- У прикладі обчислення запишуться так:
- ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y)))(\sigma _(y)))\right))
- ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\right)*\left((\frac (1-4)(2,58))\right)+\left((\frac (2-3)(1,83))\right) *\left((\frac (3-4)(2,58))\right))
  + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\right)*\left((\frac (5-4)(2,58))\right)+\left((\frac (5-3)(1,83))\ right)*\left((\frac (7-4)(2,58))\right))]
- ρ = (1 3) * (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4,721))\right))
- ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
- ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
- ρ = 0 , 988 (\displaystyle \rho =0,988)
Проаналізуйте отриманий результат.У прикладі коефіцієнт кореляції дорівнює 0,988. Це значення певним чином характеризує цей набір пар чисел. Зверніть увагу на знак та величину значення.
- Оскільки значення коефіцієнта кореляції позитивно, між змінними «х» і «у» має місце позитивна кореляція. Тобто зі збільшенням значення «х», значення «у» теж збільшується.
- Так як значення коефіцієнта кореляції дуже близько до +1, значення змінних "х" і "у" сильно взаємопов'язані. Якщо нанести крапки на координатну площину, вони розташуються близько до деякої прямої.
Використання онлайн-калькуляторів для обчислення коефіцієнта кореляції
1. В інтернеті знайдіть калькулятор для обчислення коефіцієнта кореляції.Цей коефіцієнт досить часто обчислюється у статистиці. Якщо пар чисел багато, визначити коефіцієнт кореляції вручну практично неможливо. Тому є онлайн-калькулятори для обчислення коефіцієнта кореляції. У пошуковій системі введіть «коефіцієнт кореляції калькулятор» (без лапок).
2. Введіть дані.Ознайомтеся з інструкціями на сайті, щоб правильно ввести дані (пари чисел). Вкрай важливо вводити відповідні пари чисел; в іншому випадку ви отримаєте неправильний результат. Пам'ятайте, що різні формати введення даних на різних веб-сайтах.
  - Наприклад, на сайті http://ncalculators.com/statistics/correlation-coefficient-calculator.htm значення змінних "х" і "у" вводяться у двох горизонтальних рядках. Значення поділяються комами. Тобто в прикладі значення «х» вводяться так: 1,2,4,5, а значення «у» так: 1,3,5,7.
  - На іншому сайті, http://www.alcula.com/calculators/statistics/correlation-coefficient/, дані вводяться по вертикалі; у цьому випадку не переплутайте відповідних кіл чисел.
3. Обчисліть коефіцієнт кореляції.Ввівши дані, просто натисніть на кнопку Calculate, Обчислити або аналогічну, щоб отримати результат.
  
  Використання графічного калькулятора
  1. Введіть дані.Візьміть графічний калькулятор, перейдіть у режим статистичних обчислень та виберіть команду «Edit» (Редагувати).
    - На різних калькуляторах потрібно натискати клавіші. У статті розглядається калькулятор Texas Instruments TI-86.
    - Щоб перейти в режим статистичних обчислень, натисніть Stat (над клавішею «+»). Потім натисніть F2 – Edit (Редагувати).
  2. Видаліть попередні збережені дані.У більшості калькуляторів введені статистичні дані зберігаються до тих пір, поки ви не зітре їх. Щоб не сплутати старі дані з новими, спершу видаліть будь-яку збережену інформацію.
    - За допомогою кнопок зі стрілками перемістіть курсор і виділіть заголовок «xStat». Потім натисніть Clear (Очистити) та Enter (Ввести), щоб видалити всі значення, введені в стовпець xStat.
    - За допомогою кнопок зі стрілками виділіть заголовок «yStat». Потім натисніть Clear (Очистити) та Enter (Ввести), щоб видалити всі значення, введені в стовпець у Stat.
  3. Введіть вихідні дані.За допомогою клавіш зі стрілками перемістіть курсор у першу комірку під заголовком xStat. Введіть перше значення та натисніть Enter. У нижній частині екрана з'явиться "xStat(1) = __", де замість пробілу буде стояти введене значення. Після натискання Enter введене значення з'явиться в таблиці, а курсор переміститься на наступний рядок; при цьому в нижній частині екрана відобразиться xStat(2) = __.
    - Введіть усі значення змінної "х".
    - Ввівши всі значення змінної «х», за допомогою клавіш зі стрілками перейдіть у стовпець yStat і введіть значення змінної «у».
    - Після введення всіх пар чисел натисніть Exit (Вийти), щоб очистити екран і вийти з статистичних обчислень.
  4. Обчисліть коефіцієнт кореляції.Він характеризує, наскільки близькі дані розташовані до деякої прямої. Графічний калькулятор може швидко визначити відповідну пряму та обчислити коефіцієнт кореляції.
    - Натисніть Stat (Статистика) – Calc (Обчислення). На TI-86 потрібно натиснути – – .
    - Виберіть функцію «Linear Regression» ( Лінійна регресія). На TI-86 натисніть , яка позначена як LinR. На екрані з'явиться рядок «LinR _» з миготливим курсором.
    - Тепер введіть імена двох змінних: xStat та yStat.
      - На TI-86 відкрийте перелік імен; для цього натисніть – – .
      - У нижньому рядку екрана з'являться доступні змінні. Виберіть (для цього, швидше за все, потрібно натиснути F1 або F2), введіть кому, а потім виберіть .
      - Натисніть клавішу Enter, щоб обробити введені дані.
  5. Проаналізуйте отримані результати.Натиснувши Enter, на екрані з'явиться така інформація:
    - y = a + b x (\displaystyle y = a + bx): це функція, яка описує пряму Зауважте, що функція записана не в стандартній формі (у = kх + b).
    - a = (\displaystyle a=). Це координата "у" точки перетину прямої з віссю Y.
    - b = (\displaystyle b=). Це кутовий коефіцієнтпрямий.
    - corr = (\displaystyle (\text(corr))=). Це коефіцієнт кореляції.
    - n = (\displaystyle n=). Це кількість пар чисел, яка була використана у обчисленнях.

Де x · y, x, y - середні значення вибірок; σ(x), σ(y) - середньоквадратичні відхилення.
Крім того, коефіцієнт лінійної парної кореляції може бути визначений через коефіцієнт регресії b: де σ(x)=S(x), σ(y)=S(y) - середньоквадратичні відхилення, b - коефіцієнт перед x в рівнянні регресії y= a+bx.

Інші варіанти формул:
або

До xy – кореляційний момент (коефіцієнт коваріації)

Лінійний коефіцієнт кореляції набуває значень від –1 до +1 (див. шкалу Чеддока). Наприклад, при аналізі тісноти лінійного кореляційного зв'язку між двома змінними отримано коефіцієнт парної лінійної кореляції, рівний -1. Це означає, що між змінними існує точна зворотна лінійна залежність.

Геометричний сенс коефіцієнта кореляції: r xy показує, наскільки різниться нахил двох ліній регресії: y(x) і х(у) , наскільки сильно розрізняються результати мінімізації відхилень x і y . Чим більший кут між лініями, тим більше r xy.
Знак коефіцієнта кореляції збігається зі знаком коефіцієнта регресії та визначає нахил лінії регресії, тобто. загальну спрямованістьзалежності (зростання чи спадання). Абсолютна величина коефіцієнта кореляції визначається мірою близькості точок до лінії регресії.

Властивості коефіцієнта кореляції

|r xy | ≤ 1;
якщо X і Y незалежні, то r xy = 0, зворотне який завжди правильно;
якщо |r xy |=1, Y=aX+b, |r xy (X,aX+b)|=1, де a і b постійні, а ≠ 0;
|r xy (X,Y)|=|r xy (a 1 X+b 1 , a 2 X+b 2)|, де a 1 , a 2 , b 1 , b 2 - постійні.

Інструкція. Вкажіть кількість вихідних даних. Отримане рішення зберігається у Word (див. Приклад знаходження рівняння регресії). Також автоматично створюється шаблон рішення в Excel. .