Математична статистика – Руденко В. М. – Лінійна кореляція
Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак ММ, а й виявлення зв’язку між змінними, оцінювання його Напряму та Інтенсивності. Порівнюючи різні види зв’язків, можна виділити три типи залежностей між змінними X і Y:
Функціональна залежність визначає значення змінної Y від X однозначно;
Кореляційна залежність визначає середнє значення змінної Y від X;
Стохастична залежність визначає розподіл змінної Y від X.
Отже, найбільш загальною вважається стохастична залежність. Кореляційна залежність є залежністю стохастичною, функціональна – розглядається як окремий випадок кореляційної залежності.
Сутність кореляції
Кореляція (від лат. correlatio – співвідношення) – це статистична залежність між випадковими величинами, що носить імовірнісний характер.
Кореляційні зв’язки можна вивчати на якісному рівні з діаграм розсіяння емпіричних значень змінних X і Y (рис. 2.51) і відповідним чином їх інтерпретувати. Так, наприклад, якщо підвищення рівня однієї змінною супроводжується підвищенням рівня іншої, то йдеться про Позитивну кореляцію або прямий зв’язок (рис. 2.51 а, б). Якщо ж зростання однієї змінної супроводжується зниженням значень іншої, то маємо справу з негативною кореляцією або зворотним зв’язком (рис. 2.51 г, г). Нульовою називається кореляція за відсутності зв’язку змінних (рис. 2.51 в). Проте нульова загальна кореляція може свідчити лише про відсутність Лінійної залежності, а не взагалі про відсутність будь якого Статистичного зв’язку.
Рис. 2.51. Діаграми розсіяння емпіричних значень змінних XІ У:
А) строга позитивна кореляція; б) сильна позитивна кореляція; в) нульова кореляція; г) помірна негативна кореляція; г) строга негативна кореляція; д) нелінійна кореляція
У психолого-педагогічних дослідженнях здебільшого спостерігаються зв’язки Нелінійні (див. рис. 2.51 д). Наприклад, зростання мотивації спочатку підвищує ефективність навчення, а потім наступає зниження продуктивності (ефект “перемотивації” – закон Иеркса-Додсона). Кількісна міра кореляційного зв’язку оцінюється за значеннями коефіцієнтами кореляції у межах від -1 до +1. Від’ємні значення коефіцієнтів указують на зворотний зв’язок, додатні – на прямий. Нульове значення може свідчити про відсутність зв’язку. Інтенсивність зв’язку (слабкий зв’язок – помірний – суттєвий – сильний) оцінюється за абсолютним значенням коефіцієнтів кореляції.
Методи розрахунку міри кореляційних зв’язків тісно пов’язані із вживаними вимірювальними шкалами (табл. 2.4) .
Таблиця 2.4
Коефіцієнти кореляції залежно від типів вимірювальних шкал
Шкали ознаки У | Шкали ознаки X | ||
Інтервальна (відношень) | Рангова | Номінальна | |
Інтервальна (відношень) | Коефіцієнт Пірсона гХУ ; Дихотомічний коефіцієнт кореляції <р ; Тетрахоричний коефіцієнт кореляції тШ | ||
Рангова | Коефіцієнт Спірмена г” (при умові, якщо для Х шкалу інтервалів або відношень перетворити в рангову шкалу) | Коефіцієнти кореляції Спірмена Т Кендалла; Коефіцієнт конкордації У | |
Номінальна | Точково-бісеріальний коефіцієнт кореляції Тр^; Бісеріальний коефіцієнт кореляції Гьії | Рангово-бісеріальний коефіцієнт кореляції | Коефіцієнт асоціації Ф; Коефіцієнт контингенції Юла 6; Коефіцієнти спряженості Чупрова К І Пірсона С |
Вивчення зв’язку між ознаками, які приймають випадкові значення, починається з оцінювання його лінійності.
Лінійна кореляція
Лінійний кореляційний зв’язок для емпіричних даних, виміряних за шкалою інтервалів або відношень, оцінюється за допомогою коефіцієнта кореляції Пірсона ГХу
Де Хі і у і – значення змінних X і У; х і у – середні X і У; п – обсяг вибірки.
8 Зазначені методи розрахунку з використанням комп’ютерної техніки можна знайти у підручнику [56].
Формула (2.22) може бути перетворена, якщо замінити значення змінних ХІ і У і нормованими значеннями 2Х і гУ, і виглядатиме так:
Приклад 2.7. Оцінити зв’язок між змінними X і У за емпіричними даними таблиці рис. 2.52 двома способами з використанням формул (2.22) і (2.23). Спосіб 1.
Послідовність рішення:
O оцінити характер лінійності зв’язку між ознаками X і У за допомогою діаграми розсіяння (рис. 2.52);
Рис. 2.52. Діаграма розсіяння ознак
O переконатися, що кореляція лінійна, і продовжити розрахунки коефіцієнта кореляції Пірсона гХу (рис. 2.53 і 2.54);
O у комірках В16 і С16 розрахувати середні значення х і у
Х = і хІ = 112,00; У = 1 ул = 18,17;
O у комірках і в15 розрахувати суми квадратів різниць:
X (х, – X)2 = 386,00; £ (У, – у)2 = 311,67;
¡=1 ,=1
Рис. 2.53. Результати розрахунку коефіцієнта кореляції ГХу
O у комірці Н18 розрахувати суму добутків різниць:
X (ХІ – X) o (уІ – у) = 242,00;
¿=1
O у комірці В17 розрахувати коефіцієнт кореляції гХу за формулою:
Гху =■ 242,00 – 0,70. л/386,00 o 311,67
Рис. 2.54. Розрахункові формули Значення гХу ~ +0,70 свідчить про суттєвий прямий зв’язок між ознаками.
Спосіб 2.
Послідовність рішення:
O Результати розрахунку гХу за нормованими даними показано на рис. 2.55, розрахункові формули рис. 2.56.
Рис. 2.55. Результати розрахунку гХу за нормованими даними
O у комірках В16 і С16 розрахувати середні значення х і у;
O у комірках В17 і С17 розрахувати стандартні відхилення уХ і уУ;
Рис. 2.56. Формули розрахунку гХу за нормованими даними o у стовпчиках Б і Е розрахувати нормовані дані 2Х і 2У (зверніть увагу,
Що середнє нормованих даних дорівнює 0, а стандартне відхилення – 1,00);
O у комірці В18 розрахувати коефіцієнт кореляції RXy за формулою (2.23);
Висновки. Одне те саме значення rXy ~ +0,70 розраховано двома способами. Методи розрахунку за нормованими даними виглядають більш лаконічно. Значення парного Коефіцієнта кореляції Пірсона rXy можна також отримати за допомогою спеціальної функції MS Excel =ПИРСОН().