Статистика – Опря А. Т. – 5.3.2. Загальна, міжгрупова і внутрішньогрупова дисперсія
Знаючи математичні властивості дисперсії, можна спростити вирахування її величини. Розглянемо їх.
1. Якщо із усіх значень варіант відняти постійне число А, то величина дисперсії не зміниться
СТ( *,-А) = ^ .
Таким чином, середній квадрат відхилень можна обчислити не за величинами варіант, а за відхиленням їх від якогось постійного
Гг2 = гг2
Числа, тобто (‘o-Ау
2. Якщо значення варіант поділити на постійне число А, то величина дисперсії зменшиться в А2, а середнє квадратичне відхилення в А разів:
<у =ст2: А1.
(7)
Із цього випливає, що всі варіанти можна поділити на будь-яке постійне число, обчислити середнє квадратичне відхилення, а потім
А2 =оГ А2
Помножити його на це постійне число: ^А >
3. Якщо вирахувати середній квадрат відхилень від будь-якої величини (А), що відрізняється в тій чи інший мірі від середньої (Х), то величина його завжди буде більше середнього квадрата відхилень, обчисленого відносно середньої (оЛ 2).
Отримане перевищення дорівнює квадрату різниці між середньою і умовно узятою величиною, тобто 1 Х – А /2. Це все можна подати у такому запису:
А2А = а2 + (~х – А)2 Або а2А = а2 – (х – А)
Розглянута властивість середнього квадрата відхилень дозволяє зробити висновок про те, що дисперсія від середньої (Ст2 ) завжди
2
Менша за дисперсії, обчислені від будь-яких інших величин АД, тобто вона має властивість мінімальності.
4. Дисперсія постійної величини дорівнює нулю (“^’^ ~0). Ця властивість випливає з того, що дисперсія є показником розсіювання варіант навколо середньої арифметичної, а середня арифметична постійної величини дорівнює цій величині.
Ряд властивостей дисперсії грунтується на рівності ° = Х ~(Х) , Тобто дисперсія дорівнює різниці між середньою арифметичною квадратів варіант і квадратом середньої арифметичної.
5.3.2. Загальна, міжгрупова і внутрішньогрупова дисперсія
Якщо всі значення ознаки статистичної сукупності (генеральної або вибіркової) розділити на декілька груп і розглядати кожну з них як самостійну (окрему) сукупність, то виникає необхідність обчислення трьох видів дисперсій: загальної, міжгрупової і внутрішньогрупової.
Загальна дисперсія – це середній квадрат відхилень значень ознак всієї сукупності відносно загальної середньої.
Міжгрупова Дисперсія – це середній квадрат відхилень групових середніх відносно загальної середньої.
Внутрішньогрупова дисперсія – це середня арифметична часткових (групових) дисперсій, зважена обсягами груп.
У таблиці 27 наведена структурні формули обчислення названих видів дисперсій.
Таблиця 27
Формули для обчислення дисперсій
Приклад. За даними врожайності зернових культур 57 підприємств визначити загальну, міжгрупову і внутрішньогрупову дисперсії, утворивши сім груп підприємств за рівнем урожайності.
Для обчислення загальної дисперсії необхідно побудувати дискретний ряд розподілу (табл. 28).
За розрахунковими даними цього статистичного ряду визначаємо
Середню арифметичну ( Х)і величину загальної дисперсії ( За’-):
– Іхпг 1535.5 ” 2 І(хг – х)2Пі 1399.06 “”,
Х = — =-= 26.9; аШг =—- =-= 24.5.
І, пі 57 І, пі 57
Таблиця 28
Вихідні і розрахункові дані для обчислення загальної дисперсії __ (дискретний ряд)_
Варіанта, ХІ | Частота пІ | Розрахункові дані | |||
ХІ п | ХІ – Х | ( ХІ – Х )2 | ( ХІ – х)2 щ | ||
17,5 | 1 | 17,5 | -9,4 | 88,36 | 88,36 |
17,6 | 2 | 35,2 | -9,3 | 86,49 | 172,98 |
36,2 | 3 | 108,6 | 9,3 | 86,49 | 259,47 |
37,6 | 2 | 75,2 | 10,7 | 114,49 | 228,98 |
Разом | 57 | 1535,3 | X | X | 1399,06 |
Для визначення міжгрупової дисперсії необхідно обчислити групові
Середні (ХІ) і знайти загальний об’єм їх варіювання відносно загальної середньої (І(хі – х)2 N). За розрахунковими даними таблиці 29 визначаємо розмір міжгрупової дисперсії:
Таблиця 29
Вихідні і розрахункові дані для обчислення міжгрупової дисперсії
Інтервал (група) | Середня по групі, | Обсяг груп, | Розрахункові дані | ||
Х] – X | (х, – х)2 | (х, – х)2 | |||
17,5-20,5 | 18,9 | 9 | -8,0 | 64,00 | 576,0 |
20,5-23,5 | 21,9 | 6 | -6,0 | 25,0 | 150,0 |
23,5-26,5 | 25,4 | 9 | -1,5 | 2,25 | 20,3 |
26,5-29,5 | 28,2 | 13 | 1,3 | 1,69 | 22,0 |
29,5-32,5 | 30,8 | 15 | 3,9 | 15,21 | 228,0 |
32,5-35,5 | 34,0 | 3 | 7,1 | 50,41 | 151,2 |
35,5-38,5 | 36,9 | 2 | 10,0 | 100,00 | 200,0 |
Разом | X | 57 | X | X | 1347,5 |
Щоб визначити внутрішньогрупову дисперсію, необхідно розрахувати часткові дисперсії у розрізі семи груп. Маючи групові середні |Х] |, знаходимо
….. . у і., ..
По кожної групі відповідну часткову дисперсію і ‘ 1. За даними прикладу, який
(гг2 (Т2 (Т2 (Т2 )
Розглядається, необхідно обчислити сім таких дисперсій( 1, 11, 111 ГП). Необхідні проміжні дані для їх обчислення наведено в таблиці 30.
Таблиця 30
Вихідні і розрахункові дані для обчислення внутрішньогрупової дисперсії (розрахунок часткових дисперсій) ( ‘)
Інтервал (група) | Варіанта, ХІ | Частота, П, | Розрахункові дані | ||||
~х. і | ( Х1 – X] )2 ПА | ||||||
17,5-20,5 | 17,5 | 1 | 17,5 | -1.4 | 1,96 | 1,96 | |
( Хі = 18,9) | 17,6 | 2 | 35,2 | -1.3 | 1,69 | 3,38 | Б(х; – хі )2 П Nі |
Всього | X | 9 | 170,0 | X | X | 9,05 | 9.051.0 = 9 |
… | … | … | … | … | … | … | … |
35.5-38,5 | 36,2 | I | 36,2 | -0.7 | 0,49 | 0,49 | |
(- 36.9) | 37,6 | I | 37,6 | 0.7 | 0.49 | 0,40 | І(х, – ХРШ )2 ПІ |
Всього | X | 2 | 73,8 | X | X | 0,98 = | = 098 = 0,49 2 |
Початку обчислень часткових дисперсій передує розрахунок групових
– _ Їх- _ 170
Середніх (ХІ). Так, для першого інтервалу 9 =18,9. Аналогічно
Розраховуємо середні для інших груп. Потім знаходимо окремі дисперсії °І, величини яких становлять: А І = 1,0; ^ = 0,43; АГл = 1,12; СіУ = 0.68; °У = 1.09; <уГі – 0,58; суП – 0,49 (послідовність розрахунку показано тільки для першого і сьомого інтервалів).
Маючи обчислені значення часткових дисперсій, знаходимо величину внутрішньогрупової дисперсії:
Ст2 = О) Х1 + О]1ПА + Ощіїщ +… + О2Ш ^т = ** N + N1 + ЖШ І…. + N,1,,
_ 1Х 9 + 0.43 Х 6 +1.12 Х 9 + 0.68 Х13 +1.09 Х15 + 0.58 Х 3 + 0.49 Х 2 _ 49.57 _ 0 87 ^ 0 9 9 + 6 + 9 +13 +15 + 3 + 2 ‘ 57 ~ . ~ .
Відповідно до правила складання дисперсій, яке випливає з доказу, що якщо сукупність складається з кількох груп, то загальна дисперсія дорівнює сумі внутрішньогрупової і міжгрупової дисперсій, маємо:
Ст2 =Ст2 +Ст2 = 23,6 + 0,9 = 24,5
Общ “ігр вгр ‘ ‘ ‘
За раніше наведеними розрахунками, величина загальної дисперсії За! дорівнює 24,5, що підтверджує вірність виконаних обчислень.
Теоретичний і практичний інтерес правила додавання дисперсій полягає у тому, що, знаючи дві величини дисперсії, на основі наведеної рівності завжди можна знайти третю. Наприклад:
222 сг = о – о
Вгр гаг жгр
Маючи величини міжгрупової і загальної дисперсій, можна мати уяву про силу впливу групувальної ознаки. Про це мова піде при вивченні питань кореляційного і дисперсійного методів аналізу.
5.3.3. Дисперсія альтернативних ознак
Перш ніж розглянути питання про дисперсію альтернативних ознак, слід нагадати, що під альтернативною ознакою розуміють таку ознаку, якою одні варіанти наділені, а другі – ні. Так, якщо у вибірці, яка складається з П одиниць і П” одиниць, наділених даною ознакою, то їх частка ¥ у вибірковій сукупності становитиме:
П”
№ = -.
П
Розрахунок загальної, міжгрупової і внутрішньогрупової дисперсій для альтернативних ознак поданий за формулами в таблиці 31.
Таблиця 31
_Формули обчислення дисперсій для альтернативних ознак_
Вид дисперсії | Формула | Примітка |
Загальна | А1, = и(1– И) | І – частка одиниць наділених даною ознакою |
Міжгрупова | Сг2 — | І,- – частка одиниць, наділених даною ознакою в і – й групі |
П – число одиниць в і – й групі | ||
Внутрішньогрупова | 2 Т. и>І (1 – иІ1 )п Ъп1 | ^П – об’єм вибірки и, = и) |
Розглянемо послідовність розрахунку названих видів дисперсій на конкретному прикладі. У таблиці 32 представлена вибірка 60 підприємств, розподілених за виробничим типом на дві групи з обсягом П кожної і виділенням альтернативної ознаки – кількості збиткових підприємств ().
Підставляючи розрахункові дані таблиці 32 у формули відповідних видів дисперсій, одержимо:
АІ = №(1 – і) = 0,233/1 – 0,233 / = 0,179; А2 =І(і, -1)2 П, = 0,134 = 0,002;
МІ 60
2 (1 ~ 1,)П, 10,6
=— -:- = 0,177.
^■Щ = 60
Таблиця 32
Вихідні і розрахункові дані для обчислення дисперсій
Число Розрахункові дані | ||||||||
Група | Обсяг груп, П | Одиниць у Групі, наділених Даною ознакою, п” | П” И[ =- П | И = (1 – И>1 ) | И(1 – и)п | И – и | (И – И)2 | И – и)2 п |
I | 40 | 8 | 0,200 | 0,16 | 6,4 | -0,03 | 0,0009 | 0,036 |
П | 20 | 6 | 0,300 | 0,21 | 4,2 | 0,07 | 0,0049 | 0,098 |
Всього | 60 | 14 | 0,233 (14:60) | X | 10,6 | X | X | 0,134 |
Грунтуючись на правилі додавання дисперсій, маємо:
^ = +°1 АБо 0,179 =0,002+0,177; 0,179= 0,179.
Середнє квадратичне відхилення альтернативної ознаки в
Даному випадку легко знайти шляхом добування кореня з Ст” ,
Тобто : ° = >/-№) = >/0^179 = 0.42.