Теорія статистики – Мармоза А. Т. – 5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Дисперсія володіє рядом математичних властивостей, які дають змогу спростити розрахунки. Розглянемо їх.

1. Дисперсія постійної величини дорівнює нулю:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Ця властивість випливає з того, що дисперсія є показником розсіювання варіант навколо середньої арифметичної, а середня арифметична постійної величини дорівнює цій величині.

2. Якщо з усіх значень варіант відняти постійну величину (х0), то дисперсія не зміниться:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Це означає, що дисперсію можна розрахувати не за даними значення ознаки, а за відхиленнями від будь-якого постійного числа.

3. Якщо всі значення варіант зменшити (збільшити) в одне й те ж саме число разів (к), то дисперсія зменшиться (збільшиться) в к2 разів, а середнє квадратичне відхилення в к разів:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Це означає, що всі значення ознаки можна поділити на постійне число (наприклад, на величину інтервалу), обчислити середнє квадратичне відхилення, а потім помножити його на це постійне число:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

4. Якщо обчислити середній квадрат відхилень від будь-якої величини А, в тому чи іншому ступені відмінної від середньої арифметичної (Х), то він завжди буде більше середнього квадрата відхилень, обчисленого від середньої арифметичної:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

При цьому більше на цілком певну величину – квадрат різниці між середньою та цією умовно взятою величиною, тобто на

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Де а2 – середній квадрат відхилень від середньої арифметичної; А – середній квадрат відхилень від довільної величини А.

Це означає, що дисперсія від середньої завжди менша дисперсій, обрахованих від будь-яких інших довільних величин, тобто вона має властивість мінімальності.

Ряд властивостей дисперсії грунтується на рівності:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Тобто дисперсія дорівнює різниці між середньою з квадратів варіант та квадратом середньої. Ця рівність випливає з того, що якщо довільну величину А прирівняти до нуля, то попередня формула дисперсії приймає вигляд:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Ця формула широко використовується в статистиці для спрощеного розрахунку дисперсії (табл.5.2).

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Отже, одержано такий самий результат, що і при розрахунку дисперсії звичайним способом.

Використання зазначених вище властивостей дисперсії дає змогу спростити її обчислення. Так, використовуючи другу і третю властивості в ряду розподілу з рівними інтервалами, дисперсію можна обчислити способом відліку від умовного нуля (способом моментів) за формулою:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Де к – величина інтервалу; х0 – початок відліку.

Перетворюючи наведену формулу, дисперсію і середнє квадратичне відхилення можна визначити через моменти першого та другого порядків:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Де – = – відхилення в інтервалах; к

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Тоді формули для обчислення дисперсії та середнього квадратичного відхилення можна записати в такому вигляді:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Отже, дисперсія, обчислена з використанням умовних моментів, дорівнює добутку квадрата величини інтервалу на різницю умовних моментів першого і другого порядків. Такий спосіб розрахунку дисперсії дістав назву Способу моментів Або способу відліку від умовного нуля.

Розрахуємо дисперсію цим способом для нашого прикладу (табл. 5.2.)

Таблиця 5.2. Дані для розрахунку дисперсії спрощеним способом і способом відліку від умовного нуля

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

При цьому візьмемо к = 2 ц, х0 = 33 ц.

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Такий самий результат одержимо і через умовні моменти першого і другого порядків.

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Отже, розрахунки дисперсії і середнього квадратичного відхилення трьома способами збіглися і дають одні й ті самі результати

5.3. Види дисперсій і правило їх додавання

Вивчаючи коливання ознаки в цілому по всій сукупності і спираючись на загальну дисперсію, ми не можемо визначити вплив окремих факторів на варіацію ознаки, що нас цікавить. Це завдання можна вирішити за допомогою побудови статистичних групувань. Якщо досліджувану сукупність поділити на окремі сукупності (групи) за ознакою, що нас цікавить, то це дасть змогу розкласти загальну дисперсію ознаки на дві дисперсії, одна з яких буде характеризувати частину варіації, зумовлену впливом фактору, покладеного в основу групування, а друга – варіацію, що виникає під впливом інших факторів (крім фактора, покладеного в основу групування). Таким чином, для сукупності поділеної на групи за якою-небудь ознакою, можна визначити такі види дисперсій: загальну, міжгрупову і внутрішньо-групову.

Загальна дисперсія (ст2аг) характеризує коливання (варіацію) ознаки під впливом всіх умов (факторів), що викликали цю варіацію. Вона обчислюється як відношення суми квадратів відхилень індивідуальних значень ознаки (*,) від загальної середньої (х0) до числа одиниць сукупності:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Міжгрупова (факторна) дисперсія (^2мгр) характеризує варіацію ознаки

Під впливом досліджуваного фактора (умови), покладеного в основу групування. Вона обчислюється як відношення суми квадратів відхилень групових середніх (х,-) від загальної середньої до числа одиниць сукупності:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Де х,- і / – групові середні і чисельності по окремих групах.

Внутрішньогрупова дисперсія (ств2гр) характеризує варіацію ознаки, зумовлену не врахованими при групуванні факторами. Вона залежить від умови (фактора), покладеного в основу групування і характеризує варіацію ознаки тільки за рахунок умов і факторів, що діють всередині групи. Для окремих груп внутрішньогрупова варіація розраховується як відношення суми квадратів відхилень індивідуальних значень ознаки (*,) від групових середніх (х,-) до числа одиниць сукупності:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Вона може бути також визначена як середня арифметична зважена з групових дисперсій (ст,2):

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Усі три згадані дисперсії пов’язані між собою такою рівністю: величина загальної дисперсії дорівнює сумі величин міжгрупової та внутрішньогрупової дисперсій:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Ця рівність дістала назву Правила додавання дисперсій.

Знаючи будь-які два види дисперсій, завжди можна знайти або перевірити правильність розрахунку третього виду:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Зіставленням міжгрупової та загальної дисперсій ( відповідно обсягів варіації) можна визначити ступінь впливу факторної ознаки, покладеної в основу групування, на коливання результативної ознаки. При цьому визначають так зване кореляційне відношення:

А2 W

^2 _ м^р _ м. гр, же характеризує частку варіації, зумовлену факторною

Азаг фзаг

А1 W

Ознакою. Решта варіації = – ф2- = 1 – Т2 визначається неврахованими при групуванні випадковими причинами.

Очевидно, що чим більша частка міжгрупової дисперсії у загальній дисперсії, тим сильніший вплив групувальної ознаки на досліджувану ознаку.

Правило додавання дисперсій знаходить широке практичне застосування в статистичному аналізі оцінки істотності і ступеня впливу окремих факторів на загальне коливання результативних ознак (див. дисперсійний та кореляційний аналіз).

Розглянемо порядок визначення загального обсягу варіації та дисперсій, їх розкладання на міжгрупову та внутрішньогрупову на прикладі даних польового досліду (табл.5.3.).

Таблиця 5.3. Вплив різних доз добрив на урожайність льону-довгунцю (соломка, ц/га)

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Аналіз даних таблиці показує, що урожайність льону-довгунцю коливається як під впливом доз добрив (по варіантах досліду), так і в межах того самого варіанта досліду (по повтореннях). Отже, на урожайність крім добрив впливають й інші фактори.

Потрібно визначити загальний обсяг варіації урожайності льону-довгунцю, розбивши його на варіацію, зв’язану з дією добрив (міжгрупову варіацію) і варіацію, зумовлену неврахованими в досліді факторами (внутрішньо-групову варіацію).

Введемо умовні позначення: т – число варіантів досліду (т = 3); п – число повторень (п = 4); N – загальне число спостережень = Т ■ п = 3 o 4 = 12) .

Для визначення відповідних сум квадратів відхилень та дисперсій піднесемо до квадрату урожайність (табл.5.4).

Таблиця 5.4. Квадрати урожайності по повтореннях

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Обчислимо суми квадратів відхилень, що характеризують загальну, між-групову і внутрішньогрупову варіації:

А) загальна Ш, а! = £ -і – N ■ -02 = 16340,40 -12 ■ 36.22 = 615,12;

Б) міжгрупова 1¥ЖІр = И(£ -2 – тХ02 )= 4(4080,20 – 3 ■ 36,2)2 = 595,52;

В) внутрішньогрупова

Для першого варіанту досліду

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Загальна сума внутрішньогрупової варіації становитиме:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Цю ж суму можна знайти і іншим способом, виходячи з правилом додавання (розкладання) варіації:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Таким чином, можна записати, що

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Отже, загальна варіація урожайності льону-довгунцю (615,12) розчленована на систематичну, зумовлену впливом різних доз добрив (595,52) і випадкову, викликану дією неврахованих у досліді факторів (19,60).

За зазначеними сумами квадратів відхилень визначимо загальну, міжгрупову та внутрішньогрупову дисперсії:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

За правилом додавання дисперсій можна записати:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Отже, доведено, що загальна дисперсія дорівнює сумі міжгрупової і внутрішньогрупової дисперсій.

Співставляючи між собою міжгрупову та загальну дисперсії, визначимо кореляційне відношення, яке характеризує силу впливу досліджуваного фактора на результативну ознаку:

Теорія статистики   Мармоза А. Т.   5.2. Математичні властивості дисперсії та спрощені способи її розрахунку

Отже, 96,8% загального коливання урожайності льону-довгунцю припадає на частку добрив, а 3,2% зумовлено іншими неврахованими в досліді факторами.


1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 5,00 out of 5)

Теорія статистики – Мармоза А. Т. – 5.2. Математичні властивості дисперсії та спрощені способи її розрахунку