Математична статистика – Руденко В. М. – 3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Розподіли випадкових величин

Випадкова величина – це величина, яка в результаті випробувань може приймати певні значення (із сукупності своїх значень) з певною Ймовірністю. Випадковою можна назвати будь-яку (не обов’язково чисельну) змінну X, значення якої х створюють множину випадкових елементарних подій {х}.

Розрізняють дискретну і неперервну випадкові величини.

Дискретною Випадковою величиною називається випадкова величина, що приймає скінчене число значень з множини, елементи якої можна пронумерувати. Неперервною Випадковою величиною називається випадкова величина, можливі значення якої неперервно заповнюють деякий інтервал.

Рядок розподілу Дискретної випадкової величини X може бути представлений як у табличній формі – у вигляді таблиці, де перераховано значення випадкової величини х1, х2, хП з відповідними до них ймовірностямир1, р2, рП (див. табл. 3.2), так і у вигляді графічного зображення (рис. 3.7).

Таблиця 3.2

Рядок розподілу дискретної випадкової величини X

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Рис. 3.7. Графік розподілу дискретної випадкової величини X

Рядок розподілу може мати аналітичну форма представлення, наприклад:

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

В загальному вигляді це можна записати якД(Х) = Р(Х=х) – значення функції /(X) дорівнює ймовірності Р(Х=х) того, що змінна X приймає значення х.

За аналогією з випадковими подіями, можна вважати, що простором елементарних випадкових значень х1, х2, хП змінної X є скінчена множина цих значень С1={х}. Кожному елементарному значенню х1, х2, хП, яке належить до множини СІ, поставлено у відповідність невід’ємне число – ймовірностір1, р2, рП, тобто р! = Р(Х = х{) > 0, причому сума ймовірностей появи всіх елементарних значень змінної X дорівнює одиниці:

Р, = 1. (3.14)

Отже, пару {СІ, Р} можна вважати імовірнісним простором, який складається зі скінченої множини значень О змінної X і невід’ємної функції Р, яка визначена на множині значень О і задовольняє умові (3.14).

Якщо емпіричні дані є результат статистичних випробувань, то емпіричний розподіл частот можна також трактувати як розподіл випадкової величини – співвідношення можливих значень з відповідними ймовірностями їхньої появи. Оскільки Класичні ймовірності збігаються з Відносними частотами (див. поняття класичної ймовірності), то розподіли частот можна представляти як відповідні розподіли випадкових величин, проте, лише за певними умовами і обмеженнями (мова про них йтиме нижче).

Розглянемо на прикладі побудову розподілу дискретної випадкової величини.

Приклад 3.11. Розрахувати розподіл кількості виконаних завдань за результатами тестування навмання відібраної з академічного потоку вибірки студентів обсягом 20 осіб (табл. 3.3).

Таблиця 3.3

Кількість виконаних завдань

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Послідовність рішення:

O представити емпіричні дані табл. 3.3 значеннями Хі і відповідними абсолютними частотами виконання завдань. Частоти розрахувати за будь-яким відомим методом і внести у комірки Л3:С9. Сума абсолютних частот по-

7

Винна скласти обсяг вибірки, тобто ^ тІ = 20 (див. комірку С10 рис. 3.8);

І=1

O для розрахунку ймовірностейр = Р(Х = хї) внести в комірку вираз

=С3/$С$10, аналогічні вирази внести у комірки 04:09;

O розрахувати в комірках Е3:Е9 ймовірності р,- = Р(Х < хі);

O побудувати графіки розподілу ймовірностей (рис. 3.9).

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Отже, у таблиці рис. 3.8 розраховано розподіли ймовірностей дискретної змінної X (кількості виконаних завдань) р'(х) = Р(Х = х) і р(х) = Р(Х< х), на рис. 3.9 зображено відповідні графіки.

Сукупність ймовірностей р’і = Р(Х = хі) має назву щільності розподілу змінної X (див. стовпчик Б рис. 3.8 і гістограму рис. 3.9). Кожне окреме значення щільності розподілу визначає ймовірність р’,- кожного окремого значення X! змінної X, тобто Р(Х = хі). Сума ймовірностей р’,- усіх елементарних значень X! змінної X (за умови повної системи випадкових значень) дорівнює

П

Одиниці, тобто ^ р] = 1. Як бачимо з рис. 3.8 (див. комірку 010), ця вимога

І=1

Виконується: 0,00+0,05+0,10+0,20+0,25+0,30+0,10= 1,00.

Сукупність ймовірностей р! = Р(Х < X!) має назву розподілу змінної X (див. стовпчик Е рис. 3.6 і дискретний графік рис. 3.7 у вигляді сходинок з насиченням до 1,00). Розподіл випадкової величини показує ймовірність для змінної X, значення якої не перевищує Х^ , тобто Р(Х < х^. Кожне значення розподілу є сумою ймовірностей Р’і усіх попередніх елементарних значень х, І

Змінної X, тобто: РІ =^р’І. Наприклад, для і = 4 значення ймовірність р4

І=1

4

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Аналогічно може бути представлено й щільність розподілу Дх). Для Дискретної змінної розподіл і щільність розподілу зв’язані співвідношенням:

Р (Хі) = ±/ (х,) (3.17)

І=1

Для Неперервної змінної можна записати такі співвідношення:

– щільність розподілу Дх) = Р ‘(х). Це значить, що щільність Дх) є першою похідною від функції розподілу Р(х);

– щільність розподілу для будь-якої випадкової величини невід’ємна, тобто Лх) > 0, і має таку властивість:

Складатиме р4 р’. = 0,00 + 0,05 + 0,10 + 0,20 = 0,35 (див. комірку Е6 рис. 3.6).

¡=1

Ймовірність отримання у випробуванні будь-якого значення з повної системи випадкових значень (фактично, це є ймовірність достовірної події) дорівнює

П

Одиниці. І дійсно, для і = п ймовірність рП = ^ р] = 1(див. комірку Е9 рис. 3.6

І=1

Або останнє значення ймовірності розподілу на графіку рис. 3.7).

Законом розподілу Випадкової величини є співвідношення, що встановлює зв’язок між можливими значеннями випадкової величини і відповідними до них Ймовірностями. Закон розподілу може бути задано функціями:

O функцією розподілу Р(х)

Р(х) = Р(Х < х); (3.15)

O функцією щільності розподілуДх)

Дх) = Р(Х = х). (3.16)

Для Дискретної змінної функція розподілу Р(х) може бути представлена в аналітичній формі. Так, заданими рис. 3.8 функція Р(х) матиме вигляд:

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Математичний аналіз надає геометричну інтерпретацію визначеному інтегралові (3.18) як площі (див. зафарбовану площу на рис. 3.10), яка зверху обмежена графіком функції /(х), а знизу – віссю абсцис у межах – ю < Х < +со. Розмір площі за інтегралом (3.18) дорівнює одиниці.

Значення функції розподілу ¥(х) для певного значення х (наприклад, х = а) визначається через щільність розподілу /(х) за формулою:

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Інтеграл (3.19) і функція ¥(а) розподілу також мають сенс площі (див. зафарбовану площу на рис. 3.11), яка обмежена з трьох боків: зверху – графіком функції Дх), знизу – віссю абсцис у межах -” < х < а, з правого боку – ординатою, яка проходить через точку Х = А.

Для Х = +со функція розподілу ¥(со)=1, тобто

І (со) = / (х)^х = 1. (3.20)

-ОС

Отже, порівнюючи алгебру випадкових подій з математичним апаратом випадкової величини, можна дійти до висновку про те, що розподіли Випадкових величин ізоморфно відтворюються на розподілах Випадкових подій.

Розглянемо приклад розподілу неперервної випадкової величини.

Приклад 3.12. Як відомо з психодіагностики, коефіцієнт інтелекту О (показник інтелектуального розвитку сукупності однакових за віком осіб) розподіляється за законом, близьким до нормального12, щільність розподілу якого визначається формулою:

Гг 1 -0,5((х-1В)/<7)2 Г Г, . 1 | (х – І02 і

Де /(х) – ймовірність Р(І<2 = х) того, що ї<2 прийме значення х; І<2 і а – середнє арифметичне і стандартне відхилення генеральної сукупності; % ~ 3,14; е ~ 2,71. Для певного контингенту індивідуумів середнє значення 1<2=100 і а =15.

Завдання: Побудувати розподіл коефіцієнта інтелекту І£) в діапазоні значень від І<2МІН = 50 до І(2макс = 150. Визначити ймовірності того, що І(2 прийматиме значення: а) І£) < 80; б) Щ > 110; в) у межах 70 < І£) < 90; г) прийматиме значення поза межами інтервалу 80 < Щ < 120.

Рішення:

Розрахуємо значення щільності/(х) нормального розподілу і розподіл і(х) у табличній формі в указаному діапазоні з інтервалом 10 (рис. 3.10). Деталі розрахунку розглянемо пізніше у відповідному розділі. Важливим моментом є досягнення так званої нормалізації, за умови якої площа під кривою щільності розподілу /(х) повинна дорівнювати одиниці. Як бачимо з комірки С14 рис. 3.10, ця вимога виконується.

Побудуємо відповідні графіки розподілу І£) (рис. 3.13). Форма графіка щільності /(ІО) має вигляд “дзвону”. Вона є симетричною відносно середнього значення ІО=100. Графік розподіл досягає насичення на рівні 1,00.

12 Докладніше щодо нормального закону розподілу див. розділ 3.4.

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Слід звернути увагу на те, що ймовірність Р(/£> < 100) = 0,50. Інакше кажучи, ймовірність отримати значення 12 на рівні не більше середнього значення Ї<2=100 складає 50%. На рис. 3.13 це відповідає зафарбованій площі, яка складає 50% від загальної. Аналітично це можна записати так:

100

Р (Х < 100) = | / (х)Сх = 0,50.

-сс

Розглянемо пункти завдання щодо визначення ймовірності отримання конкретних значень коефіцієнта інтелекту

А) Визначити ймовірність того, що 12 прийматиме значення не більше 80, тобто Р(ї<2 < 80). Цій ситуації відповідає зафарбована площа рис. 3.14, для якої Р(80) ~ 0,091 (значення 0,091 можна отримати з табл. рис. 3.12). Аналітичний запис має вигляд:

80

Р(Х < 80) = | Л(Х)сІх ~ 0,091.

-сс

Отже, ймовірність Р(І<2 < 80) = 0,091 = 9,1%.

Б) Визначити ймовірність того, що значення 12 не менше 110, тобто, Р(/0>110). Зафарбована площа рис. 3.15 відповідає ситуації, коли треба отримати подію ^4{/2>110}, яка є доповненням протилежної події А{ї<2 < 110}. Сума ймовірностей протилежних подій дорівнює одиниці. Звідси ймовірність бажаної події Р(І2>110) = 1 – Р(ї(2 < 110) і аналітичний запис для визначення відповідної ймовірності за допомогою функцій розподілу такий:

110

Р(Х > 110) = 1 – Р(х < 110) = 1 – | Л(х)Сх = 1 – 0,748 = 0,252.

-сс

Значення Р(110) = 0,748 можна отримати з табл. рис. 3.12. Отже, ймовірність Р(/((>110) ~ 25,2%.

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

В) Визначити ймовірність того, що ¡2 прийматиме значення не менше 70, але не більше 90, тобто Р(70< ¡2 <90). Зафарбована площа рис. 3.16 відповідає ситуації, коли з події ^{¡2 < 90} треба вилучити елементи події А2{12 < 70}. Тоді ймовірність Р(А) бажаної події А дорівнюватиме різниці ймовірностей Р(40 і Р(А,) подій АХ і ^2, тобто Р(70< 1(2 < 90) = Р(/( < 90) – Р(Р2 < 70). Визначення ймовірності за допомогою функцій розподілу матиме вигляд:

90 90 70

| Л(Х)Сх = | Л(х)Сх – | Л(х)Сх = Р(90) – Р(70), або

Р(90) – Р(70) = 0,253 – 0,023 = 0,23. Отже, ймовірність Р(70< ¡2 < 90) = 23%.

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

Г) Визначити ймовірність того, що І<О прийматиме значення поза межами інтервалу 80 < О < 120, тобто, Р(80 > О >120). Цій події відповідає сума двох зафарбованих частин площі рис. 3.17. Рішення можна отримати у 2-х варіантах:

1-й варіант. Подія А складається з двох несумісних подій А1{І<2 < 80} і ^2{І<2 >120} з ймовірностями Р(АА і Р(А2) відповідно. Ймовірність Р(АА події А1 визначиться як

80

|/(х)ах = і(80), або з табл. рис. 3.12 маємо і(80) = 0,091.

Ймовірність Р(А2) події ^42 визначиться як доповнення до протилежної події І2{ІО< 120} або Р(А2) = 1 – ~Аі{ІО< 120}, а саме

120

І(Х > 120) = 1 – | /(х)йх = 1 – і(120) або

-ос

120

І(Х > 120) = 1 – і(х < 120) = 1 – | /(х)ох = 1 – 0,909 ~ 0,091.

-ос

Ймовірність Р(А) події А складається з суми ймовірностей Р(АА і Р(А2) подій А1 і А2, тобто Р(А) = Р(А1) + Р(А2) = 0,091 + 0,091 ~ 0,182 = 18,2%.

2-й варіант. Подію ^4{80>І< >120} можна звести і розглядати як доповнення до протилежної події А, яку позначимо _8{80 <І(2 < 120} (див. незафарбовану площу рис. 3.17). Тоді Р(А) = 1- Р(В).

Подія _8{80< ¡2 <120} відповідає попередній ситуації (див. вище п. “в”), коли з події В1 {¡2 < 120} треба вилучати елементи події В2{2< 80}. Ймовірність Р(В) події В є різниця ймовірностей Р(В{) і Р(В2)

Р(В) = Р(12 < 120) – Р(12 < 80). Ймовірність Р(А) бажаної події А дорівнюватиме

Р(А) = 1- Р(В) = 1 – [Р(Щ < 120) – Р(12 < 80)]. Визначення ймовірності за допомогою функцій розподілу матиме вигляд:

120 Г120 80 ~|

1 – | Л(Х)Сх = 1 – | Л(х)Сх – | Л(х)Сх = 1 – [Р(120) – Р(80)], або 1- [Р(120) – Р(80)] = 1 – [0,909 – 0,091] = 1- 0,818 = 0,182 = 18,2%.

Отже, ймовірність того, що ¡2 не прийматиме значення в діапазоні від 80 до 120, тобто Р(80 > ¡2>120), складає 18,2%.

Зауваження: якщо графік розподілу симетричний і зафарбовані площі однакові за розміром, ймовірність Р(А) розраховується як подвоєна площа однієї з частин, наприклад, Р(А) = 2-Д80 < ¡2) = 2-0,091 ~ 0,182 = 18,2%.

Розподіли дають можливість рішення і зворотної задачі: знаходження значень змінної X, ймовірність якої задано.

Так, за даними прикладу 3.12 можна стверджувати, що на рівні ймовірності 0,05 (5%) коефіцієнт інтелекту ¡2 не перевищуватиме значення 75,3. З графіка функції розподілу Р(2) рис. 3.18 видно, що ймовірності 0,05 відповідає зафарбована площа, яка обмежена графіком щільностіЛ(Ш) і ординатою ¡2 = 75,3. Інакше кажучи, Р(!2) = ^(¡2 < 75,3) = 0,05.

Аналогічно можна отримати значення змінної ¡2, ймовірність якої складає 20% або 0,20. З рис. 3.19 видно, що ймовірності 0,20 відповідає зафарбована площа, яка обмежена графіком щільностіЛ(Ш) і ординатою ¡2 = 87,4.

Інакше кажучи, Р(!2) = ^(¡2 < 87,4) = 0,20.

Математична статистика   Руденко В. М.   3.2. ВИПАДКОВІ ВЕЛИЧИНИ

На даному етапі вивчення властивостей розподілів доречно згадати поняття “процентиль” і надати йому додаткового змістовного сенсу. Як визначалося вище, процентилі ділять обсяг упорядкованої сукупності на Сто частин, тобто відокремлюють від сукупності по 0,01 частки (по 1%). Pj – це z’-й процентиль – межа, нижче за яку лежать /’ відсотків значень. Наприклад, якщо п’ятий процентиль дорівнює 30 (записують Р5 = 30), це значить, що 5% всіх значеньX не перевищують 30.

Значення функції розподілу F(X), які знаходяться у межах від 0 для F(-“) до 1 для F(+co), також зручно поділити на Сто частин і представляти функцію розподілу у вигляді процентилів. Якщо ціна шкали функції розподілу F(x) становить 0,01 (1%), отримані вище результати можна прокоментувати у такій спосіб:

O для F(IQ) = P(IQ<75,3) = 0,05 = 5% можна записати Р5 = 75,3 – п’ятому процентилю відповідає коефіцієнт інтелекту, який не перевищує значення у 75,3;

O для F(IQ) = P(IQ <87,4) = 0,20 = 20% можна записати Р20 = 87,4 – двадцятому процентилю відповідає коефіцієнт інтелекту, який не перевищує 87,4.

Значення процентиля для нормального розподілу можна отримати за допомогою функції MS Excel =НОРМОБР(ймовірність; середнє; ст. відхилення). Так, ^5 = НОРМОБР(0,05;100;15) = 75,3; а Р20 = НОРМОБР(0,20;100;15) = 87,4.


1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 5,00 out of 5)

Математична статистика – Руденко В. М. – 3.2. ВИПАДКОВІ ВЕЛИЧИНИ