Обгрунтування господарських рішень та оцінювання ризиків – Донець Л. І. – РОЗДІЛ 12. Прийняття рішень за допомогою матричних ігор
12.1. Матрична парна гра
Розглянемо антагоністичну парну скінченну матричну гру з нульовою сумою, в якій два гравця А і В. Інтереси гравців А і В прямо протилежні: один гравець виграє те, що програє другий. Такий підхід дозволяє вказувати тільки виграш одного гравця. Домовимося, що гравець А прагне збільшити свій виграш, а гравець В – зменшити свій програш.
Нехай гравець А має т стратегій (A1, А2,…, Аm), а гравець В n стратегій (В1,В2,…,Bn). В результаті застосування гравцем А стратегії Аi і гравцем В стратегії Вj однозначно визначається результат гри – це сума яку виграє гравець А і програє гравець В.
Гру вважають заданою, якщо відомі всі значення aij, які записують у вигляді матриці, яку називають платіжною матрицею, і яку представлено в табл. 12.1. Це матрична гра, яка має розмірність mxn.
Таблиця 12.1. Платіжна матриця гри mxn
Рядки таблиці 12.1 відповідають стратегіям гравця А, а стовпці – гравця В.
Платіжну матрицю гри також можна представити у вигляді матриці (12.1):
Платіжна матриця представляє собою табличний запис функції виграшу матричної гри. Партія в матричній грі реалізується так: гравець А вибирає один з рядків платіжної матриці (одну зі своїх стратегій). Гравець В, не знаючи вибору гравця А, вибирає один зі стовпчиків платіжної матриці (одну зі своїх стратегій). Елемент матиці, якій стоїть на перетині рядка і стовпця, що вибрані, визначає виграш гравця А і програш гравця В.
Ціль гравців полягає у виборі таких стратегій, при застосуванні яких гравець А має максимальний виграш, а гравець В мінімальний програш. В теорії ігор виходять з того, що кожний гравець вважає свого пробника розумним і таким, що прагне помішати йому отримати найкращій результат.
Гра називається приведеною до нормальної форми, якщо вона записана у вигляді матриці.
Будь-яка скінченна гра може бути зведена до нормальної форми.
Для того, щоб розв’язати гру потрібно вказати оптимальні стратегії для кожного гравця.
Головний принцип теорії антагоністичних ігор полягає в тому, що гравцю слід вибирати свою поведінку таким чином, щоб вона була розрахована на найгірший для нього характер дій противника.
Приклад 12.1. Гравець А вибирає одну з двох сторін монети. Гравець В, не знаючи вибору гравця А, також вибирає одну з сторін монети. Після вибору обору обох гравців, гравець В платить гравцю А 1 грн., якщо сторони співпали і гравець А платить гравцю В 1 грн. у протилежному випадку. Гравець А прагне збільшити свій виграш, гравець В – зменшити свій програш. Побудувати платіжну матрицю гри для гравця
Розв’язання. Гравець А має дві стратегії (А1, А2), де А1 – обрано сторону монети з зображенням герба, А2 – обрано сторону монети з зображенням цифри. Гравець В також має дві стратегії (В:, В2), де В1 – обрано сторону монети з зображенням герба, В2 – обрано сторону монети з зображенням цифри.
В результаті застосування гравцем А стратегії А1 і гравцем В стратегії В1, тобто обидва гравця оберуть сторону монети з зображенням герба, однозначно визначається результат гри a11 =1, який представляє собою суму, яку виграє гравець А і програє гравець В (гравець А виграє 1 грн., а гравець В програє 1 грн.) Якщо гравець А буде застосовувати стратегію А1, а гравець В стратегію В2, то однозначно визначається результат гри a12 = -1, який означає, що гравець А програє 1 грн., а гравець В виграє 1 грн. З аналогічних міркувань отримаємо, що при застосуванні стратегій А2 і В1 , результат гри дорівнюватиме a21 = -1; а при застосуванні стратегій А2 і В2 – a22 = 1.
Таким чином отримаємо платіжну матрицю у вигляді табл. 12.2.
Таблиця 12.2. Платіжна матриця гри про вибір сторони монети
В1 | В2 | |
A1 | 1 | -1 |
А2 | -1 | 1 |
Приклад 12.2. Нехай є дві фірми А і В, які торгують одним і тим же товаром, яки користується попитом впродовж п одиниць часу. Нехай в – доход від продажу товару в одиницю часу, причому продаж товару за зниженими цінами заборонено. Якість товару залежить від часу попадання його на ринок: чим пізніше товар попаде на ринок, тім вище його якість, причому реалізується товар більш високої якості. Фірма А прагне максимізувати свої доходи, фірма В прагне розорити фірму А, не піклуючись про свої доходи. З цією метою фірма В може використовувати як законний засіб лише момент попадання товару на ринок. Нехай і – момент попадання товару на ринок фірми А, ] – момент попадання товару на ринок фірми В, вибір моментів – єдино можливі управлінські рішення. Побудувати платіжну матрицю гри.
Розв’язання. Якщо фірма А поставить товар на ринок в момент часу і, а фірма В – в момент часу j, причому і < j, фірма А не буде мати конкурентів впродовж часу j – і і за цей період отримає доход: s (j – і). Починаючи з моменту часу ] на ринку буде “свіжий” товар фірми В, тому з моменту часу j фірма А буде втрачати свій доход. Якщо і > j, тобто фірма В раніше поставляє свій товар на ринок, доход фірми А буде дорівнювати s(n +1 – і). Якщо фірми А і В одночасно поставлять товар, тобто і = j, то їхні товари будуть мати однаковий попит, і кожна з фірм А і В отримає доход, який буде дорівнювати s(n +1 – і) /2 . З наведених міркувань можна записати функцію виграшу фірми А, яка одночасно буде функцію програшу фірми А:
Наприклад, n = 5, тоді, використовуючи формулу (12.2), отримаємо платіжну матрицю гри:
На інтуїтивному рівні видно, що величину в можна опустити, тому платіжна матриця гри буде мати вигляд