РІВНОВАГА ТРЕМТЯЧОЮ РУКИ

Визначення 2.13. Нехай задана гра в нормальній формі G = (N, S i9 Uj, i = l, ..., N) . Розглянемо деякий профіль змішаних стратегій а = [1] , р 2 , р 3 , ..., р Л ) і послідовність {a w } профілів цілком змішаних стратегій [1] , що сходяться до а при я -> <*> . Якщо існує така послідовність цілком змішаних профілів стратегій про п = (Pi> Р ;, р ^ , .. p J J ), що сходиться до а при п-> «>, що стратегія р ' кожного гравця в профілі а є найкращим його відповіддю на стратегії інших гравців з профілю а", то такий профіль а називається рівновагою тремтячою руки.

Як і рівновагу Неша, рівновагу тремтячою руки існує в змішаному розширенні в будь-який некооперативного грі з кінцевими множинами стратегій гравців.

Приклад 2.27. Розглянемо біматричних гру

У цій грі є два рівноваги Неша: (а; с) і ( b ; d). Однак тільки (а; с) є рівновагою тремтячою руки.

Дійсно, припустимо, що перший гравець використовує змішану

стратегію ( для деякого п> 1. Це означає, що стратегія

а буде вибиратися з ймовірністю і стратегія b буде вибиратися

з ймовірністю . Очевидно, z n -> а при п -> <*>. Оцінимо виграші другого гравця при різних стратегіях:

При досить великих значеннях п другий гравець, який максимізує свій очікуваний виграш, вибере стратегію с.

Аналогічно перший гравець вибере стратегію а , якщо другий гравець

використовує змішану стратегію

Отже, (а; с) є рівновагою тремтячою руки. Це означає, що дане рівновагу має властивість стійкості по відношенню до невеликих відхилень від нього будь-якого гравця.

Розглянемо тепер профіль стратегій ( b ; d ).

Виберемо довільний профіль цілком змішаних стратегій

Очевидно, а р -> (b, d) при p, q -> 0, pq Ф (). Однак найкращою відповіддю на стратегію qc + (1 - q) d другого гравця буде стратегія а першого гравця, а не Ь.

Отже, (b; d) не є рівновагою тремтячою руки. Це означає, що дане рівновагу не має властивість стійкості по відношенню до невеликих відхилень від нього одного з гравців (при як завгодно малих відхиленнях першого гравця другому гравцеві вигідно відхилитися від стратегії d).

Приклад 2.28. У біматричних грі знайти все рівноваги Неша і рівноваги тремтячою руки:

Рішення

У цій грі три рівноваги Неша:

З'ясуємо, які з них є равновесиями тремтячою руки.

Розглянемо рівновагу (а; с) і послідовність стратегій першого

гравця Очевидно,> «при я-Тоді оцінимо дії другого гравця:

Розглянемо тепер послідовність стратегій другого гравця Очевидно, г я -> с при Тоді оцінимо дії

першого гравця:

Оскільки профіль стратегій

при і -> оо, то рівновага (а; с) - рівновага тремтячою руки.

Аналогічно доводиться, що і ( b ; d) - рівновага тремтячою руки.

Розглянемо тепер рівновагу

Нехай , тобто розглядається послідовність

профілів цілком змішаних стратегій, які збігаються з самим профілем о. Очевидно, а п -> про при п -> І кожна стратегія профілю ст є найкращою відповіддю на послідовність стратегій іншого гравця з профілю а ". Отже, профіль а є рівновагою тремтячою руки.

З розгляду прикладу випливає, що будь-який рівноважний Неша профіль цілком змішаних стратегій в біматричних грі є рівновагою тремтячою руки.

В цілому рівновагу тремтячою руки - це така рівновага Неша, яке стійке по відношенню до малих відхилень будь-якого з гравців від стратегії рівноваги.

Приклад 2.29. У біматричних грі знайти все рівноваги Неша і рівноваги тремтячою руки:

Рішення

У даній грі равновесиями Неша є (pa + (l- p) b, d), /? Е [0; 1]. Розглянемо, які з них є равновесиями тремтячою руки.

1. При р = 1 маємо а = (а; d). Розглянемо наступну послідовність

профілів цілком змішаних стратегій:

Очевидно, а "-" а при п ->

Крім того, найкращою відповіддю на стратегію першого

гравця є стратегія d другого гравця і найкращою відповіддю на стратегію другого гравця є стратегія а першого гравця.

Отже, про = (a; d) - рівновага тремтячою руки.

2. При р = 0 маємо а = ( b ; (1 ). Розглянемо довільний профіль цілком змішаних стратегій

Виграш першого гравця:

Найкращою відповіддю при q е (0; 1) є р = 1, Г.Є. стратегія а, а не Ь. Отже, про = ( b ; d) не є рівновагою тремтячою руки.

3. Розглянемо тепер рівноваги Неша a ~ (pa + (lp) b, d) при ре ( 0; 1). Виберемо довільний профіль цілком змішаних стратегій а п = (pa + (1 - p) b, qc + (1 - q) d). Якщо другий гравець застосовує стратегію qc + (1 - q) d, де q е (0; 1), то найкращою відповіддю першого гравця буде а, а не ра + (- р) Ь. Отже, рівноваги а = (pa + (1 - p) b, d) при ре (0; 1) не є равновесиями тремтячою руки.

  • [1] Цілком змішані стратегії - такі змішані стратегії, в яких все чістиестратегіі граються з позитивними можливостями.
  • [2] Цілком змішані стратегії - такі змішані стратегії, в яких все чістиестратегіі граються з позитивними можливостями.
 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >