Дэвид Склански «Теория покера». Глава 19
Добавлено: 11 мар 2020, 19:29
ГЛАВА 19
ТЕОРИЯ ИГР И БЛЕФ
Теория игр звучит как стратегия игры, но на самом деле это отрасль математики,
рассматривающая процесс принятия решений. Хотя она используется в играх, но также
она применима к таким дисциплинам, как экономика, международные отношения,
социология и военное дело. В сущности, теория игр пытается математически подобрать
лучшую тактику против кого-то, кто также использует лучшую тактику. Если противник,
по вашему мнению, слабее вас - а это может быть в любой игре, вы в основном
полагаетесь на свою голову, а не на теорию игр. Однако когда вы сражаетесь против
оппонента, который, возможно, лучше вас, или против кого-то, кого вы не знаете, теория
игр порой позволяет преодолеть его интеллектуальное превосходство.
Чтобы показать, как теория игр работает в данном ракурсе, возьмем детскую игру в
чет-нечет. Каждый из двух участвующих выкидывает один или два пальца. Если сумма
четная, выигрывает один, нечетная - другой. Математически это абсолютно
равновероятностная игра. Однако на длинной дистанции кто-то может получить
преимущество за счёт своей проницательности, отгадав, когда выкидывать один, а когда
два пальца, основываясь на том, что выкидывал другой раньше - иными словами, разгадав
его систему; то есть, сообразно тому, что намеревается делать оппонент, выкидывается
один или два пальца, сбивая его с толку и принося победные очки (* Отгадать мысли противника - безусловно, является краеугольным камнем покера. Смотрите главу 23 «Психология покера»).
Предположим, кто-то позвал вас сыграть в эту игру. Будучи уверенным в своей голове
и способности отгадать вас, он предлагает вам фору: $101 против $100 за игру. Положим,
вы тоже чувствуете, что вызывающий находится в предпочтительном (бестовом = the
best of it) положении. Тем не менее, используя теорию игр, вы с удовольствием примете
это предложение с уверенностью, что бестовое положение у вас. Все, что вам нужно
сделать, это найти монету; ее подброс будет решать, сколько пальцев вам показывать -
один или два.
Если, скажем, монета упадет решкой, вы показываете один палец, орлом - два. Что
дала вам эта процедура? Она полностью разрушила способность оппонента предвидеть
ваши действия. Шансы выброса вами одного или двух пальцев 50-50. Шансы падения
монеты орлом или решкой 50-50. Однако вместо того, чтобы вам думать, один или два
пальца выкинуть, за вас принимает решение монета, и самое главное - она
рандомизирует (randomizing) ваши решения, то есть, вносит в них элемент случайности.
Быть может, оппоненту удастся разгадать вас, но вы вынуждаёте его предвидеть действия
неодушевленного объекта, что само по себе невозможно. С таким же успехом можно
пытаться угадать, упадет ли шарик рулетки на красное или на черное.
Поскольку ваш оппонент ставит $101 против $100, используя теорию игр, вы
обеспечили себя 0.5-процентным математическим ожиданием (или 50-центовым
положительным ожиданием со ставки). Вы ликвидировали все преимущества, которые
оппонент мог иметь за счёт вашей предсказуемости, и обеспечили себе неоспоримое
преимущество на длинной дистанции. Только если вы полагаете, что ваша голова лучше,
чем у оппонента, лишь в этом случае вы сумеете выиграть у него «по мнению», не
используя монеты.
ИСПОЛЬЗОВАНИЕ ТЕОРИИ ИГР ПРИМЕНИТЕЛЬНО К БЛЕФУ
В этой главе нас в основном интересует, насколько теория игр может быть применима
в покере к искусству блефа и уравнивания возможного блефа. В связи с этим мы
побеседуем о смешанной стратегии, при которой вы делаете конкретный ход - а именно,
блефуете или уравниваете возможный блеф - в заранее определенном числе случаев, но
вносите элемент случайности так, чтобы оппонент не мог знать, есть ли у вас игра или
нет.
Из предыдущей главы вы помните, что при прочих равных условиях игрок, который
никогда не блефует, и тот, что блефует слишком много, имеют значительный минус перед
игроком, который блефует правильно. Для иллюстрации этого положения и того, как
теория игр может подсказать правильное решение, когда стоит блефовать, рассмотрим
конкретный пример.
Играем в лоуболл с обменом без джокера; я сдаю вам следующую готовую
комбинацию (пэт = pat): 9♣, 8♦, 3♣, 2♠, A♥, а себе K♠, 4♦, 3♥, 2♦, A♣.
Вы стоите без прикупа, я же должен поменять одну карту. Если вытягиваю 5, 6, 7, 8
или 9, то я выиграл, поскольку у меня лучший лоу (low = последовательность нижних
карт), чем ваш. Если я вытаскиваю любую другую карту, вы выигрываете. Это означает,
что из 42 карт, остающихся в колоде, для меня 18 выигрышных (четыре 5-ки, четыре 6-ки,
четыре 7-ки, три 8-ки и три 9-ки) и 24 проигрышных, что даёт мне шансы проиграть 24 к
18 или 4 к 3. Каждый из нас вносит по $100 на анте, но после обмена - который вы не
видите - я могу поставить ещё $100.
Предположим, я подвизался каждый кон делать ставку, то есть, по $100 каждую сдачу.
Естественно, каждый раз вы будете ее уравнивать, поскольку вам гарантировано выиграть
по $200 24 раза, когда я буду блефовать, и проиграть по $200 18 раз, когда у меня будет
лучшая рука, что даёт вам суммарную прибыль $1200. Теперь положим, я решил не
блефовать вообще, а ставить, только если моя карта побьёт ваш 9,8-лоу. В этом случае вы
будете скидываться всякий раз, когда я буду ставить, и снова выиграете 24 раза (когда я
не поставлю), а проиграете 18 раз (когда я поставлю), что даёт суммарную прибыль $600,
поскольку вы выигрываете или проигрываете по $100 в каждой сдаче. Поэтому при этих
двух вариантах моей игры у вас явно бестовое положение.
Однако если я блефую лишь в некоторых случаях, ситуация сильно меняется.
Предположим, буду блефовать только на короле пик. Другими словами, буду ставить,
если придёт любая из 18 хороших карт, а также на короле пик. Если я блефую настолько
редко, ваша тактика остается прежней - сбрасываться на моих ставках, поскольку шансы
против того, что я блефую, 18 к 1. Но давайте посмотрим, как изменилось мое положение.
Блеф на короле пик не прибавляет мне дивидендов, но позволяет выиграть 19 раз вместо
18, а проиграть только 23 вместо 24. Этот единственный случай блефа один раз из 19
начал сокращать разрыв между вами как фаворитом и мной как претендентом. Заметьте
также, что вы никак не можете знать, когда я блефую, поскольку я рандомизирую свой
блеф, используя карту - неодушевленный предмет, такой же, как монета в игре чет-нечет,
- для выбора решения, блефовать или нет.
Если блеф на одной карте делает меня менее уязвимым, чем вовсе без него, теперь
представим, что я выбрал две карты - скажем, короля пик и валета пик. И опять
правильной тактикой для вас будет скидываться, когда я ставлю. Предположив, что вы
никак не можете догадаться, когда я блефую а когда нет, использование всего двух
ключевых карт для блефа в дополнение к моим 18 хорошим картам сократило ваши
выигрышные шансы с 24 к 18 до 22 к 20, то есть с 4 к 3 до 11 к 10.
Такой блеф наводит на размышление, что его можно продолжить. Положим, вместо
двух карт я выбираю пять ключевых карт - короля пик и все четыре валета. Это значит, я
буду ставить 23 раза - 18 раз на лучшей руке и пять раз на блефе. И сразу же вы
оказываетесь в нехорошем положении, несмотря на ваш пэт 9,8, поскольку вам
приходится гадать, блефую я или нет, когда делаю ставку. Я даже могу рассказать вам в
точности тактику, которую я использую, но вы всё равно выгуждены будете терять
деньги.
Что получилось? Вы знаете, что есть 18 карт, дающих мне комбинацию, и пять других,
с которыми я буду блефовать. Таким образом, шансы против моего блефа составляют 18 к
5 или 3.6 к 1. С учётом $200 на анте и моей ставки $100 банк составляет $300. Так что вы
получаете шансы банка 3 к 1. Поэтому вы не можете выгодно уравнять шансы победного
прихода 3.6 к 1, так как выиграете максимум только 3 к 1. Подумать только: выбрав пять
карт для блефа, я сорву банк 23 из 42 раз, а вам останется всего 19. Мой доход составит
$400. Таким образом, этот случайный хаотичный блеф превратил руку с потенциальным
проигрышем 24 к 18 в выигрышную с шансами 23 к 19.
Если хотите убедиться, что здесь нет арифметического подвоха, можете просчитать,
что получится, если вы будете уравнивать каждый раз, когда я буду ставить. Вы
выиграете пять раз по $200 на моем блефе и 19 раз по $100, когда я буду ставить, что даёт
$2900. Но вы проиграете 18 раз по $200, когда у меня лучшая рука, что равняется $3600.
Ваш суммарный проигрыш в случае уравнивания моих ставок составит $700, что на $300
больше, чем вы проиграли бы, если бы просто сбрасывались, когда я ставлю.
Если бы я выбрал семь карт для блефа вместо пяти, шансы были бы 18 к 7 против
блефа, и поскольку вы получаете шансы банка 3 к 1, вам бы надо было уравниваться,
когда я ставлю. Однако это всё равно закончилось бы проигрышем! Семь раз, когда я
блефую, вы бы выиграли по $200 от меня, что даёт $1400, и 17 раз, когда я ничего не
ставлю, вы бы выиграли по $100, что равняется $1700. Ваш выигрыш после 42 сдач
составит $3100. А я выиграю 18 раз по $200, когда поставлю на хороших картах, в сумме
$3600, что обеспечивает мне в итоге выигрыш, а вам проигрыш $500 после 42 сдач.
Следует отметить - без дураков, никаких арифметических подставок тут нет, - что вы
теряете даже больше, если будете сбрасываться кажддый раз, когда я ставлю на 18
хороших и семи блефовых картах. Вы выиграете 17 раз по $100, когда я не буду ставить,
тогда как я выиграю по $100 25 раз, когда поставлю. В таком случае ваш суммарный
проигрыш составит $800 вместо $500.
ОПТИМАЛЬНАЯ СТРАТЕГИЯ БЛЕФА
Предположим, я выбираю шесть ключевых карт для блефа. Это означает, что я сделаю
ставку 24 раза. 18 из них у меня лучшая рука, а шесть раз я блефую. Следовательно,
шансы против моего блефа ровно 3 к 1. В банке $200, и если я поставлю, станет $300.
Таким образом, ваши шансы банка также 3 к 1. Вы уравниваете $100, чтобы выиграть
$300. Теперь, когда шансы против моего блефа идентичны шансам, которые вы получаете
из банка, нет абсолютно никакой разницы, будете ли вы уравниваться или сбрасываться.
Более того, что бы вы ни делали, вы всё равно проиграете $600 после 42 сдач. Если вы
сбрасываетесь каждый раз, когда я ставлю, я выиграю у вас 24 раза по $100, когда я
ставлю, и потеряю 18 раз по $100, когда не ставлю; суммарный выигрыш $600. Если вы
каждый раз уравниваете мою ставку, вы возьмёте у меня шесть раз по $200 на блефе и 18
раз по 4100, когда я не ставлю, в сумме $3000; но я выиграю у вас 18 раз по $200, когда
поставлю на хороших руках, что в сумме равняется $3600. И вновь моя прибыль
составляет $600. Поэтому, кроме психической атаки, нет другого способа в мире не дать
мне выиграть эти $600 после 42 сдач, что даёт мне положительное ожидание 14.29 со
сдачи. Блефуя ровно шесть раз из 24, я превратил свои карты из проигрывающих 4 к 3,
когда я не блефовал совсем, в выигрышные 4 к 3 - независимо от стратегии, которую вы
изберёте против меня.
Мы приближаемся к основе основ теории игр и блефа. Заметим для начала, что
процент сдач, в которых я блефовал, был определён заранее: один раз из 19 ставок, пять
раз из 23 или семь из 25. Далее отметим, что блеф был совершенно случаен; сигналом для
него служили определенные ключевые карты, которые я брал из колоды и которые мой
оппонент никак не мог увидеть. Он никогда не мог знать наверняка, вытащил ли я одну из
18 хороших или карту для блефа. И, наконец, заметим, что произошло, когда я блефовал
ровно с шестью картами - когда шансы против моего блефа в данном конкретном случае
точно равнялись шансам банка, которые получал оппонент. В этом единственном случае
было предрешено, что оппонент теряет одинаковое количество денег, какую бы тактику
он ни избрал - уравнивание или сброс.
Это оптимальная стратегия блефа - когда нет разницы, как играет противник. Значит,
можно сказать, что если вы используете стратегию блефа, которая заставляет оппонента
поступать одинаково плохо, как бы он ни играл, это и есть оптимальная стратегия. И эта
оптимальная стратегия заключается в том, что вы блефуете так, чтобы шансы против
вашего блефа в точности равнялись шансам банка, которые получает оппонент. В
ситуации, которую мы обсуждали, у меня было 18 хороших карт, и когда я поставил свои
$100, доведя банк до $300, оппонент получал 3 к 1 из банка. Следовательно, оптимальной
стратегией был блеф на шести дополнительных картах, что делало шансы против блефа 3
к 1 - идентично шансам банка, которые получал оппонент.
Предположим, что банк бы равнялся $500 вместо $200 до того, как я сделал ставку.
Вновь я имел бы 18 выигрышных карт, а оппонент мог побить только блеф. Ставка $100,
поэтому оппонент получал бы шансы банка $600 к $100, когда уравнял мою ставку. В
данном случае оптимальной стратегией для меня был бы блеф на трёх картах. С 18
хорошими картами и тремя блефовыми шансы против блефа были бы 6 к 1 - идентично
шансам банка, которые получал оппонент, прими он мою ставку. Если же в банке было
бы $100, и я поставил бы $100, я должен был бы блефовать на девяти картах при 18
хороших, что делало шансы против блефа 2 к 1 идентичными шансам, которые оппонент
получал с банка.
Важно сознавать, что если результат одинаков незавимо от того, как играет оппонент -
уравнивается он или сбрасывается, в среднем у вас всё равно будет получаться одна и та
же сумма, даже если он будет перемежать сброс с уравниванием. Возвращаясь к
первоначальному примеру оптимальной стратегии, где я блефую с шестью картами по
$100 и делаю такую же ставку на 18 хороших картах в банк, равный $200, я всё равно в
среднем получу плюс $600 через 42 сдачи на длинной дистанции независимо от того,
уравняет ли оппонент 12 и сбросит столько же раз, или же он уравняет 6 раз, а сбросит 18,
или как угодно ещё. Невозможность найти какое-либо противодействие для устранения
своего убыточного положения является ключом ко многим проблемам теории игр, хотя
большинство книг по теории игр не дают такой формулировки.
Блеф на основе теории игр можно также расписать в процентах. Предположим, у вас
25-процентные шансы набрать комбинацию, в банке $100, и ставка $100. Таким образом,
если вы поставите, оппонент получает шансы банка 2 к 1. Поскольку шансы сделать руку
у вас 25%, вероятность того, что вы блефуете, должна быть 12 ½ процентов, что делает
шансы против блефа равными 2 к 1, что и есть оптимальная стратегия. К примеру, в
обменном лоуболле 48 карт вам неизвестны, когда вы тянете одну, и предположим, 12 из
них (25 процентов) дают вам комбинацию. Поэтому для блефа следует избрать шесть
других карт (12 ½ процентов) из 48.
Вы назначаете карты для блефа, конечно же, для того, чтобы рандомизировать ваши
ставки. Без этого фактора случайности хорошие противники, на которых вы примените
теорию игр в отношении блефа, быстро разгадают вашу систему и сотрут вас в порошок.
Красота и изюминка теории игр состоит в том, что если даже оппонент знает, что вы ее
используете, он всё равно ничего не может с этим поделать.
ТЕОРИЯ ИГР И ЧАСТОТА БЛЕФА В СООТВЕТСТВИИ С ПОВЕДЕНИЕМ ОППОНЕНТОВ
В реальных покерных ситуациях оптимальная стратегия на основе теории игр не
всегда правильна. Очевидно, если вы боретесь с противником, который почти всегда
уравнивает ваши ставки, тогда не стоит блефовать вообще. Если же вам встретится
противник, который слишком часто скидывается, тогда стоит поблефовать, естественно,
зная меру.
Теория игр подтверждаёт эти тактические вариации. Вспомним: в первой части этой
главы говорилось, что если вы блефуете на пяти картах вместо шести - то есть чуть
меньше оптимума, за 42 сдачи вы выиграете на $300 больше, если оппонент все время
уравнивается, а не сбрасывается. Однако если вы блефуете на семи картах вместо шести,
вы выиграете на $300 больше, если оппонент скидывается, а не уравнивается. Здесь
интеллект игрока может оказаться выше оптимальной стратегии по теории игр: он будет
блефовать чуть реже против оппонентов, которые уравниваются слишком часто, и
немного чаще против тех, кто слишком часто скидываются.
Хорошие игроки с развитой интуицией знают об этом. Если они замечают, что
скинулись в конце несколько раз подряд, в следующий раз они готовы уравняться. Иначе
партнёры начнут блефовать против них. Аналогичные рассуждения используются и для
принятия решения о том, стоит ли блефовать самому. Именно против таких опытных
игроков, которые уравниваются и сбрасываются точно, когда это надо, а их интеллект
достаточно высок или даже выше вашего, теория игр становится совершенным оружием.
Если вы используете ее, вас невозможно обыграть.
РЕЗЮМЕ ПО ТЕОРИИ ИГР КАК РУКОВОДСТВУ ДЛЯ БЛЕФА
При использовании теории игр для принятия решения, стоит ли блефовать, вначале вы
должны определить шансы набрать свою комбинацию. Потом вы должны определить
шансы, которые оппонент получает на этой ставке. Затем рекомендуется иногда
поблефовать так, чтобы шансы против вашего блефа были равны шансам банка
оппонента.
Вот ещё один пример. Предположим, у вас 20% шансы набрать комбинацию, в банке
$100, и ставка $25. Тогда если вы ставите, оппонент получает шансы $125 к $25 или 5 к 1.
Поскольку у вас 20-процентные шансы сделать себе комбинацию, вам нужно спонтанно
поблефовать в 4 процентах сдач. (20% к 4% равно 5 к 1.) Если вы блефуете таким
образом, у вас оптимальное преимущество в данной ситуации.
Хороший, удобный способ рандомизировать блеф, как мы уже убедились, это брать из
тех, которые вы не видите (то есть, из колоды). Если, например, десять карт делают вам
комбинацию, и вам нужно соотношение блефа 5 к 1, тогда вы должны выбрать две
дополнительные карты, на которых станете блефовать.
Вот другой пример. Вы тянете одну карту к пиковому флешу в покере с обменом, а
оппонент тянет три карты. Отсюда можно сделать вывод, что вряд ли он побьёт флеш,
скорей всего, только блеф. В банке $20. Ставка $10. Если вы ставите, оппонент получает
шансы банка $30 к $10 или 9 к 3. Поскольку девять невидимых пик делают вам флеш, вам
нужно выбрать три дополнительных карты для блефа, например, две красные 4-ки и 4
треф. Теперь вы будете делать ставку на двенадцати картах, и отношение между сдачами,
когда вы ставите на хорошей руке, и когда вы блефуете, составит 9 к 3.
Карты не всегда дают точное отношение, которое вам нужно для оптимального блефа.
Однако если оно близко к идеальному, вы всё равно можете рассчитывать на выигрыш.
Вспомним, что выбор шести карт для блефа в примере с обменным лоуболлом оказался
оптимальным относительно шансов банка, которые получал оппонент; Тем не менее, я
всё равно кое-что снял, когда блефовал на пяти и семи картах независимо от того,
уравнивался оппонент или сдавался. Но, конечно же, чем ближе вы к точному
соотношению, тем лучше, с точки зрения теории игр.
ИСПОЛЬЗОВАНИЕ ТЕОРИИ ИГР ДЛЯ ОТВЕТА НА ВОЗМОЖНЫЙ БЛЕФ
Также как вы используете теорию игр для блефа, вы можете использовать ее для
ответа на возможный блеф. Обычно, если ваша карта может побить только блеф, вы
используете ваш опыт и мнение для определения вероятности того, что оппонент
блефует. Если ваша рука может побить некоторые нормальные комбинации противника,
тогда вы делаете стандартное сравнение шансов иметь лучшую руку плюс шансов блефа
противника с шансами банка, которые вы получаете. Однако против оппонента, чье
мнение также хорошо, как ваше, или даже лучше, либо против партнёра, который
способен использовать теорию игр для блефа, вы в свою очередь можете использовать
теорию игр, чтобы помешать ему или, по крайней мере, минимизировать его дивиденды.
Предположим, в банке $100, и оппонент полагает, что вы скорее скинетесь один раз из
трёх, нежели уравняете ставку $20. Тогда для него становится выгодно блефануть,
поставить $20, чтобы выиграть $100, поскольку он рассчитывает дважды проиграть по
$20, зато другой раз отбить $100, что даёт суммарный плюс $60 и ожидание $20 со
ставки. К тому же если оппонент полагает, что вы никогда не сброситесь в этой ситуации,
он никогда не блефанёт. Следовательно, вам выгодно, чтобы оппонент думал, что вы
можете иногда сброситься, но и уравнивать следует достаточно часто, чтобы ловить его
на блефе.
Когда вы используете теорию игр для принятия решения, стоит ли уравнять
возможный блеф, вы производите расчёт аналогичный тому, который вы делаете, решая,
стоит ли блефовать самому; и вы рандомизируете свои ответы, также как вы
рандомизируете свой блеф. Вы вычисляете, какие шансы получает оппонент на своем
возможном блефе, и вы делаете отношение ваших уравниваний к сбрасываниям точно
таким же, как отношение суммы банка к величине ставки оппонента. Если оппонент
ставит $20, чтобы загрести $100, он получает 5 к 1 на блефе. Поэтому вы тоже делаете
шансы против своего сброса 5 к 1. То есть, вы должны пять раз уравняться и один раз
сдаться. В целях внесения элемента случайности (рандомизации) вы вновь можете
воспользоваться ключевыми картами: к примеру, если вы берёте определенные карты
взакрытую, вы сбрасываетесь. В противном случае уравниваете ставку.
В противоположность использованию теории игр для блефа, использование теории игр
для принятия решения о том, стоит ли уравнять ставку оппонента, не имеет такой силы,
чтобы сделать из невыгодной ситуации выгодную. Все, что достигается таким действием,
- это не дать оппоненту перехитрить себя. Если оппонент использует оптимальную
тактику блефа по теории игр, всё равно вы не можете сделать ничего, чтобы отобрать у
него преимущество.
РЕЗЮМЕ
Теория игр не может заменить хорошую голову. Ее следует применять только тогда,
когда вы думаете, что интеллект противника так же хорош или ещё лучше вашего, или
когда вы его просто не знаете. Кроме того, теория игр может правильно применяться к
блефу или ответу на возможный блеф только в ситуации, когда у ставящего, очевидно,
либо лучшая рука, либо он блефует: например, это игрок в семикарточном стад-покере,
который ставит против вашей пары тузов, явно пытаясь дотянуть флеш. Однако если
заходчик ставит на нормальной руке, которая всё-таки не является лучшей, тогда надо
применять стратегию, изложенную в главе 21 «Один на один».
Используя теорию игр для принятия решения, стоит ли блефовать, вы должны
определить шанса банка, которые получает оппонент, если вы делаете ставку, и затем
случайно блефануть таким образом, чтобы шансы против вашего блефа были равны или
почти равны шансам банка вашего оппонента. Если оппонент получит 5 к 1, шансы
против вашего блефа должны быть 5 к 1. Играя таким образом, вы не оставляете
оппоненту ни одного спасительного решения. Что бы он ни делал - уравнивался или
сбрасывался, на длинной дистанции результат его будет таким же, либо ещё хуже.
При использовании теории игр для принятия решения, стоит ли уравнивать возможный
блеф - в предположении, что ваша карта может побить только блеф, и никаких намеков
для разгадки нет, - вы должны в первую очередь определить шансы, которые оппонент
получает на блефе. Сделайте отношение ваших уравниваний к сбросам таким же, как эти
шансы. Если оппонент получает на блефе шансы 4 к 1, вы должны рандомизированно
уравняться четыре из пяти раз, чтобы сделать этот блеф невыгодным.
ТЕОРИЯ ИГР И БЛЕФ
Теория игр звучит как стратегия игры, но на самом деле это отрасль математики,
рассматривающая процесс принятия решений. Хотя она используется в играх, но также
она применима к таким дисциплинам, как экономика, международные отношения,
социология и военное дело. В сущности, теория игр пытается математически подобрать
лучшую тактику против кого-то, кто также использует лучшую тактику. Если противник,
по вашему мнению, слабее вас - а это может быть в любой игре, вы в основном
полагаетесь на свою голову, а не на теорию игр. Однако когда вы сражаетесь против
оппонента, который, возможно, лучше вас, или против кого-то, кого вы не знаете, теория
игр порой позволяет преодолеть его интеллектуальное превосходство.
Чтобы показать, как теория игр работает в данном ракурсе, возьмем детскую игру в
чет-нечет. Каждый из двух участвующих выкидывает один или два пальца. Если сумма
четная, выигрывает один, нечетная - другой. Математически это абсолютно
равновероятностная игра. Однако на длинной дистанции кто-то может получить
преимущество за счёт своей проницательности, отгадав, когда выкидывать один, а когда
два пальца, основываясь на том, что выкидывал другой раньше - иными словами, разгадав
его систему; то есть, сообразно тому, что намеревается делать оппонент, выкидывается
один или два пальца, сбивая его с толку и принося победные очки (* Отгадать мысли противника - безусловно, является краеугольным камнем покера. Смотрите главу 23 «Психология покера»).
Предположим, кто-то позвал вас сыграть в эту игру. Будучи уверенным в своей голове
и способности отгадать вас, он предлагает вам фору: $101 против $100 за игру. Положим,
вы тоже чувствуете, что вызывающий находится в предпочтительном (бестовом = the
best of it) положении. Тем не менее, используя теорию игр, вы с удовольствием примете
это предложение с уверенностью, что бестовое положение у вас. Все, что вам нужно
сделать, это найти монету; ее подброс будет решать, сколько пальцев вам показывать -
один или два.
Если, скажем, монета упадет решкой, вы показываете один палец, орлом - два. Что
дала вам эта процедура? Она полностью разрушила способность оппонента предвидеть
ваши действия. Шансы выброса вами одного или двух пальцев 50-50. Шансы падения
монеты орлом или решкой 50-50. Однако вместо того, чтобы вам думать, один или два
пальца выкинуть, за вас принимает решение монета, и самое главное - она
рандомизирует (randomizing) ваши решения, то есть, вносит в них элемент случайности.
Быть может, оппоненту удастся разгадать вас, но вы вынуждаёте его предвидеть действия
неодушевленного объекта, что само по себе невозможно. С таким же успехом можно
пытаться угадать, упадет ли шарик рулетки на красное или на черное.
Поскольку ваш оппонент ставит $101 против $100, используя теорию игр, вы
обеспечили себя 0.5-процентным математическим ожиданием (или 50-центовым
положительным ожиданием со ставки). Вы ликвидировали все преимущества, которые
оппонент мог иметь за счёт вашей предсказуемости, и обеспечили себе неоспоримое
преимущество на длинной дистанции. Только если вы полагаете, что ваша голова лучше,
чем у оппонента, лишь в этом случае вы сумеете выиграть у него «по мнению», не
используя монеты.
ИСПОЛЬЗОВАНИЕ ТЕОРИИ ИГР ПРИМЕНИТЕЛЬНО К БЛЕФУ
В этой главе нас в основном интересует, насколько теория игр может быть применима
в покере к искусству блефа и уравнивания возможного блефа. В связи с этим мы
побеседуем о смешанной стратегии, при которой вы делаете конкретный ход - а именно,
блефуете или уравниваете возможный блеф - в заранее определенном числе случаев, но
вносите элемент случайности так, чтобы оппонент не мог знать, есть ли у вас игра или
нет.
Из предыдущей главы вы помните, что при прочих равных условиях игрок, который
никогда не блефует, и тот, что блефует слишком много, имеют значительный минус перед
игроком, который блефует правильно. Для иллюстрации этого положения и того, как
теория игр может подсказать правильное решение, когда стоит блефовать, рассмотрим
конкретный пример.
Играем в лоуболл с обменом без джокера; я сдаю вам следующую готовую
комбинацию (пэт = pat): 9♣, 8♦, 3♣, 2♠, A♥, а себе K♠, 4♦, 3♥, 2♦, A♣.
Вы стоите без прикупа, я же должен поменять одну карту. Если вытягиваю 5, 6, 7, 8
или 9, то я выиграл, поскольку у меня лучший лоу (low = последовательность нижних
карт), чем ваш. Если я вытаскиваю любую другую карту, вы выигрываете. Это означает,
что из 42 карт, остающихся в колоде, для меня 18 выигрышных (четыре 5-ки, четыре 6-ки,
четыре 7-ки, три 8-ки и три 9-ки) и 24 проигрышных, что даёт мне шансы проиграть 24 к
18 или 4 к 3. Каждый из нас вносит по $100 на анте, но после обмена - который вы не
видите - я могу поставить ещё $100.
Предположим, я подвизался каждый кон делать ставку, то есть, по $100 каждую сдачу.
Естественно, каждый раз вы будете ее уравнивать, поскольку вам гарантировано выиграть
по $200 24 раза, когда я буду блефовать, и проиграть по $200 18 раз, когда у меня будет
лучшая рука, что даёт вам суммарную прибыль $1200. Теперь положим, я решил не
блефовать вообще, а ставить, только если моя карта побьёт ваш 9,8-лоу. В этом случае вы
будете скидываться всякий раз, когда я буду ставить, и снова выиграете 24 раза (когда я
не поставлю), а проиграете 18 раз (когда я поставлю), что даёт суммарную прибыль $600,
поскольку вы выигрываете или проигрываете по $100 в каждой сдаче. Поэтому при этих
двух вариантах моей игры у вас явно бестовое положение.
Однако если я блефую лишь в некоторых случаях, ситуация сильно меняется.
Предположим, буду блефовать только на короле пик. Другими словами, буду ставить,
если придёт любая из 18 хороших карт, а также на короле пик. Если я блефую настолько
редко, ваша тактика остается прежней - сбрасываться на моих ставках, поскольку шансы
против того, что я блефую, 18 к 1. Но давайте посмотрим, как изменилось мое положение.
Блеф на короле пик не прибавляет мне дивидендов, но позволяет выиграть 19 раз вместо
18, а проиграть только 23 вместо 24. Этот единственный случай блефа один раз из 19
начал сокращать разрыв между вами как фаворитом и мной как претендентом. Заметьте
также, что вы никак не можете знать, когда я блефую, поскольку я рандомизирую свой
блеф, используя карту - неодушевленный предмет, такой же, как монета в игре чет-нечет,
- для выбора решения, блефовать или нет.
Если блеф на одной карте делает меня менее уязвимым, чем вовсе без него, теперь
представим, что я выбрал две карты - скажем, короля пик и валета пик. И опять
правильной тактикой для вас будет скидываться, когда я ставлю. Предположив, что вы
никак не можете догадаться, когда я блефую а когда нет, использование всего двух
ключевых карт для блефа в дополнение к моим 18 хорошим картам сократило ваши
выигрышные шансы с 24 к 18 до 22 к 20, то есть с 4 к 3 до 11 к 10.
Такой блеф наводит на размышление, что его можно продолжить. Положим, вместо
двух карт я выбираю пять ключевых карт - короля пик и все четыре валета. Это значит, я
буду ставить 23 раза - 18 раз на лучшей руке и пять раз на блефе. И сразу же вы
оказываетесь в нехорошем положении, несмотря на ваш пэт 9,8, поскольку вам
приходится гадать, блефую я или нет, когда делаю ставку. Я даже могу рассказать вам в
точности тактику, которую я использую, но вы всё равно выгуждены будете терять
деньги.
Что получилось? Вы знаете, что есть 18 карт, дающих мне комбинацию, и пять других,
с которыми я буду блефовать. Таким образом, шансы против моего блефа составляют 18 к
5 или 3.6 к 1. С учётом $200 на анте и моей ставки $100 банк составляет $300. Так что вы
получаете шансы банка 3 к 1. Поэтому вы не можете выгодно уравнять шансы победного
прихода 3.6 к 1, так как выиграете максимум только 3 к 1. Подумать только: выбрав пять
карт для блефа, я сорву банк 23 из 42 раз, а вам останется всего 19. Мой доход составит
$400. Таким образом, этот случайный хаотичный блеф превратил руку с потенциальным
проигрышем 24 к 18 в выигрышную с шансами 23 к 19.
Если хотите убедиться, что здесь нет арифметического подвоха, можете просчитать,
что получится, если вы будете уравнивать каждый раз, когда я буду ставить. Вы
выиграете пять раз по $200 на моем блефе и 19 раз по $100, когда я буду ставить, что даёт
$2900. Но вы проиграете 18 раз по $200, когда у меня лучшая рука, что равняется $3600.
Ваш суммарный проигрыш в случае уравнивания моих ставок составит $700, что на $300
больше, чем вы проиграли бы, если бы просто сбрасывались, когда я ставлю.
Если бы я выбрал семь карт для блефа вместо пяти, шансы были бы 18 к 7 против
блефа, и поскольку вы получаете шансы банка 3 к 1, вам бы надо было уравниваться,
когда я ставлю. Однако это всё равно закончилось бы проигрышем! Семь раз, когда я
блефую, вы бы выиграли по $200 от меня, что даёт $1400, и 17 раз, когда я ничего не
ставлю, вы бы выиграли по $100, что равняется $1700. Ваш выигрыш после 42 сдач
составит $3100. А я выиграю 18 раз по $200, когда поставлю на хороших картах, в сумме
$3600, что обеспечивает мне в итоге выигрыш, а вам проигрыш $500 после 42 сдач.
Следует отметить - без дураков, никаких арифметических подставок тут нет, - что вы
теряете даже больше, если будете сбрасываться кажддый раз, когда я ставлю на 18
хороших и семи блефовых картах. Вы выиграете 17 раз по $100, когда я не буду ставить,
тогда как я выиграю по $100 25 раз, когда поставлю. В таком случае ваш суммарный
проигрыш составит $800 вместо $500.
ОПТИМАЛЬНАЯ СТРАТЕГИЯ БЛЕФА
Предположим, я выбираю шесть ключевых карт для блефа. Это означает, что я сделаю
ставку 24 раза. 18 из них у меня лучшая рука, а шесть раз я блефую. Следовательно,
шансы против моего блефа ровно 3 к 1. В банке $200, и если я поставлю, станет $300.
Таким образом, ваши шансы банка также 3 к 1. Вы уравниваете $100, чтобы выиграть
$300. Теперь, когда шансы против моего блефа идентичны шансам, которые вы получаете
из банка, нет абсолютно никакой разницы, будете ли вы уравниваться или сбрасываться.
Более того, что бы вы ни делали, вы всё равно проиграете $600 после 42 сдач. Если вы
сбрасываетесь каждый раз, когда я ставлю, я выиграю у вас 24 раза по $100, когда я
ставлю, и потеряю 18 раз по $100, когда не ставлю; суммарный выигрыш $600. Если вы
каждый раз уравниваете мою ставку, вы возьмёте у меня шесть раз по $200 на блефе и 18
раз по 4100, когда я не ставлю, в сумме $3000; но я выиграю у вас 18 раз по $200, когда
поставлю на хороших руках, что в сумме равняется $3600. И вновь моя прибыль
составляет $600. Поэтому, кроме психической атаки, нет другого способа в мире не дать
мне выиграть эти $600 после 42 сдач, что даёт мне положительное ожидание 14.29 со
сдачи. Блефуя ровно шесть раз из 24, я превратил свои карты из проигрывающих 4 к 3,
когда я не блефовал совсем, в выигрышные 4 к 3 - независимо от стратегии, которую вы
изберёте против меня.
Мы приближаемся к основе основ теории игр и блефа. Заметим для начала, что
процент сдач, в которых я блефовал, был определён заранее: один раз из 19 ставок, пять
раз из 23 или семь из 25. Далее отметим, что блеф был совершенно случаен; сигналом для
него служили определенные ключевые карты, которые я брал из колоды и которые мой
оппонент никак не мог увидеть. Он никогда не мог знать наверняка, вытащил ли я одну из
18 хороших или карту для блефа. И, наконец, заметим, что произошло, когда я блефовал
ровно с шестью картами - когда шансы против моего блефа в данном конкретном случае
точно равнялись шансам банка, которые получал оппонент. В этом единственном случае
было предрешено, что оппонент теряет одинаковое количество денег, какую бы тактику
он ни избрал - уравнивание или сброс.
Это оптимальная стратегия блефа - когда нет разницы, как играет противник. Значит,
можно сказать, что если вы используете стратегию блефа, которая заставляет оппонента
поступать одинаково плохо, как бы он ни играл, это и есть оптимальная стратегия. И эта
оптимальная стратегия заключается в том, что вы блефуете так, чтобы шансы против
вашего блефа в точности равнялись шансам банка, которые получает оппонент. В
ситуации, которую мы обсуждали, у меня было 18 хороших карт, и когда я поставил свои
$100, доведя банк до $300, оппонент получал 3 к 1 из банка. Следовательно, оптимальной
стратегией был блеф на шести дополнительных картах, что делало шансы против блефа 3
к 1 - идентично шансам банка, которые получал оппонент.
Предположим, что банк бы равнялся $500 вместо $200 до того, как я сделал ставку.
Вновь я имел бы 18 выигрышных карт, а оппонент мог побить только блеф. Ставка $100,
поэтому оппонент получал бы шансы банка $600 к $100, когда уравнял мою ставку. В
данном случае оптимальной стратегией для меня был бы блеф на трёх картах. С 18
хорошими картами и тремя блефовыми шансы против блефа были бы 6 к 1 - идентично
шансам банка, которые получал оппонент, прими он мою ставку. Если же в банке было
бы $100, и я поставил бы $100, я должен был бы блефовать на девяти картах при 18
хороших, что делало шансы против блефа 2 к 1 идентичными шансам, которые оппонент
получал с банка.
Важно сознавать, что если результат одинаков незавимо от того, как играет оппонент -
уравнивается он или сбрасывается, в среднем у вас всё равно будет получаться одна и та
же сумма, даже если он будет перемежать сброс с уравниванием. Возвращаясь к
первоначальному примеру оптимальной стратегии, где я блефую с шестью картами по
$100 и делаю такую же ставку на 18 хороших картах в банк, равный $200, я всё равно в
среднем получу плюс $600 через 42 сдачи на длинной дистанции независимо от того,
уравняет ли оппонент 12 и сбросит столько же раз, или же он уравняет 6 раз, а сбросит 18,
или как угодно ещё. Невозможность найти какое-либо противодействие для устранения
своего убыточного положения является ключом ко многим проблемам теории игр, хотя
большинство книг по теории игр не дают такой формулировки.
Блеф на основе теории игр можно также расписать в процентах. Предположим, у вас
25-процентные шансы набрать комбинацию, в банке $100, и ставка $100. Таким образом,
если вы поставите, оппонент получает шансы банка 2 к 1. Поскольку шансы сделать руку
у вас 25%, вероятность того, что вы блефуете, должна быть 12 ½ процентов, что делает
шансы против блефа равными 2 к 1, что и есть оптимальная стратегия. К примеру, в
обменном лоуболле 48 карт вам неизвестны, когда вы тянете одну, и предположим, 12 из
них (25 процентов) дают вам комбинацию. Поэтому для блефа следует избрать шесть
других карт (12 ½ процентов) из 48.
Вы назначаете карты для блефа, конечно же, для того, чтобы рандомизировать ваши
ставки. Без этого фактора случайности хорошие противники, на которых вы примените
теорию игр в отношении блефа, быстро разгадают вашу систему и сотрут вас в порошок.
Красота и изюминка теории игр состоит в том, что если даже оппонент знает, что вы ее
используете, он всё равно ничего не может с этим поделать.
ТЕОРИЯ ИГР И ЧАСТОТА БЛЕФА В СООТВЕТСТВИИ С ПОВЕДЕНИЕМ ОППОНЕНТОВ
В реальных покерных ситуациях оптимальная стратегия на основе теории игр не
всегда правильна. Очевидно, если вы боретесь с противником, который почти всегда
уравнивает ваши ставки, тогда не стоит блефовать вообще. Если же вам встретится
противник, который слишком часто скидывается, тогда стоит поблефовать, естественно,
зная меру.
Теория игр подтверждаёт эти тактические вариации. Вспомним: в первой части этой
главы говорилось, что если вы блефуете на пяти картах вместо шести - то есть чуть
меньше оптимума, за 42 сдачи вы выиграете на $300 больше, если оппонент все время
уравнивается, а не сбрасывается. Однако если вы блефуете на семи картах вместо шести,
вы выиграете на $300 больше, если оппонент скидывается, а не уравнивается. Здесь
интеллект игрока может оказаться выше оптимальной стратегии по теории игр: он будет
блефовать чуть реже против оппонентов, которые уравниваются слишком часто, и
немного чаще против тех, кто слишком часто скидываются.
Хорошие игроки с развитой интуицией знают об этом. Если они замечают, что
скинулись в конце несколько раз подряд, в следующий раз они готовы уравняться. Иначе
партнёры начнут блефовать против них. Аналогичные рассуждения используются и для
принятия решения о том, стоит ли блефовать самому. Именно против таких опытных
игроков, которые уравниваются и сбрасываются точно, когда это надо, а их интеллект
достаточно высок или даже выше вашего, теория игр становится совершенным оружием.
Если вы используете ее, вас невозможно обыграть.
РЕЗЮМЕ ПО ТЕОРИИ ИГР КАК РУКОВОДСТВУ ДЛЯ БЛЕФА
При использовании теории игр для принятия решения, стоит ли блефовать, вначале вы
должны определить шансы набрать свою комбинацию. Потом вы должны определить
шансы, которые оппонент получает на этой ставке. Затем рекомендуется иногда
поблефовать так, чтобы шансы против вашего блефа были равны шансам банка
оппонента.
Вот ещё один пример. Предположим, у вас 20% шансы набрать комбинацию, в банке
$100, и ставка $25. Тогда если вы ставите, оппонент получает шансы $125 к $25 или 5 к 1.
Поскольку у вас 20-процентные шансы сделать себе комбинацию, вам нужно спонтанно
поблефовать в 4 процентах сдач. (20% к 4% равно 5 к 1.) Если вы блефуете таким
образом, у вас оптимальное преимущество в данной ситуации.
Хороший, удобный способ рандомизировать блеф, как мы уже убедились, это брать из
тех, которые вы не видите (то есть, из колоды). Если, например, десять карт делают вам
комбинацию, и вам нужно соотношение блефа 5 к 1, тогда вы должны выбрать две
дополнительные карты, на которых станете блефовать.
Вот другой пример. Вы тянете одну карту к пиковому флешу в покере с обменом, а
оппонент тянет три карты. Отсюда можно сделать вывод, что вряд ли он побьёт флеш,
скорей всего, только блеф. В банке $20. Ставка $10. Если вы ставите, оппонент получает
шансы банка $30 к $10 или 9 к 3. Поскольку девять невидимых пик делают вам флеш, вам
нужно выбрать три дополнительных карты для блефа, например, две красные 4-ки и 4
треф. Теперь вы будете делать ставку на двенадцати картах, и отношение между сдачами,
когда вы ставите на хорошей руке, и когда вы блефуете, составит 9 к 3.
Карты не всегда дают точное отношение, которое вам нужно для оптимального блефа.
Однако если оно близко к идеальному, вы всё равно можете рассчитывать на выигрыш.
Вспомним, что выбор шести карт для блефа в примере с обменным лоуболлом оказался
оптимальным относительно шансов банка, которые получал оппонент; Тем не менее, я
всё равно кое-что снял, когда блефовал на пяти и семи картах независимо от того,
уравнивался оппонент или сдавался. Но, конечно же, чем ближе вы к точному
соотношению, тем лучше, с точки зрения теории игр.
ИСПОЛЬЗОВАНИЕ ТЕОРИИ ИГР ДЛЯ ОТВЕТА НА ВОЗМОЖНЫЙ БЛЕФ
Также как вы используете теорию игр для блефа, вы можете использовать ее для
ответа на возможный блеф. Обычно, если ваша карта может побить только блеф, вы
используете ваш опыт и мнение для определения вероятности того, что оппонент
блефует. Если ваша рука может побить некоторые нормальные комбинации противника,
тогда вы делаете стандартное сравнение шансов иметь лучшую руку плюс шансов блефа
противника с шансами банка, которые вы получаете. Однако против оппонента, чье
мнение также хорошо, как ваше, или даже лучше, либо против партнёра, который
способен использовать теорию игр для блефа, вы в свою очередь можете использовать
теорию игр, чтобы помешать ему или, по крайней мере, минимизировать его дивиденды.
Предположим, в банке $100, и оппонент полагает, что вы скорее скинетесь один раз из
трёх, нежели уравняете ставку $20. Тогда для него становится выгодно блефануть,
поставить $20, чтобы выиграть $100, поскольку он рассчитывает дважды проиграть по
$20, зато другой раз отбить $100, что даёт суммарный плюс $60 и ожидание $20 со
ставки. К тому же если оппонент полагает, что вы никогда не сброситесь в этой ситуации,
он никогда не блефанёт. Следовательно, вам выгодно, чтобы оппонент думал, что вы
можете иногда сброситься, но и уравнивать следует достаточно часто, чтобы ловить его
на блефе.
Когда вы используете теорию игр для принятия решения, стоит ли уравнять
возможный блеф, вы производите расчёт аналогичный тому, который вы делаете, решая,
стоит ли блефовать самому; и вы рандомизируете свои ответы, также как вы
рандомизируете свой блеф. Вы вычисляете, какие шансы получает оппонент на своем
возможном блефе, и вы делаете отношение ваших уравниваний к сбрасываниям точно
таким же, как отношение суммы банка к величине ставки оппонента. Если оппонент
ставит $20, чтобы загрести $100, он получает 5 к 1 на блефе. Поэтому вы тоже делаете
шансы против своего сброса 5 к 1. То есть, вы должны пять раз уравняться и один раз
сдаться. В целях внесения элемента случайности (рандомизации) вы вновь можете
воспользоваться ключевыми картами: к примеру, если вы берёте определенные карты
взакрытую, вы сбрасываетесь. В противном случае уравниваете ставку.
В противоположность использованию теории игр для блефа, использование теории игр
для принятия решения о том, стоит ли уравнять ставку оппонента, не имеет такой силы,
чтобы сделать из невыгодной ситуации выгодную. Все, что достигается таким действием,
- это не дать оппоненту перехитрить себя. Если оппонент использует оптимальную
тактику блефа по теории игр, всё равно вы не можете сделать ничего, чтобы отобрать у
него преимущество.
РЕЗЮМЕ
Теория игр не может заменить хорошую голову. Ее следует применять только тогда,
когда вы думаете, что интеллект противника так же хорош или ещё лучше вашего, или
когда вы его просто не знаете. Кроме того, теория игр может правильно применяться к
блефу или ответу на возможный блеф только в ситуации, когда у ставящего, очевидно,
либо лучшая рука, либо он блефует: например, это игрок в семикарточном стад-покере,
который ставит против вашей пары тузов, явно пытаясь дотянуть флеш. Однако если
заходчик ставит на нормальной руке, которая всё-таки не является лучшей, тогда надо
применять стратегию, изложенную в главе 21 «Один на один».
Используя теорию игр для принятия решения, стоит ли блефовать, вы должны
определить шанса банка, которые получает оппонент, если вы делаете ставку, и затем
случайно блефануть таким образом, чтобы шансы против вашего блефа были равны или
почти равны шансам банка вашего оппонента. Если оппонент получит 5 к 1, шансы
против вашего блефа должны быть 5 к 1. Играя таким образом, вы не оставляете
оппоненту ни одного спасительного решения. Что бы он ни делал - уравнивался или
сбрасывался, на длинной дистанции результат его будет таким же, либо ещё хуже.
При использовании теории игр для принятия решения, стоит ли уравнивать возможный
блеф - в предположении, что ваша карта может побить только блеф, и никаких намеков
для разгадки нет, - вы должны в первую очередь определить шансы, которые оппонент
получает на блефе. Сделайте отношение ваших уравниваний к сбросам таким же, как эти
шансы. Если оппонент получает на блефе шансы 4 к 1, вы должны рандомизированно
уравняться четыре из пяти раз, чтобы сделать этот блеф невыгодным.