実はこれシリアスなBlackjackプレーヤーにとってはおなじみの、”risk of
ruin”の式である。Blackjackの上級プレーヤーであるカードカウンターの場合、毎回の勝率pは0.5よりわずかに大きい。彼の最初の持ち金はaであり、毎回1単位づつのチップを賭けて勝負を行いbの収益を上げることを目標とする。この場合に、bの収益を上げる前に有り金を全部失ってしまう確率(リスク)はどの程度になるのかというのが彼らの関心事であり、それを算出するために上の式を用いるのである。
また、まずrisk of ruinがより一般的な形ではどのように算出されるかについて知りたい場合は、Epsteinの古典The
Theory of Gambling and Statistical Logic”を参照されたい。また、Blackjackの場合のrisk of
ruinをより正確に計算するためには様々な修正が必要となってくる。これついては、Peter Griffinの”The
Theory of Blackjack”に記述がある。またBJmath.com内にあるpdf ”The evaluation of Blackjack
Games using a Combined Expectation and Risk
Measure”にもBlackjackのrisk計算とその歴史に関する詳細な記述があり、好事家には超お勧めである。これらを読むのがちょっと大変だという方には、Ken
Ustonの”Million
Dollar Blackjack”が、比較的平易な記述である。また、”risk of
ruin”の考え方は「最終的に目標を達成するか破産するか」という確率だけではなく、「あるゲーム数以内で破産するか否か」という確率にも考えを拡張することが可能である。このような確率は、コンプのために$200×10時間のプレーが要求される場合に準備するべきバンクロールの量や、オンラインカジノ等のボーナス条件をクリアするために必要な資金量等を算出するときに重要となってくる。WizardofOddsにはそのための簡易計算表が掲載されている(BJモデル)。
更に余談だが、この式はBlackjack PlayerにとってはおなじみのKelly基準(Kelly’s
Criteria)、即ち、「プレーヤーにとってx%の有利な賭け(収益の期待値がx%となる賭け)があれば、その賭けに対してはバンクロールのx%を賭けることが、収益を最大化する」という原理と密接な関係がある。Kelly基準について日本語で丁寧に解説してあるサイトもあるのでこれも参考にすると良いと思う。
最後にA, B二人のプレーヤーのスキルに優劣がある場合について見てみよう。上述のrisk
of ruinの式を利用するために以下のようにモデル化する。 A,B共にb枚のチップを持っている(チップ総量は2b)。毎回の勝負で、それぞれ1枚づつのチップを賭けるが、Aの方がBより少しだけ勝率が良い(即ちp>1/2)。
このように眺めると、チップの増減の仕方はヘッズアップの場合と全く同じであり、Aの戦いが終了するのはチップがTに増えた場合(優勝)か、0になった場合(2位、3位、4位…..)のいずれかである。従って優勝する確率はa/Tとなる。また優勝しない確率は(T-a)/Tとなる。但し、Aが2位になったのか3位になったのかと言ったことは分からない。であるにも関わらず3人以上のプレーヤーが残っている場合に対しても、「優勝確率が持ちチップ量に比例する」ことだけは分かるのである。
不思議と言えば不思議であるが、このことは直感的には納得しやすいので、Mason
MalmouthのGambling
Theory and Other Topics等でもその理由が説明されていない。が、その理屈は実はそう単純ではなく、実はrisk of
ruinの応用としてはじめて納得しやすい形で上のように説明出来る訳である。
今回は、前回の拡張で、まず3人のプレーヤーの場合をまず考える。トーナメントポーカーのチップの合計量は常に一定値であるので、3人のプレーヤーのチップ量の推移を表すのに図(a)のような三角グラフ(三角ダイアグラム)が良く用いられる。この図の場合、総チップ量は8であり、最初の時点(図中のS)での持ちチップ量はA,Bが3、Cが2となる。また、前回仮定したのと同じ「ヘッズアップでぶつかり1勝負での増減は±1」とすると、
ハンド毎に図(b)のように、誰と誰がぶつかったのかとその勝敗に応じて、一つだけ隣のマスに等確率で進む。勝負が進んで行くと、いずれ辺AB,BC,CAのいずれかに到達するが、これはあるプレーヤーが飛んだことを意味する。図(a)では辺AB上の点Tに到達しているが、これはCが最初に飛び(従って3位になった)、その時点でAのチップ量は3、Bのチップ量は5であったことを意味している。この後はA,Bのみの戦いになるので辺AB上での動きになり、(その2)で扱ったヘッズアップの場合となる。最終的に、先に点Aに到達すればAの優勝、点Bに到達すればBの優勝である。ついでに、前回の話をこの図を用いて再度説明しておく。Aのチップ量の増減はBC間のヘッズアップの勝敗の行方には関係ないので、ちょうどこの三角形を横から見た形になる。するとAのチップは1/2の確率で1単位増え、1/2の確率で1単位減るという動きをする。最終的には先に全部のチップ(8)を獲得するか、0になるかであり、それぞれの確率はrisk
of ruinの式で求められるという訳である。但し、チップが0になった場合には、三角グラフ上では辺BC上のどこかに到達しているのであるが、それが点B(Bが優勝なのでAは2位)なのか、点C(C優勝でAが2位)なのか、あるいは点B,C以外の辺BC上の点(Aが3位)なのかまでは求まらない。
また、このケースの非常に特殊な場合で、チップ総量が非常に大きい場合に、辺BCに最初に到達する確率を求めたのが Tom Fergusonの"Gambler’s
ruin in three dimensions"である。 この場合、図(c)に示すように、最初の持ちチップ量からスタートして非常に細かく不規則に動いて行く(2次元のブラウン運動と呼ばれているもの)点Sが、(辺AC,BCに触れる前に)正三角形の辺ABと最初に触れる確率を求めることになる。非常に巧妙な技法で計算されているが、それを説明するためには莫大な説明と知識が必要となるので、ここでは省略する(複素関数・等角写像を知っていれば理解出来ます)。
McEvoy モデル
Tom McEvoyのTournament
Pokerに書かれているディールの方法である。
まず、すべてのプレーヤーに対して、がその時点での最下位の賞金を配分する。その上で、残りの賞金をチップ量に比例した形で分ける方法。またこの方法が広く一般的にも行われているという記述もある。
実は(その2)述べたように、この方式はヘッズアップの場合においては理論値と一致する。しかしながら3人以上のプレーヤーの場合にはチップリーダーに厚すぎるディールとなり、1位賞金以上の賞金を得てしまう場合が出て来てしまう。例えば3人のプレーヤーが残っており、1位が10万ドル、2位が4万ドル、3位が2万ドルの賞金とする。まず3人のプレーヤーに2万ドルが与えられる。残りの10万ドルをチップ量に比例して配分するわけだが、チップリーダーが80%のチップ量を持っていれば、10万ドル×80%で8万ドルの追加配分。2万+8万で合計配当は10万ドルと、1位賞金と同額となってしまう。チップ量が80%より大きければ、なんと1位賞金を上回る額を配分することになってしまう訳である。これは、言い換えれば1位となる確率が1より大きいと計算されてしまうということになる。
このようなことからBozemanのスレでは、McEvoyモデルをゴミとして一蹴しているが、同書を詳しく読むと「チップ量が大きいほど、チップの価値は少なくなりチップ量が小さいほどチップの相対的価値は増える。そこで、このようなディールの方法よりも下位プレーヤーに多めに配分することも良く行われる」とも書かれており、具体的な計算式はわからないながらも当時のトーナメントプレーヤー達も、少なくとも感覚的にはもう少しチップの少ないプレーヤーに対して多く配分することが公平だと思っていたことがうかがい知れる。また、一般的にはICMはMason
MalmouthがGambling Theory and Other
Topicsで初めて紹介されたとされて来たが、Bozemanによればそれ以前から知られていた手法であるとのことなので、当時のトーナメントサークルの中でもICMのようなディールの方法知っていた人がポツポツといたのかも知れない。
Weitzmanモデル
このモデルでは、残ったプレーヤーの中で最下位の者が飛んだ場合にそのチップは残りのプレーヤーに均等に分配されるという仮定して確率計算を行う(但し多元連立方程式をなんども解く手間が必要)。Gambling
Theory and Other Topicsの中でWeitzmanが提唱している方式であり、かつ同書の中ではICMよりも「厳密な」計算だとしているが、実はBozemanの計算によると、この仮定は少しショートスタックに有利になりすぎる傾向がある。
上記の分析や前回の厳密手法との比較から、Bozemanは近似計算手法としてはICMが最適であるとしている。また、ICMはその後多くの人間からの支持を得、今ではICMが標準的なトーナメントの順位確率計算手法として認知されるに至っているのである。
ショートスタックがプリフロップでオールインした後は、このプレーヤーが飛ぶ確率を出来るだけ高くするために、特にサイドポットが非常に小さい場合には後のラウンドは全てチェックチェック(check
it
down)で回すべきであるという考え方が広く一般に信じられている。しかし、この考え方は少なくともICMの観点からは間違いである状況の方が多い。 この戦術が有効となるためには、チェックで回す方がプレーヤーの期待値が高くならなければならない。チェックチェックで回すと当然ショートスタックが飛ぶ確率は高い。しかしながら、チェックで回せば、残っている他のプレーヤーがサイドポットのみならずメインポットを得る可能性が出てくる。当然このポットに対する自分の期待値は減少する。従ってチェックで回すことは通常のライブゲームにおいては、少なくとも期待値の観点からは誤ったプレーである。
一方、トーナメントの場合には、確かに前回のグラフから分かるように自分の持ちチップ量が同じであっても残り人数が少ないほど期待値は大きくなる。即ち、トーナメントにおいてはプレーヤーが一人飛ぶことによって自分の期待値は上昇する。従ってチェックチェックで回すべきかどうかは、この両方の効果を総合した期待値で考えるべきである。ここでグラフを再度良く見てみよう。プレーヤーが10人〜6人の場合にはグラフがほとんど重なっているので、プレーヤーが飛ぶことによる期待値の上昇分は極くわずかなのである。一方、残り人数が6人から5人、5人から4人と入賞に近くなると期待値の上昇がある程度見込める。また4人から3人、3人から2人の場合にはかなり大きい期待値の上昇となる。 今度は自分の持ちチップ量に注意して見ると、ラージスタックの場合は、(概ね持ちチップが700以上の場合)プレーヤーが飛んでも期待値の上昇は相対的に少なくなる。 即ち、チェックチェックで回すことが得になるのは「入賞間近あるいは、飛ばすことにより、より大きな入賞賞金が確定する場合であり、かつ自分自身のチップ量も比較的小さい場合」となる。David
SklanskyのTournament
Poker for Advanced Playersにも ”The only time they(=チェックチェックで回すこと) have some merit
is at the very end of the tournament. And even then, only when you have
a moderately small stack yourself. In those cases, his elimination can
add quite a bit to your EV, which might indicate that you play less than
what would normally be optimal, in order to increase the chances of that
elimination.”と全く同じ記述がある。言い換えれば、ここでSklanskyが言っていることをS&Gの場合に定量的に図示したものが前回のグラフなのである。(Sklanskyも裏でこういう計算をしているはず)
チェックで回すべきか否かは、メインポット・サイドポットの大きさ、残り人数、自分のチップ量に依存するので実際の現場で瞬時に判断することは難しいかも知れないが、期待値上昇の効果の方は前回のグラフの通りであるので、凡その傾向で良いのでこのグラフを覚えておけば大体の判断は出来るであろう。 但し、トーナメントの場合は”avoid
close
gamble”という考え方もあるので、必ずしもライブゲームと同じプレーが最適であるとは限らない。ベットしたとしても、オールインプレーヤーをフォルドさせることは出来ないのであるから、ベットによる勝率の向上はオールインプレーヤーがいない場合に比べて限定的である。例えばショートオールインプレーヤーがタイトなプレーヤーであって、BBが回ってくるまでまだ数ハンドは選択肢がある状況であり、かつ既にコールしたプレーヤーがいるにも関わらずショートオールインしてきたような状況ではこのプレーヤーのハンドは相当良いと考えるべきであろう。このような場合で、フロップが絵札やAばかりで、自分のハンドともマッチしなかったとしよう。この状況ではオールインプレーヤーの勝率はかなり高いと考えられるので、他のプレーヤーを後のラウンドでフォルドに追い込めても自分の勝率の向上はわずかであることが推定出来る。従ってチェックを前提に考えてもよかろう。一方、ショートスタックがブラインドで自動オールインの場合はランダムハンドであるから、他のプレーヤーを下ろすことによる自分の勝率の向上の程度は大きいと考えられるのでベット十分であろう。
ここで注目すべきは、曲線ML(元の曲線)は上に凸であるため、常に線分MLより上側に来るということである。仮にp=1/2、即ちPocket pair
vs. Two over
cardsであるとすると、プレーヤーAの表面的なチップの期待値はじゃんけん勝負をしようがしまいが$200であるので点Sと点Kの横軸上の値は等しい。しかしながら点Kのy座標は必ず点Sより大きいのである。即ち直感的には、p=1/2の五分五分のじゃんけん勝負をした場合、ICM的期待値もじゃんけんしようがしまいが変わらないと考えてしまいがちであるが、実は不思議なことになじゃんけんすることによりICM的期待値が減るのである。 なお、ICM的期待値が元の点Kと同じ(=勝負をしてもICM的期待値が変動しない)ポイントをグラフ上で求めるには、Kからx軸方向に引いた直線と線分MLの交点Tを求めれば良い。このときICM的期待値が元の$20を上回るために必要な勝率はMT/MKで求められる。 なお、このグラフは「一人のプレーヤーを除いて持ちチップ量は等しい」として描いたものであるので、一般的なその他の場合には凡その傾向を表すに過ぎない。例えば、激しくじゃんけんでぶつかったAとB以外のプレーヤーのICM的期待値はわずかではあるが増加しなければならないが(そうしないとA,Bの期待値が減った分が相殺されない)、グラフだけではその効果は視覚的に表現されない。
「寝てるだけで期待値が増加する」という戦略は、無意味に荒っぽいプレーヤーが多数いるfree
playや非常に低いレートのトーナメントで経験的に用いている方も多いと思うが、今回説明した現象はこの戦略の正当性を主張するための補強材料にもなっている。もっとも、現実のトーナメントの後半ではBlindとanteが大きくなってくるので、寝てるだけではチップを削られるだけだし、5分5分の勝負でもICM的期待値で得をする局面も多いが、逆に入賞が近づけば近づくほど今回紹介した効果も大きくなることにも注意すべきであろう。この辺りの構造を理解した上で、トーナメント後半の生きるか死ぬかの立ち振る舞いを非常に詳しく実践例を踏まえて紹介しているHarringntonの本の第2部Harrington
on Hold'em: Expert Strategy for No-Limit Tournaments: The Endgameを読めば、より深く楽しむことが出来ると思う。