トーナメントにおけるチップの価値


日本ではあまり知られていない話ですが、トーナメントにおける残りチップの量が多ければ多いほど、表面的なチップの価値より実際のチップの価値は小さくなります。逆に、チップの量が少ないプレーヤーが持ってるチップの価値は表面的な価値より大きくなります。このことについて、シリーズ物で書いたものを整理して残しておきます。前半は理論的な分析が好きなタイプの人向けの読み物として、後半はトーナメントプレーヤーの人が、思考の幅を広げるために役に立つ物と思います。(なおいくつかのpdfやhtmlファイルは直接リンクするのではなく、当サイト下にコピーしたものにリンクしています。貴重な資料をrespectし、これらが散逸しないためのミラーであるという趣旨ですが、勿論問題があれば消します)

トーナメントにおけるチップの価値(その1):まずはわかりやすい理屈

既に色々な所で語られているように,「ショートスタックになればなるほどチップ1枚あたりの価値は増加する」ということが理論的にも知られている.(へろ氏のblog参照).即ち,「我慢のサバイバルプレーが吉」ということになる. このことは直感的に納得出来ない人もいるかも知れないので、まずは分かりやすい例を示す。

 10名のシングルテーブルトーナメントで、buy inが一人$10 、それに対してトーナメントチップが$10与えられるとする。(典型的なSit & Go型の1テーブルトーナメントの設定)。また、入賞賞金は1位$52, 2位$30, 3位$18とする。残り5名の状況でプレーヤーAの持ちチップが$60、その他のプレーヤーの持ちチップはそれぞれ$10であるとする。

 このとき
・いかなる状況であっても5人の賞金期待値の合計は$100である。(賞金の合計が$100なので当たり前)

・1位賞金は$52なのでAの賞金期待値は$52を超えることはない。

(別の言い方をしてみる。プレーヤーAが途中でトーナメントを中断せざるを得なくなり、トーナメントをプレーする権利を「大名プレーを楽しんでみたい」誰かに売るとする。このとき、Aの目の前には$60のチップがある訳だが、この後幾らがんばっても最大で$52の賞金しか得られないのであるから、$52以上出す人はいるまい。(損得に関係なく「大名プレーを楽しみたい」という奇特な人物がいれば別ではあるが。。。。)

・従って、その他のプレーヤーの賞金期待値の合計は最小でも$100-$52=$48以上ある。

・その他のプレーヤーの持ちチップ量は等しいので、一人辺りの賞金期待値は$48/4=$12以上と考えるのが妥当。

(Aに代わってプレーする権利の価値が、最大で$52しかないのであるから、A以外のプレーヤーに代わってプレーする権利の価値は$48/4=$12ないと計算が合わない。但し、ショートスタック4名のチップ量がほぼ同等でありスキルやプレースタイルが同等であるとしても、ラージスタックのアクションを見てから判断できるかどうかというポジションの有利不利は厳然と存在するのでショートスタック4名の期待値には実際にはかなりの凸凹が生じると思われる。)

 即ち、ショートスタックの4人のプレーヤー(小動物達)は$10しかもっていないにも関わらず、$12以上の期待値(額面に対し20%以上の増加)。ラージスタック(猛獣)は$60も集めたのに$52以下の期待値しかなくマズー(額面に対し13.3%の損)となっている。

 上の事実はどのような仮定をおいたとしても常に成り立つ。従って、巷間良く言われるような「Aは見下ろしプレーが出来るので圧倒的に有利である」というAの戦術上のアドバンテージを考慮してもなお、ラージスタックの場合はチップの価値は額面より目減りする(=ショートスタックの場合は額面より上昇する)という効果は厳然として存在する訳である。(このことを念頭に置くと、小動物スタイルというのは理に適った戦法であると思う。) それでもなお、現実的な値以上にラージスタックが有利に体感してしまう一つの理由は、Aが賞金を得る「期待値」と「確率を」を峻別していないことにあると思われる。ラージスタックであれば優勝する「確率」はショートスタックより大きいのは非常に当たり前であるのでラージスタックがそのまま逃げ切ることもトーナメントでは当然良くある。だからと言ってラースタックであるプレーヤーAの期待値がチップの額面を超えることはない。 

 以上は簡単な例であったが,チップ1枚あたりの価値は具体的にはどのようにして計算するのか?と言った理論的な点や,どのように実際の戦略に適用して行くべきかと言った点を考えると非常に奥深い話となる.特に英語の掲示板やポーカートーナメントの解説記事の中で,最近ICM "Independent Chip Model"という用語が良く使われているが,これがよく分からないと言った方にも役立つコラムなのでこれにも触れる. 以下、その2〜その6は主に計算のための説明なので読み飛ばすのも可能。その7以降は実戦的な話になっているので全てのシリアスプレーヤーに読んで欲しい。


トーナメントにおけるチップの価値(その2):ヘッズアップの場合


 しばらくは戦略論を考えるに当たっての基本的となる確率論的な話を中心に書いていく。これを踏まえた上でどのような戦略を取るべきかについては、全く別の次元の話であるので後回しにする。

 今回は、ヘッズアップの状況で、それぞれのプレーヤーの持ちチップ量が与えられた場合に優勝する理論的な確率の計算方法を紹介する。プレーヤーAとBが戦っているとしてAの持ちチップ量をa、Bの持ちチップ量をbとする。また、1回の対戦で勝った方のチップ量は1増え、負けた方のチップ量は1減るとする。(即ちポットの大きさが毎回1+1=2であるということ)。毎回の勝負でAが勝つ確率はp, Bが勝つ確率は1-pとし、引き分けはないものとする。このモデルの元で、Aが「負ける」方の確率をrとすると


  1-{p/(1-p)}^b

r = ――――――――――

    1-{p/(1-p)}^(a+b)


となることが知られている。なお、優勝する確率は 1-rで求められる。

実はこれシリアスなBlackjackプレーヤーにとってはおなじみの、”risk of ruin”の式である。Blackjackの上級プレーヤーであるカードカウンターの場合、毎回の勝率pは0.5よりわずかに大きい。彼の最初の持ち金はaであり、毎回1単位づつのチップを賭けて勝負を行いbの収益を上げることを目標とする。この場合に、bの収益を上げる前に有り金を全部失ってしまう確率(リスク)はどの程度になるのかというのが彼らの関心事であり、それを算出するために上の式を用いるのである。

 なお余談だが、この式の求め方はいろいろあるが、例えば以下のように考えれば良い。
P(k)を"Aがk枚のチップを持っているときの破産確率"とする。すると

P(k) = (1-p)×P(k+1)+p×P(k-1)

が成り立つ。一方、P(0) = 1, P(a+b) = 0である。この条件の元で上の漸化式を解けば良い。(標準的な漸化式なので具体的な式変形は省略・・としたのですが、ちょっとだけ以下にオマケを追記)

【ひっそりと特別なオマケ】
 このページに、破産確率の計算の方法を探しに来る人がたまにいるようです。高校の数列の問題としてちょっと流行っているのかも知れません。いろいろな立場で計算出来ますが、高校数学的には「漸化式と特性方程式に関する考察」辺りを読まれると標準的な解法が分かるかと思います。大学初年級の線形代数的には、この漸化式を2次元の線形写像だと捕らえて特性方程式を解くという言い方が出来ます。(隣接n項の線形漸化式の解が、n次元特性方程式の根を底、乗数を項番とする形の式の線形和になることが一般的に示せます)。もう少し高級な解き方としては、Z変換によって変換領域で操作して逆変換を行うという方法もあります。結局特性方程式を解くことになるので、どのアプローチを取っても計算は同じです。
【特別なオマケ終了】

また、まずrisk of ruinがより一般的な形ではどのように算出されるかについて知りたい場合は、Epsteinの古典The Theory of Gambling and Statistical Logic”を参照されたい。また、Blackjackの場合のrisk of ruinをより正確に計算するためには様々な修正が必要となってくる。これついては、Peter Griffinの”The Theory of Blackjack”に記述がある。またBJmath.com内にあるpdf ”The evaluation of Blackjack Games using a Combined Expectation and Risk Measure”にもBlackjackのrisk計算とその歴史に関する詳細な記述があり、好事家には超お勧めである。これらを読むのがちょっと大変だという方には、Ken Ustonの”Million Dollar Blackjack”が、比較的平易な記述である。また、”risk of ruin”の考え方は「最終的に目標を達成するか破産するか」という確率だけではなく、「あるゲーム数以内で破産するか否か」という確率にも考えを拡張することが可能である。このような確率は、コンプのために$200×10時間のプレーが要求される場合に準備するべきバンクロールの量や、オンラインカジノ等のボーナス条件をクリアするために必要な資金量等を算出するときに重要となってくる。WizardofOddsにはそのための簡易計算表が掲載されている(BJモデル)。
更に余談だが、この式はBlackjack PlayerにとってはおなじみのKelly基準(Kelly’s Criteria)、即ち、「プレーヤーにとってx%の有利な賭け(収益の期待値がx%となる賭け)があれば、その賭けに対してはバンクロールのx%を賭けることが、収益を最大化する」という原理と密接な関係がある。Kelly基準について日本語で丁寧に解説してあるサイトもあるのでこれも参考にすると良いと思う。

 横道にそれたが、ポーカートーナメントの場合に、まず知りたいのは「A,B両者の技量が等しい場合の優勝確率」であろう。この場合に限っては、小難しい漸化式を解く必要なく優勝確率を求めることが出来る。(注:上の漸化式を直接利用する場合はp=1/2だと0/0の形となってしまうのでp→1/2の極限値を計算すればよい)
 この場合の状況は、「Aがa枚の100円玉、Bがb枚の100円玉をもっており、毎回それぞれが1枚づつ場に100円玉を出しじゃんけんや丁半等で取りっこするのと同じ。但し、勝負は途中で止めることが出来ず、A,Bのいずれかがa+b枚の全ての100円玉を得た段階ではじめて勝負終了」とするときと同じであり、この場合のAの勝率を求めれば良い。

この勝負、「1回毎のゲームは公正であるから、双方のプレーヤーにとってその期待値は0。従って、決着がつくまでの勝負全体をながめてもAの収益の期待値は0のはず)(もちろんBの期待値も0)」。

Aはa枚100円玉を賭けて、勝負に勝てばb枚のチップが増え、負ければa枚のチップを失う訳であるから、Aが勝負に勝つ確率をpとすると、期待値が0であるためには
 0 = b×p + (-a)×(1-p)
よって p =a/(a+b)
同様にBが勝つ確率は b/(a+b)
となり勝負に勝つ確率は持っているチップの量に比例する。
即ち、

r = b/(a+b)

ヘッズアップの状況においては、優勝確率は持ちチップ量に比例する

という有名な結果になる。

 一つ注目すべきはこの確率が、1ゲームに賭けるチップ量には依存せず、あくまで両プレーヤーのチップ量の比によって決まるということである。(例えばa=3, b=7の場合とa=30, b=70の場合で優勝確率が等しくなるということ)。実は、お互いの技量が等しいp=1/2の場合には、最も荒っぽいゲーム、即ち「両者が毎回自動オールインする」という場合でも「優勝確率は持ちチップ量に比例する」のである。両者自動オールインの簡単な場合には手計算でも容易にこれを確かめられるので、例を下記に示しておく。


(例)チップ枚数が合計10枚とする。上記モデルで、Aの最初の持ちチップがn枚としたときのAの優勝確率は幾らか?


(計算の方法)持ちチップがn枚のときのAの優勝確率をP(n)とする。

Aの最初の持ちチップが6枚とすると、最初のゲームで勝つ確率は1/2でありこのときAが優勝する。一方、負けるとチップ量は2に減る。従って

P(6)=1/2 + 1/2*P(2)

チップ量が2枚となった場合1/2の確率でチップは倍増の4枚となり、1/2の確率でトーナメントに負けてしまう。従って

P(2)=1/2*P(4)

一方チップ4枚のとき相手はチップ6枚であり相手が優勝する確率がP(6)であるから

P(4)=1- P(6))、

従って

P(6) =1/2+1/2*1/2*(1-P(6))

これよりP(6) =6/10

後は似たような感じで計算していけばP(n)=n/10が確かめられる。なお、これはDavid SklansyのTournament Poker for Advanced Playersに出てくるものより少し複雑な例にもなっている。


 さて、このようにA,Bそれぞれの優勝確率が求まれば、これに基づいて理論的に公平な方法で二人のプレーヤーの間でディールをすることが出来る。

例えば Aの持ちチップ量とBの持ちチップ量の比が7対3であり、優勝賞金が$800, 2位の賞金が$200であるとする。

Aが優勝する確率は7/10、2位の確率は3/10であるからAの賞金期待値は

$800*7/10+$200*3/10=$620

Bの期待値は同様に$380

となる。ショートスタックであるBは見かけ上$300相当のチップを持っているが、実際の期待値は見かけ上の価値よりかなり大きくなる訳である。(この現象を考慮した戦略論は例えば、へろ氏のblog参照)。しかしながら、実際のディールの場においては、合計$1000の賞金を持ちチップ量に比例した$700と$300で配分するということがしばしば行われる。 もし、あなたがショートスタックの側で、理論的には不公平なこのディールに抗議したければ、相手を納得させやすい話の材料としては以下が考えられる。

1. もし優勝賞金が仮に1位に$600, 2位に$400だったらどうするんだ。チップ量に比例した賞金配分でお前が$700こっちが$300だったら、お前は1位の賞金以上の額を受け取ることになるだろ。だからチップ量に比例した賞金配分というのはおかしいんだよ。(氏ね!←心の中only)

2. 両者とも最低$200は確保してる訳だから、結局残り$600をめぐる争いだろ。だからあんたの配分は$200+$600×7/10= $620になるだろ!(Mason MalmouthのGambling Theory and Other Topicsの説明に出てくるreasoning)

3. それでも相手が納得しなければ、「じゃあ時間もないから毎回両方オールインで勝者を決めようぜ。!文句ないだろゴラァ!」という話に持ち込む。上述のように、この方法でも期待値は変わらない。

 また、何らかの事情でヘッズアップを途中で時間短縮したいときけれども、ディールではなくちゃんと勝ち負けをはっきりさせたい場合の一種の「PK戦」として毎回オールイン勝負をするというのも理論的期待値の点からは「公平だ」と言うことになる。

 

 最後にA, B二人のプレーヤーのスキルに優劣がある場合について見てみよう。上述のrisk of ruinの式を利用するために以下のようにモデル化する。 A,B共にb枚のチップを持っている(チップ総量は2b)。毎回の勝負で、それぞれ1枚づつのチップを賭けるが、Aの方がBより少しだけ勝率が良い(即ちp>1/2)。

この場合にプレーヤーAのトーナメントの勝率を描いたのがこのグラフである。 言うまでもなくpが大きいほどトーナメント勝率も高くなる。またチップ総量が、1回のゲームで動くチップ量に対して小さいほど(チップ総量が大きいほど)トーナメントの勝率は高くなる。このモデルは現実のポーカーの状況を正しく反映している訳ではないが、それでも、たゲーム選択や戦略に対していろいろ言われてきたtipsを補強する材料となる。

まず、自分の腕に自信があるのであれば、持ちチップ量に対してブラインドが小さく、またブラインドの上昇が緩やかなトーナメントを選ぶべしと言うことになる。また、特段の理由がない限りアクションを出来るだけ速くして、想定的にブラインドが低いゲームの回数が多くなるように心がけるべしと言える。

戦略面では、出来るだけポットが小さくなるような打ち方をすべきだとも言える。(へろ氏のコラムも参照)。逆に、自分が参加者の中で相対的に劣っているのであればこれとは逆のことをすれば良いということになる。即ち、Turboトーナメント系のブラインドの上昇が大きいトーナメントに参加し、ゆっくりアクションし、また無駄に大きいポットを作るような打ち方をすれば良いということになる。

 なお、pがほんの少し0.5より大きくなっただけで(実際ある程度以上のレベルになると1ハンド毎の期待値・勝率の差はわずかであろう)、トーナメント自体の勝率は驚くべきほどに高くなることに注目して欲しい。例えばp=0.53、総チップ量30(持ちチップ量15)でスタートすると、このモデルの元でのトーナメントの勝率はなんと85.8%という高率である。(p=0.51という非常にわずかなアドバンテージの場合でも勝率は64.6%)。これは少しばかり現実離れした数字のようにも思えるが、最近Sit&Goトーナメント強化月間と称して統計を取られているへろ氏、Fishhooks氏の戦績を見ても、普通のギャンブルではあり得ないほどの高い収益率を確保しているようである。(min氏も頑張っておられる).従って、トーナメントには彼我の技量差による収益の差を大幅に拡大する効果があるとは言えよう。また「サテライト型のトーナメントはおいしいのか?」に書いたように、転がし型のトーナメントにも期待値を増幅する効果がある。

 即ち

1ハンド毎の収益率→(増幅)→単独トーナメントの収益率→(増幅)→サテライト型トーナメントの収益率

という図式が成り立つ。以前、サテライト型トーナメントの期待値は160%以上ではないかと書いたことがあるが、この値でもまだまだ控えめであって、うさんくさい有料競馬情報サイトが謳っているような「回収率300%!」という世界になっている可能性も本当にありそうである。((笑)←一応(笑)をつけたが,体感的に200%超は確実にあるのではと思う..)

 次回は3人以上の場合についてである。      


トーナメントにおけるチップの価値(その3):3人以上の場合の優勝確率

 前回見たようにヘッズアップの場合は、古典的なrisk of ruinの考え方を用いればそれぞれのプレーヤーが1、2位になる理論的な確率を求めることが出来た。3人以上のプレーヤーが残っている場合話、まず優勝する確率はヘッズアップの場合と同様に求めることが出来る。

 ヘッズアップの場合と同様、A,B,C,…それぞれのプレーヤーがa,b,c,….のチップを持っているとする。また総チップ量=T (=a+b+c+….)とする。それぞれのハンドでヘッズアップとなり、ぶつかるプレーヤーはランダムであるとする。(暗に全てのプレーヤーのプレースタイルが同一であることを仮定している。)勝負に勝ったプレーヤーのチップ量は1増え、負けた方のチップ量は1減るとする。(即ちポットの大きさが毎回1+1=2であるということ)。また、その他のプレーヤーのチップの増減はないものとし、プレーヤーの間に技量の差はないものとする。従ってヘッズアップの勝負になっとときにプレーヤーAが勝つ確率も負ける確率も1/2となる。今プレーヤーAのチップの増減にのみ注目すると、勝負に参加した場合は1/2の確率でチップが1増え、1/2の確率でチップが1減る。

 このように眺めると、チップの増減の仕方はヘッズアップの場合と全く同じであり、Aの戦いが終了するのはチップがTに増えた場合(優勝)か、0になった場合(2位、3位、4位…..)のいずれかである。従って優勝する確率はa/Tとなる。また優勝しない確率は(T-a)/Tとなる。但し、Aが2位になったのか3位になったのかと言ったことは分からない。であるにも関わらず3人以上のプレーヤーが残っている場合に対しても、「優勝確率が持ちチップ量に比例する」ことだけは分かるのである。
 不思議と言えば不思議であるが、このことは直感的には納得しやすいので、Mason MalmouthのGambling Theory and Other Topics等でもその理由が説明されていない。が、その理屈は実はそう単純ではなく、実はrisk of ruinの応用としてはじめて納得しやすい形で上のように説明出来る訳である。

さて、優勝確率が持ちチップ量に比例することが分かったとして、2位の確率、3位の確率はどうすれば分かるのか?実はこれらを求めるのは非常に難しい。そんな中、意外な人物が登場してくる。次回はこの辺の話題。


トーナメントにおけるチップの価値(その4):クリスファーガソン(の父親)

今回から暫くは2+2の掲示板の、ある名スレにインスパイヤされた内容である。(Bozeman氏によるオリジナルのスレ1, 2は必ずしも分かり易く書かれている訳ではないので、誤りを招かない程度に簡単に改変して見たということである)。書き始めてみると肝心の戦略論まで到達するのにまだ回数がかかりそうだし、今回は特に理論的な話なので興味のない方はざっと斜め読みする程度で良いかと思う。

 
今回は、前回の拡張で、まず3人のプレーヤーの場合をまず考える。トーナメントポーカーのチップの合計量は常に一定値であるので、3人のプレーヤーのチップ量の推移を表すのに図(a)のような三角グラフ(三角ダイアグラム)が良く用いられる。この図の場合、総チップ量は8であり、最初の時点(図中のS)での持ちチップ量はA,Bが3、Cが2となる。また、前回仮定したのと同じ「ヘッズアップでぶつかり1勝負での増減は±1」とすると、 ハンド毎に図(b)のように、誰と誰がぶつかったのかとその勝敗に応じて、一つだけ隣のマスに等確率で進む。勝負が進んで行くと、いずれ辺AB,BC,CAのいずれかに到達するが、これはあるプレーヤーが飛んだことを意味する。図(a)では辺AB上の点Tに到達しているが、これはCが最初に飛び(従って3位になった)、その時点でAのチップ量は3、Bのチップ量は5であったことを意味している。この後はA,Bのみの戦いになるので辺AB上での動きになり、(その2)で扱ったヘッズアップの場合となる。最終的に、先に点Aに到達すればAの優勝、点Bに到達すればBの優勝である。ついでに、前回の話をこの図を用いて再度説明しておく。Aのチップ量の増減はBC間のヘッズアップの勝敗の行方には関係ないので、ちょうどこの三角形を横から見た形になる。するとAのチップは1/2の確率で1単位増え、1/2の確率で1単位減るという動きをする。最終的には先に全部のチップ(8)を獲得するか、0になるかであり、それぞれの確率はrisk of ruinの式で求められるという訳である。但し、チップが0になった場合には、三角グラフ上では辺BC上のどこかに到達しているのであるが、それが点B(Bが優勝なのでAは2位)なのか、点C(C優勝でAが2位)なのか、あるいは点B,C以外の辺BC上の点(Aが3位)なのかまでは求まらない。

 この図でAが3位となる確率を求めるには、辺BCに最初に到達する確率を求めれば良い(Bが3位、Cが3位の場合も同様)。これはかなり厄介ではあるが、状態方程式を解くなどして直接的に数値解を求めることが「一応」可能ではある。また、何回かシミュレーションを行うことによっても推定することが出来る。

 また、このケースの非常に特殊な場合で、チップ総量が非常に大きい場合に、辺BCに最初に到達する確率を求めたのが Tom Fergusonの"Gambler’s ruin in three dimensions"である。 この場合、図(c)に示すように、最初の持ちチップ量からスタートして非常に細かく不規則に動いて行く(2次元のブラウン運動と呼ばれているもの)点Sが、(辺AC,BCに触れる前に)正三角形の辺ABと最初に触れる確率を求めることになる。非常に巧妙な技法で計算されているが、それを説明するためには莫大な説明と知識が必要となるので、ここでは省略する(複素関数・等角写像を知っていれば理解出来ます)。

 それより、” Ferguson”という名前を聞いてピンとこなかったであろうか?実はこの人、クリス・”ジーザス”・ファーガソン(Chris “Jesus” Ferguson)の父親である。なんでこんな所にジーザスの父親がいきなり登場してくるのか不思議に思われるかも知れないが、例えばPokerpagesのインタビュー記事や、Pokernews(英語版)の記事を読めば納得行くであろう。ジーザス自身は、あまり戦略の解説記事等は書かないようであるが、Sklanskyが、”the brightest player”と太鼓判を押した男である。トーナメントの戦略についても、表には出さない緻密な分析は数多く行っているはずである。

 残念ながら、Fergusonの方法を用いた場合、2位になるプレーヤーの確率は求めることは出来ないし、あるプレーヤーが3位になったときの残り2人のプレーヤーがどれ位のチップを持っているか(2プレーヤーのチップ量の確率分布)は求められない。一方、Bozemanの計算によると、三角形のマス目の粗、チップの動きに関する仮定(Bozemanはヘッズアップモデルだけでなく、ブラインドがあることを想定した場合のシミュレーションも行っている)に応じて、あるプレーヤーが3位、2位になる確率も若干変わってくる。また、そもそもFergusonの手法は4人以上のプレーヤーが残っている場合には直接応用出来ない。シミュレーションにより確率を推定する手法は多人数の場合でも適用出来るが、時間もかかるし、実際のトーナメントの現場でディールとなったときに即計算するようなことは出来ない。このような背景から、より実用的な簡易な確率計算手法が必要となって来る。そこでいよいよ登場してくるのがICM (Independent Chip Model)である。


トーナメントにおけるチップの価値(その5):Independent Chip Model (ICM)

 前回まで見てきたように、3人以上のプレーヤーの場合であっても優勝する確率はチップに比例するので簡単に求められるが、2位以下になるプレーヤーの確率を求めるのは非常に困難である。これをうまい具合に簡易に計算する手法がIndependent Chip Model(ICM)である。今回の話にも多少間違いやすい確率の計算が出てくるが、難しいものではないし、このシリーズもだんだんと応用の利く実用的な話になって来るものなので、そろそろ注意して読んで欲しい。

さて、ICMの考え方は以下の仮定に基づいてそれぞれのプレーヤーの順位の確率を求めるものである。

1.優勝確率はチップ量に比例する
2.時間的には逆向きの考えであるが、まず優勝するプレーヤーが決まったと仮定する。この場合、残りのプレーヤーの間での最上位である「2位」の地位を目指して争うことになる。このとき、優勝したプレーヤーのチップはなかったものとする。すると、2位になる確率は、残りのプレーヤーのチップ量に比例するとして計算することが出来る。
3.同様に1,2位のプレーヤーが決まったと仮定すると、残りのプレーヤーの間での最上位である「3位」の地位を目指して争うことになる。1,2位のプレーヤーのチップはなかったものとすると、3位になる確率は、同様に残りのプレーヤーのチップ量に比例するとして計算できる。
4.4位以下の場合も同様

となる。

 言葉で説明するより具体的な例を示したほうが分かりやすいと思うので、以下に例を示す。
プレーヤーAが3、プレーヤーB、Cがそれぞれ1のチップを持っているとする。また、
Aが1,2,3..位になることをそれぞれA1,A2,A3などと表す。

まず、トータルのチップ量は3+1+1=5であるから優勝確率は
P(A1)=3/5, P(B1)=1/5, P(C1)=1/5
となる。
次に、Aが2位になるのは、
ア) Bが1位でAが2位になる場合と
イ) イ)Cが1位でAが2位になる場合
の二通りある。 
ア)の場合
Bが1位なので残りのプレーヤーAとCの持ちチップ量の和は3+1=4。従って、Bが1位になるという条件の元でAが2位になる確率は3/4となる。一方、Bが1位になる確率は1/5であるから、Bが1位かつAが2位となる確率は 3/4*1/5=3/20

イ)の場合も同様に、Cが1位という条件の元でAが2位になる確率は3/(1+3)=3/4であるからCが1位かつAが2位となる確率は3/4*1/5=3/20
従って、Aが2位となる確率はア)の場合とイ)の場合を合計して3/20+3/20=6/20
となる(これらは背反事象であることに注意)。もう少し数式的に表現すると

P(A2)=P(A2,B1) + P(A2,C1)
           =P(A2|B1)*P(B1) +  P(A2|C1)*P(C1)
           =3/(3+1)*1/5 + 3/(3+1)*1/5
           =6/20
と書ける。

プレーヤーが4人以上の場合も同様であるが、人数が増えると計算は多少ややこしくなる。これも例を示したほうが、具体的な計算の方法が理解しやすいと思うので、残りプレーヤーが5人の場合の例を示す。
5人のプレーヤーをA,B,C,D,E、それぞれの持ちチップをa, b, c, d, eとする。またトータルのチップ量T=a+b+c+d+eとする。Aが3位になる確率を示すと

P(A3)=P(A3,B1,C2)+P(A3,D1,C2)+….
             (Aが3位、A以外のプレーヤーが1,2位となる4*3=12通りの場合について全て足す)
   =P(A3|B1,C2)*P(B1,C2) + P(A3|D1,C2)*P(D1,C2)+….
     =P(A3|B1,C2)*P(C2|B1)*P(B1) + P(A3|D1,C2)*P(C2|D1)*P(D1)+…
     =(a/(T-b-c))*(c/(T-b))*b/T + (a/(T-d-c))*(c/(T-d))*d/T+….

となる。

前回述べたように、正確に計算を行うと3人以上のプレーヤーの場合には、プレーヤーの順位の確率は勝負の荒さ(三角ダイアグラムのマス目の荒さ)に依存する。(2人の場合は(その2)で述べたように勝負の荒さには依存しない)。にも関わらず、ICMの計算に当たってはマス目の荒さの概念が全く出てこない。また、優勝プレーヤーのチップを除いて2位のプレーヤーの確率を求めるという手法も直接的な根拠はない。即ち、ICMは(
((その3)で述べた勝負のモデルに対する))近似的な計算手法に過ぎないのである。このことには一応覚えておこう。
 さて、Bozemanは、ICMと同様に条件付確率を用いてトーナメントの順位の確率を求める手法の良否の比較検討を行っている(これらはすべて近似手法である)。これらを一応紹介しておく。

McEvoy モデル
Tom McEvoyのTournament Pokerに書かれているディールの方法である。
 まず、すべてのプレーヤーに対して、がその時点での最下位の賞金を配分する。その上で、残りの賞金をチップ量に比例した形で分ける方法。またこの方法が広く一般的にも行われているという記述もある。
 実は(その2)述べたように、この方式はヘッズアップの場合においては理論値と一致する。しかしながら3人以上のプレーヤーの場合にはチップリーダーに厚すぎるディールとなり、1位賞金以上の賞金を得てしまう場合が出て来てしまう。例えば3人のプレーヤーが残っており、1位が10万ドル、2位が4万ドル、3位が2万ドルの賞金とする。まず3人のプレーヤーに2万ドルが与えられる。残りの10万ドルをチップ量に比例して配分するわけだが、チップリーダーが80%のチップ量を持っていれば、10万ドル×80%で8万ドルの追加配分。2万+8万で合計配当は10万ドルと、1位賞金と同額となってしまう。チップ量が80%より大きければ、なんと1位賞金を上回る額を配分することになってしまう訳である。これは、言い換えれば1位となる確率が1より大きいと計算されてしまうということになる。
 このようなことからBozemanのスレでは、McEvoyモデルをゴミとして一蹴しているが、同書を詳しく読むと「チップ量が大きいほど、チップの価値は少なくなりチップ量が小さいほどチップの相対的価値は増える。そこで、このようなディールの方法よりも下位プレーヤーに多めに配分することも良く行われる」とも書かれており、具体的な計算式はわからないながらも当時のトーナメントプレーヤー達も、少なくとも感覚的にはもう少しチップの少ないプレーヤーに対して多く配分することが公平だと思っていたことがうかがい知れる。また、一般的にはICMはMason MalmouthがGambling Theory and Other Topicsで初めて紹介されたとされて来たが、Bozemanによればそれ以前から知られていた手法であるとのことなので、当時のトーナメントサークルの中でもICMのようなディールの方法知っていた人がポツポツといたのかも知れない。

Weitzmanモデル
 このモデルでは、残ったプレーヤーの中で最下位の者が飛んだ場合にそのチップは残りのプレーヤーに均等に分配されるという仮定して確率計算を行う(但し多元連立方程式をなんども解く手間が必要)。Gambling Theory and Other Topicsの中でWeitzmanが提唱している方式であり、かつ同書の中ではICMよりも「厳密な」計算だとしているが、実はBozemanの計算によると、この仮定は少しショートスタックに有利になりすぎる傾向がある。
 上記の分析や前回の厳密手法との比較から、Bozemanは近似計算手法としてはICMが最適であるとしている。また、ICMはその後多くの人間からの支持を得、今ではICMが標準的なトーナメントの順位確率計算手法として認知されるに至っているのである。

なお、ICMによる確率計算は手計算だと若干面倒であるが、そのプログラムは簡単に書けるのでネット上に計算機がいくつか存在する。”ICM Calculator”などの単語で検索してみればいろいろ引っかかってくるので、探してあれこれ計算・分析して見るのも面白い(へろ吉氏が行ったような感じの分析)。
 次回はICMについてもう少し直感的な説明を行う。


トーナメントにおけるチップの価値(その6):ICMとチップレース

 今回はICMの直感的な説明を行う。興味のない方は斜め読みで良いかと思う。
Independent Chip Model(独立チップモデル)の名前の由来は、各プレーヤーのチップが1枚1枚独立のプレーヤーとして戦っているとして眺め、それぞれのプレーヤーの最終順位は独立に戦ったプレーヤーの最上位のチップの順位で争うとした場合の、各プレーヤーの順位の確率の計算を行っていることに等しいことによる。
例えば

(例1)
前回の例と同じように、プレーヤーAが3、プレーヤーB、Cがそれぞれ1のチップを持っているとする。プレーヤーAは3枚のチップ(3勝負分のチップと言った方が分かりやすいかも知れない)を持っているので、それぞれのチップをA1号、A2号、A3号とする。すると、A1号、A2号、A3号、B、Cの5枚(あるいは5人?)のプレーヤーでの争いとなるが、持ちチップ量は等しいので当然これら5枚のプレーヤーの優勝確率はそれぞれ1/5となる。(2,3,4,5位となる確率もそれぞれ1/5。)従ってAの優勝確率は1/5×3=3/5となる。
5枚のプレーヤーの順位の決まり方は5!となるが、A1号、2号、3号を区別しなければ今の場合Bのチップの順位とCのチップの順位が定まれば、元の3人の全てのプレーヤーの順位が定まるので、5枚のチップの順位の決まり方の場合の数は5*4=20通りとなる。
 このうちAが2位なるのは
(B1位、C3位), (B1位、C4位) 、(B1位、C5位)、(B3位、C1位) , (B4位、C1位) , (B5位、C1位)の6つの場合である。(なお、例えば(B1位、C4位)の場合には、B1位、A3号2位、A2号3位、A1号5位となっている場合が含まれているが、このとき元の3人のプレーヤーの順位はAについては、1号から3号のうち最も順位の良いA3号の2位、Bについては1位、Cについては4位を用いるので、これらの順位を比べて、Bが1位、Aが2位、Cが3位となる訳である。)
 結果的にAが2位になる確率は6/20となり前回の計算結果と一致する。
 
 このような順位の決め方をどこかで見たことがないであろうか?これ、チップレースのときの順位の決め方と同じなのである。チップレースとは、トーナメントにおいて、端数チップを整理するときにデノミの大きいチップを得るプレーヤーを決める方法のことである。(なお、デイリートーナメントなどでは時間短縮のためチップレースを行わず単純に端数チップを切り上げるという方法も良く行われている。)
 チップレースにあたっては、1.各プレーヤーの端数チップを自分の前に並べる。2.ディーラーは各プレーヤーに端数チップの枚数分のカードを表向きに配る。3.各プレーヤーに配られたカードのうち最も大きいカード(ランクが同じ場合スーツも比べる。スーツは強い順にスペード、ハート、ダイヤ、クラブとするのが通例。)のみを比べて、大きいデノミのチップを得る順位を決定する。という方式が通常行われる。

 例えば
(例2)
端数の25$チップをAが3枚、B,Cがそれぞれ1枚もっておりこれを$100チップに切り上げるとする。3人合計で75$+25$+25$=125$の端数チップ量となるので、これを切り上げて$100チップ2枚を配分することになる。手続き2.に従って、AにダイヤのK, T,3, BにスペードのK、Cに8が配られたとする。カードの強さの順位はBのスペードのK、AのダイヤのK、AのT、Cの8、Aの3の順となるが、Aについては最も大きいカードで判定するのでTと3は無視し、B,A,Cの順位となる。
なお、チップ量の比を(例1)と(例2)で同じ状況にしておいたので、ICMとチップレースが全く同じ状況であることが容易に納得出来るかと思う。

 切り上げられた$100チップの配分の方法であるが、昔のWSOP等では1位が全てのチップを得る(今の場合$200をBが得る)方式であったように思う。もう一つは$100を1枚づつ上位のプレーヤーに配る方式である。(今の場合1位のBと2位のAがそれぞれ$100を得る)。最近は後者の方式の方が主流であるように思う。(昔からあった方式かも知れないが、私がはじめて聞いたのは1999年頃(←かなりいい加減)ミラージュのデイリー(多分)での方式としてawk氏(これも不確か)から聞いたのがはじめてであったような気がする。)
 余談になるが、1位になる確率は何度も説明してきたようにチップ量(この場合チップ枚数)に比例するので、期待値の点からは1位総取りの配分方式が公平である。一方、この方式には1位になった者が、2枚以上のチップを得てしまう可能性が高く、端数チップの切り上げ切り下げという、必要最小限以上の賭けをポーカー以外の勝負で行ってしまう欠点がある。一方、ミラージュデイリートーナメント方式は端数チップの枚数が1枚しかない者に最も有利となり期待値の点からはやや不公平である。また、単純に端数チップを切り上げる方式は更に、端数チップが少ない者に有利である。個人的にはデイリートーナメントレベルでは単純切り上げ方式とし、メジャートーナメント方式では端数チップの整理を行わない代わりに、端数分については「オールインのときのみ使用可」という制限をつけるのが良いのではないかと思う。その上で、あるプレーヤーが、カラーアップ可能な枚数の端数チップを得た瞬間に直ちにカラーアップを行うというのはどうであろうか?手間かかりすぎかな?
暇な人は、試しに上記の場合のそれぞれの方式の各プレーヤーの期待値を計算してみるのも良いかと思う。なお、順位確率の計算は前回のように条件付確率を計算する手法でも、今回のように場合の数を数え上げる方法でも当然同じ答えとなり、今回のように極く単純な場合はどちらの方法でも手間はさほど変わらないが、一般的には前回の方式の方がはるかに簡単である。(また、チップ量が整数ではない場合でも計算が可能であるという利点もある。)

次回はICMを用いた具体的な計算例として、最近大流行のSit&Goのシングルテーブルトーナメントにおける、残りプレーヤーの数と自分の持ちチップ量に応じた、賞金の期待値の変化のグラフを示す。これが戦術面で示唆する所は大きいので、今までの理論や計算の話がつまらなかった人も、次回には注目!。


トーナメントにおけるチップの価値(その7):Sit & Go トーナメントにおける理論的期待値

 10人のシングルテーブルトーナメントで、賞金が1位$50,2位$30, 3位$20、各プレーヤーの最初のトーナメントチップが$100 (従ってトータルで100×10=$1,000のトーナメントチップ)の場合を考える。(標準的なSit&Goトーナメントのモデル)。
 プレーヤーAの持ちチップ量がaであるときの、賞金の期待値をICMを用いて求めてみる。
 Aの持ちチップがaであっても、他の各プレーヤーのチップの偏り方によって期待値は変わってくるが、今回は「他のプレーヤーは全て同じ額のチップを持っている」とする。やや現実的な仮定ではないが、最も標準的な例になり定性的な傾向を調べるには十分であるし、またこの仮定をおくことにより計算が簡単となる(他のプレーヤーの持ちチップにでこぼこがある場合については、次々回位に述べる。)
 今n人のプレーヤーが生き残っているとする。またAが1位、2位、3位となる確率をP(A1),P(A2),P(A3)とする。結果だけ示しても良いのだが、他の人が計算をする際の参考までに、一応式も書いておく。
 今、A以外のプレーヤーの持ちチップ量は等しいとしたので、これをyとすると
y=(1000-a)/(n-1)
となる。後は(その5)で示した通りの計算を行えば、
P(A1)=a/1000
                        a            y
P(A2)=(n-1) ――――× ――――
                  (1000-y)      1000
                                  a             y              y
P(A3)=(n-1)(n-2)× ――――×―――― ×――――
                          (1000-2y)    (1000-y)       1000

と、驚くほど簡単な式になる。

最終的にAの賞金の期待値は
 50*P(A1)+30*P(A2)+20*P(A3)
となる。

 結果を示したグラフが上の図である。 この1枚のグラフだけでも、いろいろな戦術上のセオリーの背景を示唆しているし、実に様々なことが読み取れる。
但し、注意して欲しいのはここまで小難しい話を続けてきて、グラフまで書いたからこそ敢えて言うのであるが、「オッズ・オッズ」や確率の話をぐだぐだ言うのは、基本的には無意味である。
 もう少し丁寧に言えば、ポーカーにおいて上っ面のオッズや確率が適用される範囲は限定的であり、これを利用して議論することは素人にはおすすめ出来ない諸刃の剣であり、細心の注意が必要だということである。

 ICMの手法はかなり広範に用いられるようになってきたため、今では「チップ量が少ないほど、チップ1枚当たりの価値が高まる現象」そのもののことをICMと呼ぶことも多いが、海外では、「ICMが適用出来るのはどのような局面か」と言った議論も盛んである(チップリーダーが大名プレーが出来る効果が、どの程度期待値に影響するかetc)。もちろん広義のICMの効果や、その他トーナメント特有の注意点すら考慮せずにオッズやoutsを語ることは論外である。
 ICMに基づく期待値だけで大体のことを語ることの出来る一つの状況は、自分がBBのときに誰かがオールイン要求のスチールレイズをしてきたときにこれを受けるかどうかである。この場合、フロップ以降のアクションはないので、コールするかどうかは、単純にプリフロップでのハンドの勝率とハンドセレクションの問題となる。ちょうど2+2のインターネットマガジンの最新号(Jan. 2006号)に、Sean HarnettのBlind Stealing and Tournament Prize Structureという記事が出ている。S&Gプレーヤーは必読である。
 次回以降は、今回示したグラフが示唆するトーナメントのtipsについて2,3書いてみたい。このグラフから何が読み取れるのかを考えることは、トーナメントの構造の1面を理解することにもつながるので、各自いろいろ考えてみて欲しい。


トーナメントにおけるチップの価値(その8):ショートスタックがオールインした後はチェックで回すべきか?

 ショートスタックがプリフロップでオールインした後は、このプレーヤーが飛ぶ確率を出来るだけ高くするために、特にサイドポットが非常に小さい場合には後のラウンドは全てチェックチェック(check it down)で回すべきであるという考え方が広く一般に信じられている。しかし、この考え方は少なくともICMの観点からは間違いである状況の方が多い。
 この戦術が有効となるためには、チェックで回す方がプレーヤーの期待値が高くならなければならない。チェックチェックで回すと当然ショートスタックが飛ぶ確率は高い。しかしながら、チェックで回せば、残っている他のプレーヤーがサイドポットのみならずメインポットを得る可能性が出てくる。当然このポットに対する自分の期待値は減少する。従ってチェックで回すことは通常のライブゲームにおいては、少なくとも期待値の観点からは誤ったプレーである。

 一方、トーナメントの場合には、確かに前回のグラフから分かるように自分の持ちチップ量が同じであっても残り人数が少ないほど期待値は大きくなる。即ち、トーナメントにおいてはプレーヤーが一人飛ぶことによって自分の期待値は上昇する。従ってチェックチェックで回すべきかどうかは、この両方の効果を総合した期待値で考えるべきである。ここでグラフを再度良く見てみよう。プレーヤーが10人〜6人の場合にはグラフがほとんど重なっているので、プレーヤーが飛ぶことによる期待値の上昇分は極くわずかなのである。一方、残り人数が6人から5人、5人から4人と入賞に近くなると期待値の上昇がある程度見込める。また4人から3人、3人から2人の場合にはかなり大きい期待値の上昇となる。
 今度は自分の持ちチップ量に注意して見ると、ラージスタックの場合は、(概ね持ちチップが700以上の場合)プレーヤーが飛んでも期待値の上昇は相対的に少なくなる。
 即ち、チェックチェックで回すことが得になるのは「入賞間近あるいは、飛ばすことにより、より大きな入賞賞金が確定する場合であり、かつ自分自身のチップ量も比較的小さい場合」となる。David SklanskyのTournament Poker for Advanced Playersにも ”The only time they(=チェックチェックで回すこと) have some merit is at the very end of the tournament. And even then, only when you have a moderately small stack yourself. In those cases, his elimination can add quite a bit to your EV, which might indicate that you play less than what would normally be optimal, in order to increase the chances of that elimination.”と全く同じ記述がある。言い換えれば、ここでSklanskyが言っていることをS&Gの場合に定量的に図示したものが前回のグラフなのである。(Sklanskyも裏でこういう計算をしているはず)

 チェックで回すべきか否かは、メインポット・サイドポットの大きさ、残り人数、自分のチップ量に依存するので実際の現場で瞬時に判断することは難しいかも知れないが、期待値上昇の効果の方は前回のグラフの通りであるので、凡その傾向で良いのでこのグラフを覚えておけば大体の判断は出来るであろう。
 但し、トーナメントの場合は”avoid close gamble”という考え方もあるので、必ずしもライブゲームと同じプレーが最適であるとは限らない。ベットしたとしても、オールインプレーヤーをフォルドさせることは出来ないのであるから、ベットによる勝率の向上はオールインプレーヤーがいない場合に比べて限定的である。例えばショートオールインプレーヤーがタイトなプレーヤーであって、BBが回ってくるまでまだ数ハンドは選択肢がある状況であり、かつ既にコールしたプレーヤーがいるにも関わらずショートオールインしてきたような状況ではこのプレーヤーのハンドは相当良いと考えるべきであろう。このような場合で、フロップが絵札やAばかりで、自分のハンドともマッチしなかったとしよう。この状況ではオールインプレーヤーの勝率はかなり高いと考えられるので、他のプレーヤーを後のラウンドでフォルドに追い込めても自分の勝率の向上はわずかであることが推定出来る。従ってチェックを前提に考えてもよかろう。一方、ショートスタックがブラインドで自動オールインの場合はランダムハンドであるから、他のプレーヤーを下ろすことによる自分の勝率の向上の程度は大きいと考えられるのでベット十分であろう。

 あるいは自分がBBで35持ち、フロップ247の状況はどうであろうか。このときにはドローに成功すれば、相手の人数によらずほぼ最強手、失敗すればほぼ間違いなく最弱手である。即ち、オールインプレーヤーとのヘッズアップであろうが、マルチウエイの状況であろうが自分自身の勝率≒ドローに成功する確率であり、オールインプレーヤー以外のプレーヤーを下ろすことによる期待値の向上はほとんどない。一方、オールインプレーヤーが飛べばわずかではあっても期待値は向上するのであるからすチェックが基本となる。(ドローでセミブラフを習慣的に打つタイプのプレーヤーが、この状況で反射的にベットしてしまうというミスプレーはたまに見かける。期待値的に損な上に、手を開けないといけないので、「セミブラフ野郎」であることが白日の下に晒されるという影響もある。)この当たりのことを踏まえて、なおどう打つかはプレースタイルにもよるし、一般的な打ち回しの話になり議論が分かれる所であるのでここではこれ以上言及しない。

 もう一つ特別な場合として、前回のグラフの「チップ量と期待値が比例すると考えた場合」の線をみてみよう。これはWinner takes it all(今の場合1位が$100総取り)の場合の期待値に相当するが、この場合の期待値は残りプレーヤーの人数に依らない。言い換えればWinner takes it all型のトーナメントではICM的期待値の観点からはショートスタックを飛ばす意味は全くないのである。例えば、BBがショートオールインの状況で(単純化のためSBがないラウンドとする)自分がボタンで25o持ち。全員フォルドで回ってきた場合に、BBを飛ばす目的でコールするようなことは期待値の点からは損である(25oはランダムハンドのBBより当然弱い)。
 また、通常のトーナメントであっても序盤〜中盤まで(Sit & Goの場合だと6人残りまで)なら、ショートスタックを飛ばすことによる利益はほとんどないので、ボタンが半ば義務的にバナナハンドでBBを飛ばしに行く必要は全くない。
 とは言っても、もちろん

,j;;;;;j,. ---一、 `  ―--‐、_ l;;;;;;
 {;;;;;;ゝ T辷iフ i    f'辷jァ  !i;;;;; ショートスタックがオールインした
  ヾ;;;ハ    ノ       .::!lリ;;r゙  後はチェックチェックで回すべき
   `Z;i   〈.,_..,.      ノ;;;;;;;;> そんなふうに考えていた時期が
   ,;ぇハ、 、_,.ー-、_',.    ,f゙: Y;;f    俺にもありました
   ~''戈ヽ   `二´    r'´:::. `!

のも事実である。

 私だけでなく、そんな風に考えている人の比率は結構多いと思われるが、チェックチェックで回ってしかるべきとおもっている所でベットされると(特にナッツドローを持っている場合など)中には感情的になるプレーヤーもいる。(Sklansky自身も、かつてのTOCで、ショートオールインプレーヤーのいる状況で別のプレーヤーがベットしたときに「苦虫をかみつぶしたような表情でフォルドした」等と記事に書かれていたことがある)。そこでチェックかベットか微妙な状況であれば、「相手を感情的にさせたいのならばベット、相手と波風を立たせたくないのであればチェック」という考え方もあり得よう。ベットしたことに対して相手が喧嘩を売ってくるようであれば、素直に「知らなかった。ごめん」などと言うのもよし、「ベットした方が自分の得になるから当然だろ」と正論で対抗するもよし、どう答えるかは「自分が相手にどのようなプレーヤーであると思われた方が都合が良いのか」に応じて臨機応変に判断すれば良いと思う。また、このような状況の場合、ショートスタックが手強い相手で、息の根を確実に止めたい場合はチェックすることもあり得よう。逆に自分がショートスタックオールインであるときに、ベットして来たプレーヤーがいればそのプレーヤーからは手強いと思われていないか、惚れられているのかのどちらかかも知れない。また微妙にマナー違反ではあるが、ショートスタックオールインを助けるためのベットもあまりシリアスなレートでなければ、起こりえる話である。なお、ホームポーカーではショートスタックオールインがいるときに「チェックで回そうぜ!」と発言することはマナー違反であるとされている。

 次回も、(その7)で示したグラフから読み取れる戦術を書く予定。


トーナメントにおけるチップの価値(その9):複数が勝ち抜けするタイプのサテライト

本当はもうちょっといろいろなことを説明してから書こうと思ったのだが、最近上位数名に「WSOP招待」という感じのフラットな賞金ストラクチャのトーナメントもオンライン系では流行っているので今書いておく。

 サテライト型のトーナメントの中には1位のみが勝ち抜けというものも多いが、複数名が本戦に出場出来る形式の物も、(特にマルチテーブルの場合に)多数ある。このような場合、即ち入賞者が複数いる代わりに一度入賞した場合の賞金がほぼフラットである形式のトーナメントでは、ICM的期待値の観点からは通常のトーナメントとかなり異なる構造となってくる。

 これを分かりやすく示すために、その7で示したS&Gのトーナメントにおいて、1位、2位、3位の賞金がフラットで、それぞれ100/3$である場合の期待値を、その7と同様に示したのがこのグラフである。
 

 一目瞭然、ショートスタックになればなるほど一層チップの期待値は増加する。一方、チップが多くても最高の期待値が100/3$で頭打ちになるので、グラフが横に寝た形となる。またここで示したグラフは、WPJ準決勝をはじめ、賞金がフラットなトーナメントを勝ち抜く際の戦略の修正を考察するための基礎的データとなる。こちらについても具体論は述べないが自分でいろいろと考えてみるのも面白いと思う。

 また、JPPAで行っている「世界ポーカー選手権日本代表決定戦シリーズ(WPJ)」のような構造のトーナメントシリーズの場合、のポイントを1点でも持っている人は準決勝に出た場合の期待値はかなり大きいことがわかる。(WPJ全体のルールはここを参照)。一方、中途半端に点数を持っている人は、準決勝直前に1点や2点を集めてもあまり期待値の上昇は見込めない。従って決勝進出確定となる60点を集めてしまうか、現在の持ち点に甘んじて準決勝廻りを決断するかの2者択一を決断するのが吉となる。(決勝進出を確定することは期待値の観点での効用はないが、「利を確定する=リスクを最小化する」という観点からは定量的にも意味のある行為となる)。


トーナメントにおけるチップの価値(その10):派手なじゃんけんを避けるICM的意味

(本論に入る前の注記:今回書くことはあくまでICMの観点からはそうなるという話であって私の総合的な意見ではないし、状況によって正解は全く逆であるかも知れない。むしろ異論がいろいろ出て来た方が興味深い議論が出来ると思うので期待しています。)

随分間が空いたが淡々と進める。

 トーナメントの戦術上の注意として良く

・派手なぶつかり合いを避ける
 というのと
・Gap Concept

が出てくる。
 (Gap Conceptとはプリフロップで最初の参戦者(opener)となるための基準となるハンドに比べて、既に参加者がいる場合に対抗するハンドの基準は十分強いものでなければならないということ。A8で参戦するのはOKだが、既に参戦者がいる場合には例えばAQ以上のように、2,3枚は絞らなければならない。もちろんどの程度絞るのが良いかは状況に依存する。Sklanskyの提唱による。Harringtonも2+2系ということもあり、Gap Conceptの考え方を支持している。ちなみにTournamentの本をどれか一冊だけということになると、no-limitのHold’emに特化して書かれているHarringtonのHarrington on Hold'em シリーズがお勧め。Sklanskyのも悪くはないが、これだけでは個別の状況には細かく対応出来ないと思う。)

 この二つの考え方はそれぞれ理由があるのだが、純粋にICMの立場からもこれらの戦術を支持する補強材料を示すことが出来る(メインの理由ではないので注意)。具体例を示す。図は、その7で示したS&Gでのチップの価値で残りプレーヤーが5人の場合の曲線を拡大したものである。

 たまたま全てのプレーヤーの残りチップが$200づつで拮抗していたとする。(図の点K)。この状況では全てのプレーヤーのチップの価値はICMで計算するまでもなく等しいので$100/5=$20となる。
 さて、次のハンドでプレーヤーAとBが激しくぶつかり$300ポットの勝負になったとする。即ち勝てば$350の怪獣に化け(図の点L)、負ければ$50の小動物に転落する(図の点M)という大勝負である。
この勝負でAが勝つ確率をpとする。引き分けがないものとするとAが負ける確率は1-pとなる。勝負が終わった後のAの表面的なチップ量の期待値は350p+50(1-p)となる。ここで、図上に線分MLを引いてみるとこれをp対(1-p)に内分した点Sのx座標が、丁度表面的な期待値350p+50(1-p)となる。また同様に考えると、点Sのy座標は勝負が終わった後の、AのチップのICM的価値を表す。即ち、勝負終了後のAの持ちチップ量の期待値とAのチップのICM的期待値の間の関係は、線分ML(紺色の線)で表現される。また、Aの勝率pに応じて線分ML上の点Sの場所が定まる。

 ここで注目すべきは、曲線ML(元の曲線)は上に凸であるため、常に線分MLより上側に来るということである。仮にp=1/2、即ちPocket pair vs. Two over cardsであるとすると、プレーヤーAの表面的なチップの期待値はじゃんけん勝負をしようがしまいが$200であるので点Sと点Kの横軸上の値は等しい。しかしながら点Kのy座標は必ず点Sより大きいのである。即ち直感的には、p=1/2の五分五分のじゃんけん勝負をした場合、ICM的期待値もじゃんけんしようがしまいが変わらないと考えてしまいがちであるが、実は不思議なことになじゃんけんすることによりICM的期待値が減るのである
 なお、ICM的期待値が元の点Kと同じ(=勝負をしてもICM的期待値が変動しない)ポイントをグラフ上で求めるには、Kからx軸方向に引いた直線と線分MLの交点Tを求めれば良い。このときICM的期待値が元の$20を上回るために必要な勝率はMT/MKで求められる。
 なお、このグラフは「一人のプレーヤーを除いて持ちチップ量は等しい」として描いたものであるので、一般的なその他の場合には凡その傾向を表すに過ぎない。例えば、激しくじゃんけんでぶつかったAとB以外のプレーヤーのICM的期待値はわずかではあるが増加しなければならないが(そうしないとA,Bの期待値が減った分が相殺されない)、グラフだけではその効果は視覚的に表現されない。

 そこで、今の例のICM的期待値を適当なICM Calculatorで正確に計算すると
ぶつかった勝者 30.07
ぶつかった敗者 6.23
となり両者の期待値は30.07*1/2+6.23*1/2=18.05となる。即ち5分5分の勝負でぶつかると勝負前の期待値20から約10%減る。一方その分、その他のプレーヤーの期待値は21.23と、少しではあるが寝ているだけで増加する。ちなみに、ぶつかっても期待値が減少しないために必要な勝率を計算すると
30.07*p+6.23*(1-p)=20
を解いて、p=57.8%となる。即ち、じゃんけんよりはかなり高い勝率が必要である。これはGap Conceptと同一の主張となる。また、グラフからも明らかなように、(他のケースもいろいろ数値計算して見ても良い)、今回紹介した効果が「ポットサイズが大きいほど大きくなる」ことも理解出来るであろう。従って、「派手なじゃんけん勝負は避けよ」ということに結びつくのである。

 「寝てるだけで期待値が増加する」という戦略は、無意味に荒っぽいプレーヤーが多数いるfree playや非常に低いレートのトーナメントで経験的に用いている方も多いと思うが、今回説明した現象はこの戦略の正当性を主張するための補強材料にもなっている。もっとも、現実のトーナメントの後半ではBlindとanteが大きくなってくるので、寝てるだけではチップを削られるだけだし、5分5分の勝負でもICM的期待値で得をする局面も多いが、逆に入賞が近づけば近づくほど今回紹介した効果も大きくなることにも注意すべきであろう。この辺りの構造を理解した上で、トーナメント後半の生きるか死ぬかの立ち振る舞いを非常に詳しく実践例を踏まえて紹介しているHarringntonの本の第2部Harrington on Hold'em: Expert Strategy for No-Limit Tournaments: The Endgameを読めば、より深く楽しむことが出来ると思う。

 最後に、ややトリビアになるが、今回のグラフの性質を利用すれば、残りプレーヤー数と自分のチップ量が一定という条件の下では、残りのプレーヤーのチップ量が平均化しているほど自分のチップのICM的価値は小さくなり、残りのプレーヤーが怪獣と小動物にばらければばらけるほどICM的価値が増加するということをより一般的に示すことも出来る。悪平等追放。格差社会大歓迎という訳である。従って、他のプレーヤーがぶつかっているときには、他のプレーヤーの質が同等である限りは、常に金持ちを応援すべしということになる。倫理的には微妙であるが、テーブルでトラブルがあったときに、わざわざ小動物を支持する発言は差し控える程度のことは考えられよう。
 


このコラムは、blog稲妻NFLに随時書いているものをまとめつつある段階の草稿なので読みにくいかも知れません。適当に補間・類推して意味を汲み取って頂ければ幸いです。今後とも加筆する予定ですので、稲妻NFL も随時チェックしてみて下さい。


【ホームページへ戻る】