A pókerben olyan készségekre van szükség, amelyekről azt hittük, hogy az emberek számára egyedülállóak. A sikeres játékhoz nem elegendő a szabályok alapvető ismerete, fontos felismerni a blöff hatékonyságát és alkalmazási helyeit. A játék komplexitása rengeteg izgalmat hordoz magában, és a legfontosabb információk közé sorolható az is, hogy ellenfeleink miként cselekednek bizonyos szituációkban. Korábban hallhattunk már arról, hogy Liberatus heads-up profikat tudott megverni saját műfajukban, azonban mostanáig úgy gondolták, hogy a több résztvevős játékok bonyolultságának megfejtése még jó időbe telhet majd a mesterséges intelligenciának. Nos, úgy tűnik tévedés volt ezt feltételezni.
A Carnegie Mellon Egyetem (CMU) és a Facebook közös csapata hosszas fejlesztés után létrehozott egy olyan AI-t, amely sikerrel veszi a 6-max no-limit hold'em játékot. A kísérlethez olyan játékosokat kértek fel, akik már legalább 1 millió dollárt nyertek karrierjük során ebben a műfajban. Az asztalnál helyet foglalhatott Darren Elias kétszeres WSOP bajnok és négyszeres WPT bajnok, Chris Ferguson hatszoros WSOP bajnok, valamint a a világ legjobb NL Hold'em cash game játékosának tartott Linus 'LLinusLLove' Loeliger is. További résztvevők voltak: Greg Merson (WSOP Main Event győztes 2012), Jimmy Chou, Seth Davies, Michael Gagliano, Anthony Gregg, Dong Kim, Jason Les, Daniel McAulay, Nick Petrangelo, Sean Ruane, Trevor Savage és Jake Toole.
Más kérdés, hogy Pluribus azért nem nagy mintát, mindössze 5.000 leosztást játszott a profik ellen. Ezalatt mindenesetre többet nyert, mint az ellenfelei. Átlagosan 5bb/100-at tudott hozni ellenük. Többféle felállás szerint is tesztelték a gépet (5 AI vs. 1 profi és 5 profi vs 1 AI). A hírek szerint Pluribus néhány kitűnően megválasztott stratégiát tudott bevetni. Blöffjei jól működtek az esetek nagy százalékában, valamint hero callolt is jónéhányat.
Az algoritmus annyira sikeres volt, hogy a kutatók úgy döntöttek, nem bocsátják ki a forráskódot és létrehozásának részleteit. „Ez veszélyes lehetne a póker szempontjából” - mondta Noam Brown, a Facebook kutatója és a CMU egykori diákja, aki segítette az algoritmus fejlesztését.
„Általában idővel kitalálod, hogy hol van az ellenfeled gyenge pontja, de nem találtam gyenge pontot” - ezt már Jason Les mondta, aki részt vett a játékban. „Ez az AI annyira erős, hogy nem tudtuk exploitálni egyáltalán. Igazából hibátlanul blöfföl. Azt mondanám, hogy sokkal hatékonyabban csinálja, mint a legtöbb ember és ezért olyan nehéz a játék ellene. Rengetegszer helyezett nyomás alá”.
Les egyébként meglehetősen jól szerepelt a játékban, de állítása szerint alapvetően inkább szerencsés volt. Többször is elkapta a blöffjeit Pluribus, és szerencsére is szüksége volt néhány partiban. Hozzátette, az AI még néhány új trükköt is tanított neki. „Volt néhány spot, ami felnyitotta a szemem, például, hogy hogyan is lehetne még jobban játszani multiway kasszákban” - mondta a profi.
„Általában idővel kitalálod, hogy hol van az ellenfeled gyenge pontja, de nem találtam gyenge pontot” - ezt már Jason Les mondta, aki részt vett a játékban. „Ez az AI annyira erős, hogy nem tudtuk exploitálni egyáltalán. Igazából hibátlanul blöfföl. Azt mondanám, hogy sokkal hatékonyabban csinálja, mint a legtöbb ember és ezért olyan nehéz a játék ellene. Rengetegszer helyezett nyomás alá”.
Les egyébként meglehetősen jól szerepelt a játékban, de állítása szerint alapvetően inkább szerencsés volt. Többször is elkapta a blöffjeit Pluribus, és szerencsére is szüksége volt néhány partiban. Hozzátette, az AI még néhány új trükköt is tanított neki. „Volt néhány spot, ami felnyitotta a szemem, például, hogy hogyan is lehetne még jobban játszani multiway kasszákban” - mondta a profi.
Az elmúlt években a sakk és a Go játékok voltak a mérce a mesterséges intelligencia fejlesztésében, azonban a gépek által eddig meghódított játékok szinte kivétel nélkül két játékos részvételével zajlottak, és a legtöbbet úgy játszották le eddig, hogy az ellenfelek cselekvési lehetőségei meghatározottak voltak (pl. véges számű bábúval léphet sakkban). Ezzel szemben a póker egészen új kihívás.
„Lélegzetelállító” - így értékelt Tuomas Sandholm, a Carnegie Mellon professzora, aki a csapatot erősítette a fejlesztések során. „Nem gondoltam volna, hogy ide fogunk jutni ilyen hamar. Úgy egy éve kezdtem elhinni, hogy talán sikerülhet.”
Sandholm és Brown 2017-ben már fejlesztett egy heads-up programot is, de úgy tűnt, nagy problémába ütköznek a 6-max verzióval. Több játékos legyőzése azért is bonyolultabb, mert nincs abszolút optimális stratégia, nem alkalmazható a Nash-egyensúly, és ugyanezen elv miatt például a PIO-solver is csak heads-up elemzéseket tud készíteni.
Továbbá figyelemre méltó a kutatásban az is, hogy amíg a korábbi algoritmusoknak szuperszámítógépekre volt szükségük, a Pluribus egyetlen gépen fut. „Hat játékossal a játék sokkal bonyolultabb, de az adott partiban a gép gondolkodási ideje mégsem tarthat túl sokáig” - mondja Brown, aki jelenleg a Facebook Mesterséges Intelligencia Kutatás (FAIR) csoportjának tagja. „Az egész folyamatban egy kereső algoritmus a kulcs.”
A végeredmény a mesterséges intelligencia egy nagy mérföldköve. A pókerben alkalmazott elemzési és döntéshozatali technikák sok az élet más területein is felhasználható lehetőséggel rendelkeznek, az árképzésektől kezdve akár az önjáró autók forgalomirányításáig. Sandholm és más kutatók együtt dolgoznak egy katonai-stratégiai konzultációs cégben, amely különböző védelmi projekteken dolgozik. Az áttörő siker az ott felmerülő megoldandó problémákhoz is hozzájárulhat, a fejlesztő azonban hangsúlyozta, hogy a megírt kód egyelőre csak a pókert kezeli ennyire hatékonyan, más kontextusban további fejlesztésekre van szükség. Vincent Conitzer szerint, aki a Duke Egyetem professzora és az AI és a játékelméletre szakterületeire specializálódott, valóban fontos lesz mihamarabb megvizsgálni, hogy a póker esetében alkalmazott módszereik könnyen átültethetőek-e más több játékos által játszott játékokra.
Mindenesetre a Facebook és a a CMU csapata igyekszik mindenkit megnyugtatni. A továbbiakban nem tervezik a programot pókeres területeken gyakorlatban alkalmazni, azonban más multi-player játékok fejlesztéséhez biztosan megpróbálják majd felhasználni.
Mi a véleményetek a történtekről?