A Deepmind, a Google által támogatott mesterséges intelligenciával foglalkozó vállalat, létrehozta a Player of Games nevű rendszert, amely várhatóan jól teljesít majd a teljes információs és a hiányos információs játékokban egyaránt. (Ebbe a kategóriába tartozik többek között a póker is.)
A mesterséges intelligenciának ez a felhasználása jelentős potenciállal rendelkezik az számos valós probléma megoldásában is az elkövetkező években.
Az olyan feladatok, mint a leghatékonyabb útvonal megtervezése, az ügyfélkapcsolattartás vagy akár a szerződéskötésekhez kapcsolódó tárgyalások is profitálhatnak az ilyen szakosított mesterséges intelligenciából.
A Cornell Egyetem által kiadott közlemény a következőket tartalmazza a projekt kapcsán:
„Ez egy úgynevezett „általános célú” algoritmus, amely egyesíti a korábbi megközelítéseket. Ötvözi az irányított keresést, az önálló, játékos tanulást, és a játékelméleten alapúló döntéshozást"
"A Player of Games az első olyan algoritmus, amely kiemelkedő eredményt ért el nagyméretű mintán, mind teljes, mind hiányos információjú játékokban. Ez egy fontos mérföldkő a tetszőleges környezetbe adaptálható általános algoritmusok felé”
Amikor két mesterséges intelligencia összeakaszkodik:
A program nemrégiben megmérkőzött a Slumbot ellen, amely a legerősebb, nyilvánosan elérhető NL Hold’em mesterséges intelligencia programnak számít, és könnyedén győzött, Facebook ReBel programja pedig fel sem tudta venni vele a versenyt.
A Player of Games a Stockfish, az egyik legerősebb sakkmotor ellen is megmérkőzött, és nem vallott szégyent, sőt sok paraméterben erősebbnek is bizonyult. Az AlphaZero ellen egy go meccsen a játszmák mindössze 0,5%-át nyerte meg, de úgy vélték, hogy majdnem egy profi emberi játékos szintjén teljesít.
Hogy csinálja, mi a technikai háttér:
A mesterséges intelligencia a tanulást egy szabványos fa keresés algoritmussal kezdi.
A trükk a következő fázisban van, ez az a különbség, ami a teljes, és a hiányos információval kapcsolatos kihívásokban egyaránt nagyszerűvé teszi. Az algoritmus figyelembe veszi a korábbi döntéseinket, modellezi a lehetséges kimeneteleket, majd kiszámolja, hogy ezek közül melyik a lehető „legkisebb utólagos megbánással járó lehetőség” Counterfactual Regret Minimization (CFR) és azt választja.
Martin Schmid, a DeepMind vezető kutatója elmondta:
"Ez egy lépés az általános mesterséges intelligencia felé - a Player of Games képes teljes és hiányos információjú játékokat is játszani, Az AlphaZero erősebb, mint a Player of Games a teljesinformációs játékokban, de [nem] hiányos információjú játékokra tervezték."
Az általános AI az egyik legizgalmasabb és legmegosztóbb előrelépés, amelynek a következő évtizedekben tanúi lehetünk.
A korábban megoldhatatlannak tartott feladatok kapcsán, képesek lehetnek tökéletes stratégiájuknak köszönhetően, a hibamentes kivitelezésre.
A kérdés csupán az, hogy ez mennyiben fogja rossz értelemben befolyásolni az amúgy tökéletlen mindennapjainkat.