Huvitav

Tehisintellekt, mille on välja töötanud Facebook ja Carnegie Mellon, võidab pokkeri meistreid

Tehisintellekt, mille on välja töötanud Facebook ja Carnegie Mellon, võidab pokkeri meistreid

Katy Lederer, raamatu autorPokkerinägu: tüdrukupõlv mängurite seaskord ütles: "pokkeri kardinaalne patt on ... emotsionaalselt seotud".

Mis oleks siis parem mängija kui tehisintellekt, mis pole võimeline tõelisteks emotsioonideks?

Tehisintellekti programm, mille on välja töötanud Carnegie Melloni ülikool koostöös Facebooki tehisintellektiga, on just see ja see on võitnud maailma ühe parima mängijaga Texas Hold'em pokkerimängu, kus mängijaid on kuus.

SEOTUD: DEEPMIND ON KA PAREM KUI MEIE KOOSTÖÖ ESIMESE ISIKU LASKURI VIDEOGAAMIDES

Saage tuttavaks Pluribusega

Tehisintellekt nimega Pluribus alistas enamiku World Poker Touri tiitlite rekordi omaniku Darren Eliase ja kuue World Series of Poker võitja Chris "Jesus" Fergusoni.

Iga proff mängis 5000 kätt pokkerit Pluribuse viie versiooni vastu. Teises katses nägi Pluribus 13 proffi, kes kõik on pokkerit mängides võitnud üle miljoni dollari.

Pluribus tõusis võidukaks ka pärast seda, kui mängis korraga viie profi vastu - kokku 10 000 kätt.

Üliinimlik esitus

Pluribuse arendasid arvutiteaduse professor Angel Jordan Tuomas Sandholm ja Noam Brown, kes lõpetab praegu doktorikraadi Carnegie Melloni arvutiteaduse osakonnas Facebooki AI teadlasena.

Pressiteates rääkis Sandholm verstapostist, mille nad selle uue tehisintellektiga on saavutanud:

"Pluribus saavutas mitme mängijaga pokkeris üleinimliku soorituse, mis on tehisintellekti ja aastakümneid avatud mänguteoorias tunnustatud verstapost."

"Siiani on üliinimlikud tehisintellekti teetähised strateegilises arutluses piirdunud kahe osapoole konkurentsiga. Võimalus võita veel viis mängijat sellises keerulises mängus avab uusi võimalusi tehisintellekti kasutamiseks mitmesuguste reaalsete probleemide lahendamiseks."

Märkimisväärse tehisintellekti arendamine

Pluribus arvutas oma "kavandi" strateegia välja, mängides endast kuus eksemplari. Uus piiratud välimusega otsingu algoritm on peamine allikas Pluribuse üleinimlikule võimele võita mitme mängijaga pokker.

Tehisintellekt kasutas arvutust märkimisväärselt tõhusalt. Teised mängude märkimisväärsete verstapostide saavutanud tehisintellektid, näiteks DeepMind, on tavaliselt kasutanud palju servereid ja GPU-de farme. Pluribus arvutas oma kavandamisstrateegia kaheksa päevaga, kasutades otseülekande ajal vaid 12 400 põhitundi ja ainult 28 südamikku.

"Me tunneme rõõmu [Pluribuse] esitusest ja usume, et mõned selle mängustrateegiad võivad isegi muuta seda, kuidas profid mängu mängivad," ütles Noam Brown.

Täna on ajakiri avaldanud uurimistöö, mis kirjeldab Pluribuse valmistamise viisiTeadus.


Vaata videot: 04 - Database Storage II CMU Databases Systems. Fall 2019 (Mai 2021).