https://frosthead.com

Ta AI igranje pokra zna, kdaj jih je treba držati in kdaj jih zložiti

Računalniški program, imenovan Pluribus, je premagal poker prednosti v seriji šestih igralcev brez omejitev Texas Hold'em in dosegel mejnik v raziskavah umetne inteligence. Je prvi bot, ki je v kompleksnem tekmovanju za več igralcev premagal človeka.

Kot poročajo raziskovalci iz Facebookovega laboratorija AI in univerze Carnegie Mellon v reviji Science, je Pluribus postal zmagovalec v dvobojih, kjer prevladujejo ljudje in algoritmi. Na začetku Merrit Kennedy piše za NPR, pet različic bota se je spopadlo z enim profesionalnim igralcem pokra; v naslednjem krogu poskusov je en bot igral proti petim ljudem. Na objavi na spletnem dnevniku na Facebooku je AI v povprečju zmagal okoli 5 dolarjev na roko ali 1000 dolarjev na uro, ko je igral proti petim človeškim nasprotnikom. Ta stopnja med poker profesionalci velja za "odločilno mero zmage".

V pogovoru s Kennedyjem je štirikratni prvak World Poker Tour Darren Elias pojasnil, da je Pluribusu pomagal trenirati tako, da se je potegoval za štiri mize botskih tekmecev in opozoril znanstvenike, ko je AI naredil napako. Kmalu se je bot "zelo hitro izboljševal, od tega, da je bil povprečen igralec v bistvu igralec pokra na svetovni ravni v nekaj dneh in tednih." Izkušnja, pravi Elias, je bila "precej strašljiva."

Po Vergejevem Jamesu Vincentu je Pluribus - presenetljivo poceni AI, usposobljen z manj kot 150 dolarjev vrednimi sredstvi za računalništvo v oblaku - še dodatno obvladal strategijo pokra, tako da je igral proti lastnim kopijam in se učil prek poskusov in napak. Kot Jennifer Ouellette ugotavlja za Ars Technica, je bot hitro spoznal, da je njen najboljši postopek delovanja kombinacija igranja in nepredvidljivih potez.

Večina človeških strokovnjakov se izogiba »donk stavam«, pri katerih igralec konča en krog s klicem in naslednji začne s stavo, toda Pluribus je zlahka sprejel nepriljubljeno strategijo. Obenem je, poroča Ouellette, AI ponudil tudi nenavadne velikosti stav in pokazal boljšo randomizacijo kot nasprotniki.

"Njegova največja moč je zmožnost uporabe mešanih strategij, " je dejal Elias v izjavi CMU. "To je isto, kar ljudje poskušajo storiti. Za človeka gre za usmrtitev - to storiti na povsem naključen način in to storiti dosledno. Večina ljudi preprosto ne more. "

Pluribus ni prvi AI, ki igra poker, ki je premagal človeške strokovnjake. Leta 2017 sta ustvarjalca bota, Noam Brown in Tuomas Sandholm, razvila zgodnejšo iteracijo programa, imenovano Libratus. Ta AI je odločilno premagal štiri poker profesionalce v 120.000 rokah igralca Texas Hold'ema, a kot pojasnjuje objava na spletnem dnevniku na Facebooku, je bilo omejeno s tem, da se je hkrati soočil le z enim nasprotnikom.

Po mnenju Will Knight, ki ga je objavil MIT Technology Review, je poker AI izziv, saj vključuje več igralcev in množico skritih informacij. V primerjavi z igrami, kot sta šah in go, sta samo dva udeleženca, položaj igralcev pa je viden vsem.

Za premagovanje teh ovir sta Brown in Sandholm ustvarila algoritem, ki je načrtoval napovedovanje naslednjih dveh ali treh potez nasprotnika, namesto da bi meril njihove korake do konca igre. Čeprav se zdi, da ta strategija daje prednost kratkoročnemu dobičku pred dolgoročnimi dobički, Verge 's Vincent piše, da je "kratkotrajna natančnost res vse, kar potrebujete."

Če gremo naprej, bi se lahko za več igralce, kot je Pluribus, uporabljalo za oblikovanje zdravil, ki se lahko borijo proti antibiotikom odpornim bakterijam, pa tudi za izboljšanje kibernetske varnosti in vojaških robotskih sistemov. Kot Pri Ouellette Ars Technica ugotavljajo, da druge možne aplikacije vključujejo nadziranje večstranskih pogajanj, cenovnih izdelkov in strategij za zbiranje ponudb na podlagi možganov.

Zaenkrat, Brown pravi Knightu, bo algoritem večinoma ostal v zavojih - predvsem za zaščito spletne poker industrije pred povzročanjem uničujočih finančnih izgub.

Raziskovalec zaključuje, "To bi lahko bilo zelo nevarno za poker skupnost."

Ta AI igranje pokra zna, kdaj jih je treba držati in kdaj jih zložiti