https://frosthead.com

AI se uči timskega dela s prevlado v več igračih video iger

Računalniki že desetletja prevladujejo pri ljudeh v igrah ena na ena, kot je šah, vendar je pridobivanje umetne inteligence za sodelovanje s soigralci nekoliko oteženo. Zdaj so raziskovalci Googlovega projekta DeepMind naučili igralce AI, da skupaj sodelujejo v skupinah tako z ljudmi kot z drugimi računalniki, da bi tekmovali v videoigri Quake III Arena iz leta 1999.

Edd Gent iz Science poroča, da ima AI le enega nasprotnika, ponavadi precej dobro, saj samo predvideva možne poteze enega samega uma. Toda timsko delo je povsem druga stvar, saj vključuje dejanja, v katerih računalniki običajno niso dobri, kot je napovedovanje, kako se bo vedla skupina soigralcev. Da bi AI bil resnično uporaben, se mora naučiti sodelovanja z drugimi inteligencami.

Googlova ekipa DeepMind v objavi na blogu razloži:

"Milijarde ljudi naseljuje planet, vsak s svojimi posameznimi cilji in dejanji, vendar se še vedno lahko združi prek skupin, organizacij in društev v impresivnih prikazih kolektivne inteligence. To je nastavitev, ki ji pravimo učenje z več agenti: številni posamezni agenti morajo delovati neodvisno, hkrati pa se naučiti interakcije in sodelovanja z drugimi agenti. To je izjemno težaven problem - ker se s posredniki za prilagajanje svet nenehno spreminja. "

Večplastne video igre za prvo osebo, v katerih ekipe igralcev tečejo po virtualnih svetovih, ponavadi med seboj streljajo pištole ali izstrelke granat, so odlično mesto za AI, da se naučijo podrobnosti timskega dela. Vsak igralec mora delovati posamično in sprejemati odločitve, ki koristijo ekipi kot celoti.

Za študijo je ekipa usposobila AI za zajemanje zastave na platformi Quake III Arena . Pravila so dokaj preprosta: dve ekipi se spopadeta na bojišču kot na bojišču. Cilj je ujeti čim več navideznih zastav drugih ekip, hkrati pa zaščititi svoje, in karkoli ekipa ujame največ zastav v petih minutah zmag. V praksi pa se stvari lahko zelo zapletejo.

Ekipa DeepMind je ustvarila 30 algoritmov nevronske mreže in se med seboj borila na vrsti naključno ustvarjenih zemljevidov iger. Botovi so dosegali točke s tem, da so ujeli zastave in zapirali druge igralce ter jih poslali nazaj na območje znova postavljenega mesta, kjer se njihov lik ponovno zažene. Sprva so se dejanja botov zdela naključna. Vendar bolj ko so igrali, boljši so postali. Vsa nevronska omrežja, ki so dosledno izgubila, so bila odpravljena in nadomeščena s spremenjenimi različicami zmagovalnega AI Na koncu 450.000 iger je ekipa okronala eno nevronsko mrežo - poimenovano Za zmago (FTW) - kot prvaka.

Skupina DeepMind je igrala algoritem FTW proti zrcalnim botom, ki jim manjkajo učne sposobnosti AI, nato pa tudi proti človeškim ekipam. FTW je podrl vse izzivalce.

Skupina je nato organizirala turnir, na katerem se je 40 ljudi igralo naključno, tako soigralci kot nasprotniki bota. Glede na objavo na spletnem dnevniku so človeški igralci ugotovili, da so boti bolj sodelovali kot njihovi soigralci iz resničnega življenja. Ljudski igralci v paru z agenti FTW so lahko premagali kibernetske bojevnike na približno 5 odstotkih tekem.

Kot so izvedeli, so boti odkrili nekaj strategij, ki so jih človeški igralci dolgo prevzeli, na primer visi blizu točke, na kateri je zastava znova zastala, da jo zgrabijo, ko se ponovno pojavi. Ekipe FTW so našle tudi hrošče, ki bi ga lahko izkoristile: če so streljale lastnega soigralca v hrbet, jim je hitro povečal, kar so izkoristile v svojo korist.

"Kar je bilo med razvojem tega projekta neverjetno, je bilo pojavljanje nekaterih takšnih vedenj na visoki ravni, " za Gent pripoveduje raziskovalec DeepMind in glavni avtor Max Jaderberg. "To so stvari, na katere lahko govorimo kot o človeških igralcih."

Eden glavnih razlogov, da so bili uvrščeni boljši od človeških igralcev, je, da so bili hitri in natančni strelci, zaradi česar so bili hitreje v žrebu kot njihovi človeški nasprotniki. A to ni bil edini dejavnik njihovega uspeha. Glede na blog, ko so raziskovalci v četrt sekunde zakasnili reakcijski čas v robo-strelce, bi jih najboljši ljudje lahko premagali le približno 21 odstotkov časa.

Od te začetne študije so se FTW in njeni potomci sprostili na polnem bojišču Quake III Arena Arena in pokazali, da lahko obvladajo še bolj zapleten svet z več možnostmi in odtenki. Ustvarili so tudi bota, ki se odlikuje v izjemno zapleteni vesoljski igri Stracraft II.

Toda raziskave ne vključujejo samo boljših algoritmov za video igre. Spoznavanje timskega dela bi lahko sčasoma pomagalo AI delati v voznih parkih avtomobilov z lastno vožnjo ali morda nekega dne postali robotski pomočniki, ki pomagajo predvideti potrebe kirurgov, poroča Science 's Gent.

Vendar vsi ne mislijo, da so arkadne zvezde boti resnično timsko delo. Raziskovalec AI Mark Riedl iz Georgia Tech je za New York Times povedal, da so boti tako dobri v igri, ker vsak poglobljeno razume strategije. Vendar to ni nujno sodelovanje, saj ekipam AI manjka en ključni element človeškega timskega dela: komunikacija in namerno sodelovanje.

In seveda jim primanjkuje tudi drugega odlika skupne izkušnje z video igrami: smeti, ki govorijo z drugo ekipo.

AI se uči timskega dela s prevlado v več igračih video iger