https://frosthead.com

Googlov novi AI je mojster iger, toda kako se primerja s človeškim umom?

Za ljudi lahko šah traja celo življenje. Toda novi program umetne inteligence Google DeepMind AlphaZero se lahko nauči, da bo v nekaj urah osvojil ploščo.

Gradimo na svojem preteklem uspehu s programom AlphaGo - nizom računalniških programov, zasnovanih za igranje kitajske družabne igre Go - Google se ponaša, da njegov novi AlphaZero dosega raven "nadčloveških zmogljivosti" ne samo pri eni družabni igri, temveč pri treh: Pojdi, šah in shogi (v bistvu japonski šah). Ekipa računalniških znanstvenikov in inženirjev, ki jo vodi Googlov David Silver, je o svojih ugotovitvah poročala nedavno v reviji Science .

"Pred tem bi lahko s strojnim učenjem stroj naredil točno tisto, kar želite - vendar samo to, " pravi Ayanna Howard, strokovnjakinja za interaktivno računalništvo in umetno inteligenco na Georgia Institute of Technology, ki ni sodelovala pri raziskave. "Toda AlphaZero kaže, da lahko imate algoritem, ki ni tako [specifičen], in se lahko uči znotraj določenih parametrov."

Pametno programiranje AlphaZero zagotovo pospešuje predvajanje na področju igranja tako za ljudi kot za stroje, toda Google je že dolgo videl nekaj večjega: inženirsko inteligenco.

Raziskovalci so previdni, da ne trdijo, da je AlphaZero na robu svetovne prevlade (drugi so malo hitreje skočili pištolo). Kljub temu pa se Silver in ostali iz skupine DeepMind upajo, da bodo nekoč videli podoben sistem, ki se uporablja za oblikovanje drog ali znanost o materialih.

Kaj torej AlphaZero tako navdušuje?

Igranja že dolgo veljajo za zlati standard v raziskavah umetne inteligence. Strukturirane interaktivne igre so poenostavitve resničnih scenarijev: sprejeti je treba težke odločitve; zmage in porazi povečajo stopnjo; in napovedovanje, kritično razmišljanje in strategija so ključni.

Kodiranje te vrste spretnosti je težavno. Starejše igralne AI, vključno s prvimi prototipi izvirnega AlphaGo-ja, so bile ponavadi polne kod in podatkov, da posnemajo izkušnjo, navadno pridobljeno z leti naravnega, človeškega igranja (v bistvu je pasivno, programsko izhodišče smeti). Raziskovalci so z AlphaGo Zero (najnovejšo različico AlphaGo-ja) in zdaj AlphaZero-jem programu dali le en podatek: pravila igre. Nato se je sistem lovil in se aktivno naučil trikov same trgovine.

Pojdi AlphaZero temelji na AlphaGo Zero, delu paketa AlphaGo, ki je zasnovan za igranje kitajske družabne igre Go, prikazano zgoraj. Zgodnje iteracije izvirnega programa so bile podane iz iger med ljudmi in človekom; kasnejše različice, ki se ukvarjajo s samoučenjem, pri čemer je programska oprema igrala igre proti sebi, da bi se naučila lastne strategije. (Chad Miller / Flickr / CC BY-SA 2.0)

Ta strategija, ki se imenuje učilno okrepitev samoigranja, je v bistvu natanko takšna, kot se sliši: AlphaZero se je za iteracijo po iteraciji igral v iteraciji, saj je svoje sposobnosti preizkusil in napakal. In pristop brutalne sile se je izplačal. Za razliko od AlphaGo Zero, AlphaZero ne igra samo Go: Tudi v šahu in shogiju lahko premaga najboljše AI v poslu. Izobraževalni proces je prav tako izjemno učinkovit, saj potrebujete le dve, štiri ali 30 ur samoizvajanja, da bi nadgradili programe, ki so posebej prilagojeni za obvladovanje šogija, šaha in go. Avtorji študije niso poročali o nobenem primeru, da bi AlphaZero tekoč naletel na dejansko človeka, pravi Howard. (Raziskovalci so morda domnevali, da bi bilo takšno usklajevanje nesmiselno. Glede na to, da ti programi dosledno krčijo svoje človeške kolege, bi bilo to nesmiselno.)

Tudi AlphaZero je uspel ukrotiti Stockfish (zdaj neporaženi mojster AI šaha) in Elmo (nekdanji strokovnjak za AI shogi), čeprav je med igranjem ocenil manj možnih naslednjih potez. Ker so zadevni algoritmi sami po sebi različni in lahko porabijo različne količine energije, je težko AlphaZero neposredno primerjati z drugimi, starejšimi programi, opozarja Joanna Bryson, ki študira umetno inteligenco na Univerzi v Bath v Združenem kraljestvu in je ne prispeva k AlphaZero.

Google hrani mamo o številnih drobnih tiskih svoje programske opreme in AlphaZero ni izjema. Medtem ko ne vemo vsega o porabi energije programa, je jasno še to: AlphaZero mora pakirati nekaj resnih računskih strelivov. V teh redkih urah treninga se je program obdržal zelo zaseden, vključil se je v več deset ali sto tisoč krogov vadbe, da bi svojo strategijo družabnih iger pospravil - veliko več, kot bi potreboval človeški igralec (ali v večini primerov lahko celo doseči) v prizadevanju za strokovnost.

Ta intenzivni režim je uporabil tudi 5000 lastnih Googlovih lastnih procesorskih enot ali TPU-jev, ki po nekaterih ocenah porabijo približno 200 vatov na čip. Ne glede na to, kako ga rezite, AlphaZero potrebuje veliko več energije kot človeški možgani, ki delujejo na približno 20 vatov.

Upoštevati je treba absolutno porabo energije AlphaZero, dodaja Bin Yu, ki deluje na vmesniku statistike, strojnega učenja in umetne inteligence na kalifornijski univerzi v Berkeleyju. AlphaZero je močan, vendar morda ne bo dober zalogaj - še posebej, če dodate ure za osebe, ki so se vključile v njegovo ustvarjanje in izvedbo.

Energetsko drag ali ne, AlphaZero naredi pljusk: Večina AI je hiperpecializiranih za eno samo nalogo, zaradi česar je ta nov program - s svojo trojno grožnjo igranja - izjemno prilagodljiv. "Impresivno je, da je AlphaZero lahko uporabil isto arhitekturo za tri različne igre, " pravi Yu.

Torej, ja. Googlov novi AI na več načinov postavlja novo oznako. Hitro je. Močan je. Toda ali je to pametno?

Tu se definicije začnejo zamazati. "AlphaZero se je lahko od začetka brez človeškega znanja naučil igrati vsako od teh iger do nadčloveške ravni, " je deepMind Silver povedal v izjavi za medije.

Tudi če strokovno znanje v družabnih igrah zahteva duševno ostrino, imajo vsi pooblaščenci resničnega sveta svoje meje. V trenutni iteraciji lahko AlphaZero doseže z zmago v igrah, zasnovanih s človekom - kar morda ne bo zagotovilo zaskrbljujoče oznake "nadčloveka". Poleg tega, če AlphaZero preseneti z novim naborom pravil sredi igre, se lahko zaplete. Dejanski človeški možgani lahko na svojem repertoarju shranijo veliko več kot tri družabne igre.

Še več, če primerjamo osnovno črto AlphaZero s tabula rasa (prazna skrilavca) - kot to počnejo raziskovalci - je raztezanje, pravi Bryson. Programerji jo še vedno hranijo kot ključni del človekovega znanja: pravila igre, ki jo bo igral. "Ima veliko manj kot prej, " je dodal Bryson, "toda najpomembnejše je, da so še vedno določena pravila. Te so izrecne. "

In ta neokusna pravila bi lahko pomenila veliko oviro. "Čeprav se ti programi naučijo izvajati, potrebujejo pravila na cesti, " pravi Howard. "Svet je poln nalog, ki nimajo teh pravil."

Ko se potisne pobuda, je AlphaZero nadgradnja že tako zmogljivega programa - AlphaGo Zero, razlaga JoAnn Paul, ki na Virginijskem politehničnem inštitutu in državni univerzi študira umetno inteligenco in računalniške sanje in ni bil vključen v nove raziskave. AlphaZero uporablja veliko istih gradnikov in algoritmov kot AlphaGo Zero in še vedno predstavlja le podmnožico resničnih pametnic. "Mislila sem, da je ta nov razvoj bolj evolucijski kot revolucionarni, " doda. "Nobenega od teh algoritmov ni mogoče ustvariti . Inteligenca govori tudi o pripovedovanju zgodb. Predstavlja si stvari, ki jih še ni. V računalnikih ne razmišljamo v tem smislu. "

Del težave je, da še vedno ni soglasja o resnični definiciji "inteligence", pravi Yu, in ne le na področju tehnologije. "Še vedno ni jasno, kako treniramo kritično razmišljajoča bitja ali kako uporabljamo nezavedne možgane, " doda.

Do danes mnogi raziskovalci verjamejo, da obstaja verjetno več vrst inteligence. In dotikanje ene daleč od tega zagotavlja sestavine za drugo. Na primer, nekateri najbolj pametni ljudje tam so grozni v šahu.

S temi omejitvami Yu-jeva vizija prihodnosti umetne inteligence združuje ljudi in stroje v nekakšni kovoluciji. Stroji se bodo pri določenih nalogah zagotovo še bolj izkazali, pojasnjuje, toda človeški vložek in nadzor bosta vedno potrebna za nadomestilo nedovoljenih.

Seveda ne vemo, kako se bodo stvari v AI areni otresle. Vmes imamo veliko za razmisliti. "Ti računalniki so močni in lahko določene stvari naredijo bolje, kot lahko človek, " pravi Paul. "Toda to še vedno ne presega skrivnosti inteligence."


Ta članek je bil prvotno objavljen na NOVA.
Googlov novi AI je mojster iger, toda kako se primerja s človeškim umom?