https://frosthead.com

Turingov test nekaj meri, vendar to ni "inteligenca"

Alan Turing, eden od očetov računalniške dobe, je bil izjemno pameten človek. V bistvu je tako pameten, da je razumel, da je izraz "strojna inteligenca" skoraj nesmiseln. Bolje, je razmišljal, da bi spregovoril o tem, kaj lahko stroj dejansko naredi: Ali lahko govori? Ali lahko zadrži pogovor? Vsaj to lahko poskusimo proučiti. Turing je na koncu predlagal tisto, kar je postalo znano kot "Turingov test": Če sodnik ne more ugotoviti, katera od skritih oseb je človek in katera umetna, je stroj "opravil" test - to je točno tisto, kar naj bi se zgodilo minulo soboto v Londonu.

Sorodne vsebine

  • Silicijska dolina je svoj uspeh tej genialnosti teh tehnologij, o katerih še nikoli niste slišali
  • 60-letna napoved Alana Turinga o vzorcih v naravi se je izkazala za resnično

"S ponosom izjavljamo, da je bil test Alana Turinga prvič opravljen, " je ob objavi rezultatov dejal eden od organizatorjev Kevin Warwick z Univerze v Readingu. Zmagovalni klepet se imenuje "Eugene Goostman", računalniški program, ki posnema osebnost 13-letnega ukrajinskega fanta. "Eugene" je uspelo prepričati 33 odstotkov sodnikov, da je človek na sobotni prireditvi, ki je potekala v pisarnah kraljeve družbe v Londonu ob 60-letnici Turingove smrti. (Homoseksualec Turing je bil leta 1952 obsojen zaradi hude nespodobnosti in zanj je bilo odrejeno hormonsko "zdravljenje" kot del sporazuma o priznanju krivde. Dve leti pozneje je zaradi očitnega samomora umrl zaradi zastrupitve s cianidom.)

Toda na vrsti je previdna beseda. "Inteligenca" je bila vedno spolzka tema, zlasti Turingov test pa je bil dolgo sporen s polemiko. Turing je opisal, kako bo to delovalo v dokumentu iz leta 1950 z naslovom "Računalniški stroji in inteligenca". Zamisel je prevzel iz tradicionalne viktorijanske pariške igre, kjer poskušate ugotoviti, ali je oseba, ki se skriva za zaveso, moški ali ženska, samo s postavljanjem vprašanj. (Odgovore na vprašanja je bilo treba zapisati, ker bi bil glas oddaja.) Evo, kako bi delovala Turingova različica: Sodnika bi morali sedeti pred dvema zavesama, ne da bi vedeli, kaj je za njimi . Za eno zaveso je človek; zadaj je računalnik. Sodnik lahko postavi vprašanja kateri koli od obeh skritih oseb. Na podlagi odgovorov sodnik poskuša ugotoviti, ali je skrita oseba človek ali stroj. (Turing je pogovarjal, da so pogovor posredovali teletipični stroji; danes lahko uporabljamo poljuben elektronski, besedilni vmesnik, kot je vrsta, ki se uporablja v internetnih klepetalnicah ali takojšnje sporočanje.)

Turing je špekuliral, da do leta 2000 "povprečen zasliševalec ne bo imel več kot 70 odstotkov možnosti za pravo identifikacijo" - to pomeni, da bi računalniški programi sodnike umestili 30 odstotkov časa - po petih minutah zasliševanja. Pomembnih je pet minut. Turing ni govoril o časovni omejitvi kot sestavnem delu testa in lahko bi trdili, da bi moral stroj resnično opraviti test, ki bi ga lahko izvedli s kakršnimi koli vprašanji. Verjetno je bilo pet minutno merilo poljubno, vendar nujno potrebno. Leto 2000 je prihajalo in odhajalo, chatboti so le ustavili napredek. (V bolj treznem trenutku je Turing odgovoril na vprašanje BBC-jevega intervjuvanca iz leta 1952, da bo minilo 100 let, preden bo stroj opravil test.)

Leta 2012 sem bil sodnik v "Turingovem testnem maratonu", največjem doslej naboru Turingovih testov; potekal je v parku Bletchley v Angliji, na mestu Turingovega vitalnega dela za prebijanje kode v zadnjih letih druge svetovne vojne. (Organizirala ga je ista ekipa, ki je vodila sobotni dogodek. Takrat je zmagovala tudi starejša različica Eugeneja.) Priprava sobotne prireditve je bila enaka kot leta 2012: Sodniki so svoja vprašanja vtipkali v računalnik, nato počakali, da se odgovori prikažejo na njihovih zaslonih; chatboti in "skriti ljudje" so bili v drugi sobi, zunaj pogleda.

Prva stvar, na katero sem postala hiperzavestna, je, da ko sodiš na Turingov test, mine pet minut precej hitro. In krajši je pogovor, večja je prednost računalnika; daljše je zasliševanje, večja je verjetnost, da se bo računalnik oddal. Rada bi poimenovala učinek manekenke: Ste se kdaj opravičili manekenki v veleblagovnici, ob predpostavki, da ste pravkar naleteli na živega človeka? Če srečanje traja le delček sekunde, če se obrnete v drugo smer, si lahko predstavljate, da ste se samo nasmehnili človeku. Daljše kot je srečanje, bolj očitna je manekenka manekenke.

Enako je s chatboti. Izmenjava hellosov ne razkrije ničesar - toda ko se boste bolj zapletli, več težav se bo pojavilo. Zdi se mi, da so chatboti brez razloga spremenjeni v temo. Pogosto ne morejo odgovoriti na preprosta vprašanja. V nevarnosti, da se oglasijo nejasno, preprosto ne zvenijo človeško . V enem od mojih pogovorov leta 2012 sem vtipkal preprosto šalo - in subjekt, s katerim sem govoril, je v trenutku spremenil temo v hamburgerje. (Računalničar Scott Aaronson je pred kratkim imel podobno izkušnjo, ko je na spletni strani bota klepetal z Eugeneom. Aaronson je Eugeneja vprašal, koliko nog ima kamela; odgovoril je: "Nekaj ​​med 2 in 4. Mogoče, tri ?:-))" Kasneje, ko je Aaronsona vprašal, koliko nog ima mravlja, je Eugene zakašljal popolnoma enak odgovor, trojni nasmeh in vse.)

Upoštevajte tudi, da Eugene ne posnema odraslega angleško govorečega jezika; pretvarja se, da je mlad in nekoliko navihan ukrajinski najstnik, ki se pogovarja v dokaj dobri (vendar daleč od popolne) angleščine. Kot je za Mashable.com povedal Vladimir Veselov, eden od razvijalcev programa: "Veliko časa smo porabili za razvijanje lika z verodostojno osebnostjo." Čeprav bo Eugene vsakogar vključil v katero koli temo, njegova starost "popolnoma razumno meni, da mu ni vseeno "Ne vem vsega." Eugene ne pride prav in ne naznani svoje starosti in državljanstva; vendar ga bo razkril, če ga bo vprašal - in končni rezultat je morda določena mera prizanesljivosti sodnikov, zlasti glede angleške slovnice in uporabe besed. (Predvidevam, da je bila večina sodnikov v soboto domačih angleško govorečih, čeprav tega zagotovo ne vem.) Mize bi se verjetno obrnile, če bi Eugene kdaj na sodišču naletel na maternega ukrajinskega govorca.

Boj za izgradnjo govornega stroja poudarja, kako zapleten je jezik. To ni samo vprašanje pogovora - o nečem se moraš pogovarjati in to, kar rečeš, mora imeti smisel - in mora imeti smisel v kontekstu tega, kar je povedala druga oseba . Za nas je enostavno; za računalnike pa ne toliko. In zato se chatboti opirajo na vrsto trikov: Spominjanje megabajtov odzivov v pločevinkah ali iskanje po internetu za dialog, ki bi lahko približal pogovoru, ki ga trenutno vodite. Z drugimi besedami, tisto, čemur stroj nima inteligence, lahko nadoknadi s surovo računalniško močjo. Zato se nam Google ali Siri (iPhone osebni asistent) lahko zdijo tako pametni: Siri morda nima "pameti", vendar ima dostop do tako obsežne baze podatkov, saj lahko deluje, kot da je. To je bil enak način grobe sile, ki je omogočil zmago IBM-ovega "Watsona" v Jeopardyju! leta 2011

Vse to postavlja ključno vprašanje: Kaj natančno meri Turingov test? Nekateri kritiki menijo, da gre za bolj zvijačo kot za inteligenco. Psiholog NYU Gary Marcus, ki piše na spletnem mestu NewYorker.com, pravi, da je Eugene uspel "z izvedbo serije" ploys ", namenjenih zakrivanju omejitev programa." Steven Harnad, psiholog in računalničar na univerzi v Quebecu v Montrealu, je bil še več skeptičen, ko je za Guardian povedal, da je "popolna neumnost" trditi, da je Eugene opravil Turingov test. (Po njegovem mnenju je bil Turing tega vprašanja dobro seznanjen; svojo idejo je poimenoval »igra imitacije«, o inteligenci pa je govoril le redko.) Še bolj nerodno je računalnik, za razliko od človeka, prisiljen zavajati. "Turingov test je resnično preizkus uspešnosti lažnivca, " mi je povedala Pat Hayes, informatičarka na Inštitutu za človeško in strojno kognicijo v Pensacoli na Floridi, po Turingovem testnem maratonu leta 2012. "Če bi imeli nekaj, kar bi res lahko prešlo Turingovo imitacijsko igro, bi bila to zelo uspešna 'človeška mimika'."

In "človeška" je druga ključna točka: ali ni mogoče, da na svetu obstajajo druge vrste inteligence, razen tiste, ki jo prikazujejo naše vrste? Resnično inteligenten stroj bi imel nešteto praktičnih aplikacij, ampak zakaj se osredotočiti na ustvarjanje več "ljudi"? Konec koncev imamo že veliko ljudi. Kot je poudaril jezikoslovec Noam Chomsky, ko si prizadevamo sestaviti stroj, ki se premika pod vodo, od njega ne potrebujemo, da bi "plaval" - in podmornica ni nič manjši dosežek zaradi svoje nezmožnosti, da izvede hrbet.

Da, Eugene je impresiven, vsaj v majhnih rafalih. Pa vendar se tudi najboljši klepetalci spotikajo ob vprašanjih, s katerimi bi se lahko otrok, ki se je polno rodil v Eugeniji, prelepo spoprijel. Mogoče ni presenetljivo, da večina raziskovalcev AI porabi malo časa, da bi obsedla Turingov test. Strojna inteligenca se pravzaprav premika naprej in precej hitro. Programska oprema za prevajanje besedila v besedilo, ki je bila pred nekaj leti precej patetična, se hitro izboljšuje, prav tako tudi jezikovni prevajalski programi. Amazon ima pogosto precej dobro predstavo o tem, kaj želite kupiti, še preden to storite. In Googlov samovozeči avtomobil bi bil pred desetletjem zgolj fantazija. Toda pogovor, ko se vedno znova odkrivamo, je res težaven in verjetno ne bo meja, v kateri AI najbolj sije. Za zdaj, če iščete nekoga, s katerim bi klepetali, priporočam pravega človeka.

Dan Falk je znanstveni novinar s sedežem v Torontu.

Turingov test nekaj meri, vendar to ni "inteligenca"