https://frosthead.com

'Mona Lisa' zaživi v računalniško ustvarjenem 'Živem portretu'

Serija o Harryju Potterju je svet navadila na idejo o živih portretih s svojimi govornimi slikami in premikajočimi se fotografijami. Toda prejšnji teden, ko je Mona Lisa, ustvarjena z AI, ustvarila "živi portret" Leonarda da Vincija, je po spletu začela delati kroge, se je marsikdo navdušil, ko je slavni portret premaknil ustnice in se ozrl naokoli.

Animirani portret Lise Gherardini je bil eden od številnih novih modelov "govoreče glave" - ​​bolj znanih kot "deepfakes" - ki so jih ustvarili raziskovalci iz Samsungovega AI centra v Moskvi in ​​skoladoškega inštituta za znanost in tehnologijo. Z le nekaj referenčnimi okviri ali celo eno sliko so raziskovalci naredili tudi globoke slike slavnih osebnosti, kot je Oprah, oživili posamične posnetke Marilyn Monroe in Alberta Einsteina ter ustvarili nove izraze za znane podobe, kot je Vermeerjevo dekle z bisernim uhanom .

Raziskovalci so svojo metodo, ki ji pravijo "malo strelskega učenja", objavili na YouTubu in v prispevku, ki ga je treba še pregledati v repozitoriju arhiv za tisk arXiv.org. Medtem ko so podrobnosti precej tehnične, Mindy Weisberger iz LiveScience poroča, da se za izdelavo živih portretov vrsta umetne inteligence, imenovane konvolucijsko nevronsko omrežje, trenira z analizo referenčnih slik. Nato uporabi obrazne gibe iz serije okvirjev za statično sliko, kot je Mona Lisa . Več kotov in referenčnih slik ima boljši živ portret. Po navedbah prispevka bi lahko AI ustvaril "popoln realizem" (merjen s človekovo zmožnostjo zaznavanja, kateri od treh nizov slik je bil globok zvok) z uporabo samo 32 referenčnih slik.

Mona Lisa je seveda samo ena slika, zato so trije "živi portreti" Leonardove mojstrovine nekoliko neresni. Za kratke animacije je nevronska mreža opazovala tri različne video posnetke in tri različice Mona Lise, ki temeljijo na teh kadrih, imajo različne osebnosti. Če bi Leonardo svoj znani model naslikal iz različnih zornih kotov, bi sistem lahko ustvaril še bolj realističen živi portret.

Medtem ko animirana Mona Lisa zabava, porast globokih filmov povzroča zaskrbljenost, da bi računalniško ustvarjene podobnosti lahko uporabili za obrekovanje ljudi, zatiranje rasne ali politične napetosti in nadaljnje izkoreninjenje zaupanja v spletne medije. "[T] hej spodkopava naše zaupanje v vse videoposnetke, tudi v tiste, ki so pristni, " piše John Villasenor iz The Brookings Institution. "Resnica sama po sebi postaja izmuzljiva, saj ne moremo več biti prepričani, kaj je resnično in kaj ne."

Medtem ko se AI uporablja za ustvarjanje deepfaksov, Villasenor pravi, da ga je mogoče vsaj zaenkrat uporabiti tudi za prepoznavanje deepfaksov z iskanjem neskladnosti, ki človeškemu očesu niso očitne.

Tim Hwang, direktor Harvard-MIT Ethics and Governance of AI Initiative, pravi Gregoryju Barberju pri Wiredu, da še nismo na mestu, ko slabi igralci še lahko ustvarijo prefinjene globusove na svojih osebnih prenosnikih. "Nič mi ne kaže, da boste to na ključ uporabili samo za ustvarjanje globusov, " pravi. "Ne kratkoročno, srednjeročno ali celo dolgoročno."

Zato je uporaba Samsungovega novega sistema draga in zahteva strokovno znanje. Toda Barberjev članek poudarja, da za prevaro ljudi ne potrebuje prefinjenega fotorealističnega videoposnetka, ki ga je ustvarila nevronska mreža. Samo prejšnji teden je po družbenih omrežjih krožil manipulirani video, ki je bil upočasnjen, da je predsednica ameriškega doma Nancy Pelosi zvenela pijan.

Sčasoma pa bo tehnologija dovolj dobra, da bodo slabi igralci lahko ustvarili globoke posnetke, tako prepričljive, da jih ni mogoče zaznati. Ko pride ta dan, Hwang pove Wiredu, se bodo ljudje morali zanašati na preverjanje dejstev in kontekstualne namige, da bi ugotovili, kaj je resnično in kaj ponarejeno. Če na primer nasmeh Mone Lise s polnim nasmehom postane zmešan nasmeh in vam poskuša prodati belilno zobno pasto, je to zagotovo globoka napaka.

'Mona Lisa' zaživi v računalniško ustvarjenem 'Živem portretu'