https://frosthead.com

Programska oprema ustvari eno sliko, ki pravi vse

Uporabniki vsak dan na Facebook naložijo več kot 350 milijonov fotografij. Zaradi toka slik je analitik ocenil, da je bilo v zadnjem letu 10 milijonov fotografij na svetu posnetih 10 odstotkov. Vsi ti podatki, ki preplavijo splet, pomenijo, da če iščete določeno sliko ali predmet, kako izgleda na primer oranžna mačka tabure, ste pozitivno preplavljeni z rezultati iskanja.

Prejšnji mesec so raziskovalci na kalifornijski univerzi Berkeley razkrili novo programsko opremo AverageExplorer, ki bo uporabnikom omogočila, da bodo videli "povprečno" sliko, ki predstavlja tisto, kar iščejo. Namesto da je slika vredna tisoč besed, je slika vredna tisoč ali več slik.

"Ko začnete iskanje po Googlovi sliki, boste presejali strani in strani slik, " razlaga Jun-Yan Zhu, podiplomski študent UC Berkeley in glavni avtor prispevka, predstavljenega na letošnji mednarodni konferenci in razstavi o računalniški grafiki in Interaktivne tehnike v Vancouvru. „Ogromno in težko je povzeti; ne morete dojeti, kaj se dogaja. "

Zhu in njegova ekipa so za prvotno ponudbo zbirali fotografije s pomočjo slik Flickr, Google in Bing. Programska oprema je dovolj majhna, da deluje na povprečnem namizju in lahko hkrati zdrobi približno 10.000 slik.

Uporabniki iskanje izboljšajo na nekaj različnih načinov. Lahko si skicirajo in obarvajo obliko, podobno kot pri risanju v Adobe Photoshopu ali Illustratorju, da izostrijo rezultat povprečne slike. Na primer, barvanje ozadja povprečne slike Eifflovega stolpa bo samo izbralo povprečno sliko, da potegnete samo posnetke, posnete ponoči. Lahko pa narišete kotne črte, da nadzorujete usmeritev metulja v kompozitu.

Most vzdihov, od dneva do noči S čiščenjem barv na sliki Most vzdihljav povprečnega raziskovanja lahko prizor spremenite iz dneva v mrak v noč. (Courtesy UC Berkeley)

Ko je ustvarjena povprečna slika, postopek, ki lahko traja tudi minuto, lahko uporabniki dodatno izboljšajo rezultat z uporabo tega, kar ekipa imenuje Explorer Mode. V tem načinu s klikom na določen del slike - recimo mačji nos - razkrijejo druge običajne možnosti ali podrobnosti za to mesto - morda modre ali črne nosove ali tiste, ki so zaokroženi namesto kotnih. V demonstracijskem videoposnetku je na primer ekipa izpopolnila podobo otrok v Božičkovem naročju, tako da je izbrala samo slike, na katerih ima Božiček na vsaki roki enega otroka.

Zhu bo sistem postal še posebej zmogljiv, pravi Zhu, kot orodje za treniranje algoritmov računalniškega vida, kot so tisti, ki jih uporabljajo Google Goggles ali Amazon Firefly, ki lahko prepoznajo, na kaj kaže kamera. "Ljudje na področju računalniškega vida porabijo veliko denarja za komentar, " pojasnjuje. "Opombo lahko zdaj dodate na povprečno sliko. Ideja je ta, da morate za širjenje vseh slik v podatkovnem nizu delati samo na eni sliki. "

Iskanje pasem mačk Z izpopolnjevanjem načinov iskanja rezultatov lahko raziskovalci najdejo posebne pasme mačk, vključno z (od leve proti desni) Ragdoll, siamski, Maine Coon in sfingo. (Courtesy UC Berkeley)

Ustvarjanje umetniških del je nizko viseče sadje za AverageExplorer. Ekipa je črpala navdih pri umetnikih iz novih medijev, kot je Jason Salavon, ki je pridno ustvaril povprečne fotografije z roko. Lahko bi ga uporabili tudi za ustvarjanje Facebookovega vtičnika, ki uporabnikom omogoča, da se pokažejo s povprečno podobo o sebi.

Prizadevanja raziskovalcev so še bolj široka in vplivna. Sociologi bi lahko sistem uporabili za opazovanje in raziskovanje družbenih trendov; na primer, povprečna slika bi lahko dokazala, da neveste najpogosteje stojijo desno od ženina v poročnih portretih. AverageExplorer je lahko tudi koristno orodje za medijske analitike, ki poskušajo razrezati televizijsko poročanje - ali se spreminja drža Stephena Colberta, ko govori o Georgeu W. Bushu v primerjavi z Barackom Obamo?

Z omogočanjem uporabnikom intuitivno interakcijo z vizualnimi podatki, namesto da bi si prizadevali za vnos pravilnega niza ključnih besed, bodo uporabniki lahko prenesli tisto, kar Žuhov svetovalec in soustvarjalec ProseExplorer, Aleksej Efros, imenuje "jezikovno ozko grlo."

Ekipa si predstavlja skupek orodij po meri, zasnovanih za posebne, težko določljive naloge. Nakupovalna aplikacija bi na primer omogočila uporabnikom, da si spletajo pare za pete z natančno barvo, obliko pete in višino, ki jo želi. Zhu predvideva orodje, ki se integrira z delovnim tokom policijskih skicistov, kar omogoča pričetu, da v obraznih bazah podatkov poišče funkcije, ki ustrezajo storilcu, in oblikuje sestavljen portret.

Osnovna različica AverageExplorer bo izšla to jesen.

Programska oprema ustvari eno sliko, ki pravi vse