https://frosthead.com

Pogovor s stroji

Programska oprema za prepoznavanje glasu, ki bi se večina od nas verjetno strinjala, je precej kul stvar. Toda pogovor s stroji je del - naj bo to pametni telefon, TV zaslon ali nadzorna plošča - no, ne toliko. Prosite za nasvet naprave? Reek geek. Navedite vsako besedo, da vas lahko razumete? Kako kul si lahko v resnici?

Toda Apple, ki je resničen, se je tega lotil tako, da je v svoji zadnji oglaševalski kampanji za Siri, glas iPhone 4S, najel tri ikone super. Zooey Deschanel (Adorable Cool) in John Malkovich (Cerebral Cool) ter Samuel L. Jackson (Ultimate Cool) se vsi, ki se ukvarjajo z igranjem besedil a s telefonom, zdijo šport bogov.

Kljub temu kritiki poudarjajo, da Siri v resničnem življenju ni tako odzivna niti vsevedna, kot je prikazana v reklamah. Tudi vi ste prepričani, da ste to presenečeni. Drugi vidijo, da je vse skupaj zrelo za parodijo - glej, da je Zooeyev brat Jooey naredil smešno ali Die različico Zooeyevega in Sirijevega deževnega dne skupaj.

Ni pomembno. Siri je postala vodilna pevka v zborovih robotih, glasu nove generacije "You Got Mail".

V nekaterih krogih je modno namigovati, da Siri ni Steve Jobs vreden, če bi bil še živ, bi ga Jobs potegnil s trga ali vsaj nikoli ne bi odobril tako odmevnega oglasa kampanjo za tako pomanjkljiv izdelek.

Toda kot je dejal naslednik Jobsa Tim Cook v začetku tega tedna, imajo lastniki iPhone 4S radi Siri. Glede na raziskavo, ki je bila objavljena marca, jih skoraj 90 odstotkov pravi, da jih uporabljajo vsaj enkrat na mesec. In ne pozabite, da bo Siri, eden redkih Apple-ovih izdelkov, ki je ob izidu rekel, da je v beta različici, svoj prvi rojstni dan praznoval šele oktobra. Še vedno se uči jezika in, kar je še pomembneje, šele začne izkoriščati potencial umetne inteligence.

Siri bo verjetno središče Apple TV-ja, ki naj bi debitiral decembra. Verjetno pa je, da se bo v naših avtomobilih kraj pogovora s stroji preusmeril v glavni tok.

Vozite, je rekla

Seveda, to se že dogaja, vendar morate vseeno preiti na govorico robotov, če želite, da vas razumejo. Pa tudi potem ni nobenega jamstva. To se bo začelo spreminjati to poletje, ko bodo nekateri novi modeli opremljeni z nečim, imenovanim Dragon Drive!

To je izum Nuance Communications, podjetja s sedežem v Massachusettsu, ki je postalo močna v poslu za prepoznavanje glasu. (Za splošno velja, da so možgani za Siri.) Odtenek in prepoznavanje glasu v avtomobilih sta prejšnji teden močno poskočila, ko je podjetje objavilo, da je Dragon Drive! se bo lahko dotaknil v oblaku.

To pomeni, da bo sistem močno povečal svojo računalniško moč in pomnilniško sposobnost. In to pomeni, da bo glas na vaši nadzorni plošči postal bolj sirijski in vam bo omogočil, da se dejansko pogovarjate z njim. Nič več monosilnega kričanja. Prihaja dan, ko boste lahko po naključju omenili, da se počutite kot nekateri Allman Brothers in nekaj sekund kasneje bo "Whipping Post" prihajal skozi zvočnike.

Ključno je, kako smo sposobni učiti strojni kontekst in pragmatiko - kako se jezik uporablja v družbenih situacijah. In to je težaven posel. Za začetek mora celo najbolj izpopolnjena naprava za prepoznavanje glasu počakati, da človek konča govoriti, da bo lahko razbral in razlagal celoten stavek. Potem je tu še "teorija uma", sposobnost razumevanja, da imajo lahko drugi ljudje drugačna prepričanja in namere kot naša. Kolikor vemo, to lahko storijo le ljudje.

Nedavna študija dveh Stanfordovih psihologov vam lahko da občutek, kaj je povezano z intuitivno pomočjo strojev. Raziskovalca Michael Frank in Noah Goodman sta vzpostavila spletni eksperiment, v katerem so udeležence prosili, da si ogledajo niz predmetov in nato izberejo, kateri naj bi bil določena beseda. Na primer, ena skupina udeležencev je videla modri kvadrat, modri krog in rdeč kvadrat. Vprašanje za to skupino je bilo: Zamislite si, da se pogovarjate z nekom in se želite sklicevati na srednji predmet. Katero besedo bi uporabili "modri" ali "krog"?

Druga skupina je bila vprašana: Predstavljajte si, da se nekdo pogovarja z vami in uporablja besedo "modra" za sklicevanje na enega od teh predmetov. O katerem predmetu govorijo?

Odzivi so raziskovalcem pomagali do jasnejše slike o tem, kako poslušalec razume govorca in kako se govorec odloči, kaj bo povedal. Iz tega so razvili takšen matematični model, ki lahko razširi in izpopolni računalniški miselni proces.

Rekel je Frank: "Potrebna bodo leta dela, toda sanje so o računalniku, ki resnično razmišlja o tem, kaj želite in kaj mislite, ne le o tem, kar ste rekli."

Način govora

Tu je nekaj zadnjih dogodkov v prepoznavanju glasu:

  • Siri molči: IBM se ponavadi zelo nervira zaradi poslovnih skrivnosti zaradi izstopa, zato svojim zaposlenim zdaj prepoveduje uporabo javnih mest za prenos datotek, kot je Dropbox. Ima pa tudi prepoved uporabe Siri v pisarni, ker varnostni delavci skrbijo, da bi nekdo med pogovorom s svojim telefonom lahko razkril občutljive informacije, ki se končajo na Applovih strežnikih.
  • Vzemite to, Apple !: Samsung je ta teden v Londonu predstavil svoj novi pametni telefon Galaxy X III, čeprav je njegov velik zaslon na dotik deležen veliko pozornosti, vsebuje tudi novo programsko opremo za prepoznavanje glasu in obrazov.
  • Naredi, kar rečem, ne pa tega, kar počnem: In Samsung se tam ne ustavi. Pred kratkim je vložila patentno prijavo za robota, ki razume človeški govor. Robot bi lahko prilagodil svoje sposobnosti poslušanja tako, da bi upošteval zunanji hrup, ki bi lahko prekinil ali motil ukaze, ki so mu bili dani. Prav tako bi lahko prepoznali, kdo je govoril, čeprav je hrup v ozadju zelo glasen.

Infografski bonus: Mislite, da je vaš avto zdaj računalniško podprt. Počakajte, da se popolnoma priklopi na internet. Spoznajte, kaj lahko počne povezan avtomobil.

Pogovor s stroji