"Ne moramo strahovati da će roboti zavladati svijetom"
24. studenoga 2018Svima su poznati osobni asistenti poput Siri ili Alexe koji sve češće pomažu u obavljanju stvari u svakodnevici. No kako su ovi uređaji naučili naš, ljudski jezik? Za to se brinu znanstvenici poput Beograđanke Milice Gašić. Oni strojeve uče govoru i razumijevaju – a prije svega komunikaciji.
Milica Gašić doktorirala je na Cambridgeu gdje je do sada i radila kao docent, a od prosinca će raditi na Sveučilištu Saarbrücken gdje će se i dalje baviti tehnologijama jezika.
Milica Gašić je jučer (22.11.) u Berlinu primila prestižnu znanstvenu nagradu Sofje Kovalevskaje koju dodjeljuje Humboltova zaklada. DW je prije dodjele nagrade imao priliku razgovarati s mladom znanstvenicom.
DW: Koje je vaše polje istraživanja?
Milica Gašić: Moje polje istraživanja je dijalog između računara i čovjeka. Dijalog je najjednostavniji način prenošenja informacija među ljudima. Mi možemo pročitati recimo knjigu i istog trenutka govoriti o tome što smo pročitali. Strojevi i računari su s druge strani dobri za čuvanje ogromne količine podataka. Ali nisu toliko dobri kada treba te podatke podijeliti s nama u nekoj humanoj formi.
Virtualni osobni asistenti kao Siri ili Alexa daju dnevno milijarde informacija. Ali ako duže s njima pričate, vidite da su oni vrlo ograničeni u smislu što mogu reći, postanu frustrirajući za korisnika i jednostavno nemaju tu mogućnost podjele informacija kao što to mogu ljudi. Dakle, istraživačko pitanje kojim se ja bavim jest kako napraviti model za dijalog koji može evaluirati na razinu ljudske razmjene informacija.
Je li to isključivo tehničko pitanje?
Pa to je pitanje koje se može gledati i s tehničke strane, dakle kako napraviti taj sustav. Ali naravno i s teoretske strane, dakle koji su teoretski limitirajući faktori danas koji nas sprječavaju da dođemo do tog sustava.
I koji su to faktori?
Jedan od najperspektivnijih načina da se riješi taj problem je kroz strojno učenje. U strojnom učenju mi polazimo od podataka koji imaju određene koncepte i onda mi pokušavamo stvoriti statistički model koji objašnjava te koncepte pomoću podataka. I onda možemo pomoću modela praviti pretpostavke o tome što je korisnik htio reći, što da sustav kaže korisniku, kako da se razvija dijalog. Ali teško je napraviti takve podatke gdje imate koncepte asocirane na svakoj razini. Drugi ograničavajući faktor je taj da je teško natjerati jedan sustav koji je recimo u stanju pričati o restoranima da sada počne pričati recimo o letovima i bukiranju hotela. Znači ne postoji način prilagođavanja.
S druge strane, ljudi su jako dobri u prilagođavanju i malo im je potrebno da se prilagode novoj sredini. Dalje, računari nisu u stanju prepoznati višu razinu komunikacije, kao na primjer neverbalnu komunikaciju ili sarkazam u glasu. I na kraju, strojevi su u stanju učiti između malog broja opcija a ljudski dijalog ima nebrojenu mogućnost različitih odgovora i različitih konverzacija. I to je veliki teoretski limit ovoj tehnologiji.
Limit je taj da sustavu treba veliki broj interakcija da bi naučio različite modele komunikacije. Jer očigledno je moguće da se uči iz malog broja podataka i malog broja interakcija kao što to čini ljudski mozak, ali mi još ne znamo kako to funkcionira. Strojno učenje je potpuno drugačije od načina kako uče ljudi. To se može usporediti s letenjem: i avion i ptica lete, ali drugačije koriste krila.
Spomenuli ste maloprije kako je ljudska odlika, i to je odlika evolucije, sposobnost prilagođavanja. Je li moguće stroj naučiti prilagođavanju i jesmo li tu onda u onoj priči o stroju koji će zavladati svijetom?
Mislim da je važno pronaći modele koji će se moći prilagoditi i to je vrlo važno za razvoj istraživanja. Ali mislim da smo vrlo daleko od singularnosti, tj. od ideje da će umjetna inteligencija zavladati svijetom, tj. da će početi raditi u svoju, a ne u našu korist. Mislim da smo jako, jako daleko od toga. A osobno ne vjerujem da će se to ikada dogoditi.
Zašto ste tako sigurni? Još donedavno ljudi ne bi vjerovali da će uskoro svako imati takav uređaj kao što je pametni telefon. Tehnika se razvija.
Ovdje se radi o kvantitativnom napretku, o bržim procesorima o više memorije itd. Kod umjetne inteligencije je problem u kvalitativnom napretku. Ali trenutno ionako mislim da je veći problem od kvalitativnog napretka pitanje privatnosti. Jer se ta metodologija zasniva se na podacima. Algoritam mora imati uvid u vaše podatke ako nešto želi naučiti. Znači pitanje je kako osigurati poštivanje privatnosti i da se podaci ne zloupotrijebe. To je veliki problem.
Gdje u najbližoj budućnosti vidite mogućnost primjene strojnog učenja?
Prije svega u zdravstvu, jer u zdravstvu u međuvremenu imamo toliko podataka da to bolje mogu procesuirati strojevi. Ali oni će na kraju rezultat ipak predočiti liječniku koji će donijeti konačnu odluku.
Vi se bavite zapravo jezikom, ali niste lingvist?
Ja sam u Beogradu na matematičkom fakultetu studirala računarstvo i informatiku. Onda sam na Cambridgeu završila master iz obrade govora jezika na odjelu za računarstvo. Doktorirala sam na statističkom modeliranju dijaloga na odjelu za inženjerstvo. Ja sam dakle prirodnjak i malo znam o jeziku. Ja jeziku pristupam sa statističke točke gledišta.
Kad govorimo o komunikaciji sa strojevima neminovno dolazimo do jezika u lingvističkom smislu. Kakva je mogućnost da se u budućnosti komunicira sa strojevima na nekom od malih jezika kao što je to srpski ili hrvatski?
Problem je u tome što se strojno učenje zasniva na podacima. Znači mi moramo imati te podatke kako bi mogli napraviti sustav. Danas su ti podaci pristupačni samo za velike jezike. Drugi problem je i morfologija. Engleski je jedan od najlakših jezika za procesuiranje. Slovenski jezici su zbog morfologije mnogo složeniji, morfološki su bogati. Zato ih lingvisti vole, ali su oni teški za procesuiranje.