Žiūrėti vaizdo įrašus be garso dažnai tenka iš būtinybės. Kartais reikia tylos, kartais garso tiesiog negirdime dėl klausos sunkumų. Tokiose situacijose subtitrai tampa svarbiausiu tiltu į turinį.
Vis dėlto ilgą laiką subtitrai turėjo aiškų trūkumą. Jie perteikdavo žodžius, bet prarasdavo emociją, balso toną ir nuotaiką. Sarkazmas, susižavėjimas ar nusivylimo atodūsis likdavo už kadro, todėl dalis prasmės išgaruodavo.

Dabar tai keičiasi, nes „YouTube“ pristato naują funkciją „Expressive Captions“, lietuviškai vadinamą „Ekspresyviais subtitrais“. Ji pasitelkia dirbtinį intelektą, kad ekrane atsirastų ne tik tekstas, bet ir emocinis kontekstas. Tokiu būdu žiūrėjimas be garso tampa artimesnis pilnai patirčiai.
Kaip dirbtinis intelektas perkelia emocijas į subtitrus?
Naujoji sistema sujungia įprastą kalbos transkripciją su algoritmais, galinčiais atpažinti daugiau nei žodžius. Ji vertina kalbėjimo toną, akcentus, nuotaiką ir net foninius garsus, pavyzdžiui plojimus ar nustebimo šūksnius. Dėl to subtitrai tampa gyvesni ir labiau atspindi situaciją.
Ankstesni bandymai „Android“ įrenginiuose jau parodė tokio sprendimo vertę. Subtitrai galėjo atskirti šnabždesį nuo šauksmo ir tai pažymėti, kad žiūrovas iš karto suprastų kalbos intensyvumą. Dabar funkcija pakelta dar aukščiau, nes prie žodžių pridedamas emocinis sluoksnis.
Ypač įdomūs emocijų žymekliai, rodomi prieš tekstą. Žiūrovas matys trumpas nuorodas, tokias kaip džiaugsmas ar liūdesys, kurios padės greičiau suvokti kalbėtojo intenciją. Tai labai svarbu sarkazmui, nes be tono jis dažnai lieka nepastebėtas.
Ką tai duoda žiūrovams ir kodėl tai svarbu?
Sistema taip pat parodo emocijų stiprumą, todėl pyktis, susijaudinimas ar pašaipus tonas tampa matomi net be garso. Subtitrai gali pažymėti, kad žmogus kalba pakeltu balsu arba atvirkščiai tyliu, jautriu tonu. Net foniniai signalai, tokie kaip nusivylimo atodūsis, tampa informacijos dalimi.
Žmonėms su klausos sutrikimais tai yra didelis žingsnis į priekį. Iki šiol jie turėjo remtis vien tik žodžiais ir dažnai prarasdavo emocinę bendravimo dalį. Dabar kontekstas bus aiškesnis, o turinio suvokimas artimesnis tam, ką girdi kiti.
Ribotas paleidimas ir platesnės ambicijos
Kol kas „Ekspresyvūs subtitrai“ veikia tik angliškai ir tik tiems vaizdo įrašams, kurie įkelti po 2025 metų spalio. Tai natūralu, nes dirbtinis intelektas turi išmokti atpažinti emocijas skirtingose kalbose. Tikėtina, kad vėliau funkcija bus plečiama į daugiau regionų ir senesnį turinį.
Šis žingsnis dera su platesne „Google“ prieinamumo strategija. Įmonė pamažu diegia sprendimus, kurie padeda žmonėms patogiau naudotis technologijomis, nepriklausomai nuo jų poreikių. Jei „YouTube“ parodys, kad emociniai subtitrai veikia patikimai, kitos platformos greičiausiai paseks tuo pačiu keliu.
