Elektronika.lt
 2024 m. balandžio 25 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 StraipsniaiSąrašas
 - Elektronika, technika
 - Kompiuterija
 - Telekomunikacijos
 - Įvykiai, visuomenė
 - Pažintiniai, įdomybės
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Balandžio 24 d. 20:16
Kaip išjungti ar perkrauti visų modelių „iPhone“
Balandžio 24 d. 17:16
Nuo blynus kepančių robotų iki miesto priežiūros technologijų – „Tech_Champ 2024“ hakatone komandos kūrė naujoves
Balandžio 24 d. 14:32
Pristatytas 816 AG „Mercedes-AMG GT 63 S E PERFORMANCE“ kupė
Balandžio 24 d. 11:26
Švietimo ekspertai sutaria: universitetų aljansai – galimybė turėti geresnę švietimo sistemą
Balandžio 24 d. 08:18
„Nothing“ pristatė „Ear“ ir „Ear (a)“ belaidžius ausinukus
Balandžio 23 d. 20:24
Dauguma Lietuvos tėvų riboja vaikų laiką internete: psichologas patarė, kaip nepažeisti vaiko privatumo
Balandžio 23 d. 17:16
Peteris Higgsas: kaip itin kuklus fizikas sugalvojo dieviškosios dalelės idėją
Balandžio 23 d. 14:42
Huawei“ pristatė naujuosius „Pura 70“, „Pura 70 Pro“ ir „Pura 70 Pro+“ išmaniuosius telefonus
Balandžio 23 d. 11:27
Sukčiai iš lietuvių pernai vidutiniškai išviliojo po 74 eurus: atskleidė, kur ir kaip jie veikia
Balandžio 23 d. 08:41
Europos Komisija: KTU – pirmasis universitetas Lietuvoje pagal pritrauktas lėšas
FS 22 Tractors
Farming Simulator 19 Mods, FS 22 Maps, FS22 Mods
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS22 Trucks
VAT calculator
VAT number check, What is VAT, How much is VAT
Paskola internetu
Vartojimo paskola, paskola automobiliui, paskola būsto remontui
Thermal monocular
Thermal vision camera,
Night vision ar scope,
Night vision spotting scope
FS22 Mods
FS22 Harvesters, FS22 Tractors Mods, FS22 Maps Mods
FS22 Mods
FS22 Maps,
FS22 Harvesters,
FS22 Tractors
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
Sims 4 Mods
Sims 4 CC Clothes,
Sims 4 Hair CC,
Sims 4 Skill Cheat
Optic sight
Binoculars for hunting elk,
Best compact binoculars,
Riflescope hunting
Reklama
 Straipsniai » Kompiuteriai, IT Dalintis | Spausdinti

Kalbos technologijos – būtina sąlyga kalbai egzistuoti

Publikuota: 2017-10-06 17:22
Tematika: Kompiuteriai, IT
Skirta: Pradedantiems
Inf. šaltinis: Pranešimas spaudai

Šiandien vis labiau populiarėjančios kalbinės technologijos, naudojamos vertimuose, išmaniuosiuose automobiliuose, virtualiuose asistentuose ir kitur – tai būdas užtikrinti, kad kalba išvengs išnykimo grėsmės ir nepatirs skaitmeninės atskirties. Lietuvoje šioje srityje jau 25 metus dirba Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centras.

 Rodyti komentarus (0)
Įvertinimas:  1 2 3 4 5 

Šiandien vis labiau populiarėjančios kalbinės technologijos, naudojamos vertimuose, išmaniuosiuose automobiliuose, virtualiuose asistentuose ir kitur – tai būdas užtikrinti, kad kalba išvengs išnykimo grėsmės ir nepatirs skaitmeninės atskirties. Lietuvoje šioje srityje jau 25 metus dirba Vytauto Didžiojo universiteto (VDU) Kompiuterinės lingvistikos centras, tarp kurio pasiekimų – Dabartinės lietuvių kalbos tekstynas ir pirmoji lietuviška automatinio anglų–lietuvių kalbų vertimo sistema, pasirodžiusi anksčiau už populiarųjį Google Translate.

Dabartinės lietuvių kalbos tekstynas jau tapo puikiai žinoma lietuviškojo interneto dalimi. Centre pirmiausia ėmėmės rengti būtent šį kiekvienos kalbos kompiuterizavimui svarbų išteklių, nes tik sukaupus tekstyną buvo galima siekti pagrindinio centro tikslo – parengtų išteklių (tekstynų, duomenynų) pagrindu kurti lietuvių kalbai reikalingas kalbos technologijas“, – paaiškino Kompiuterinės lingvistikos centro (KLC) įkūrėja, VDU profesorė Rūta Petrauskaitė.

Pasak centro mokslininkų, plačiajai visuomenei kartais trūksta suvokimo, kuo svarbūs kalbiniai ištekliai ir kalbos technologijos – kodėl į tai verta investuoti lėšas ir laiką. Išaugus kompiuterių galimybėms, šiandieniniame pasaulyje jau galima pamatyti nemažai kalbos technologijų pasiekimų: be visiems žinomo automatinio vertimo, tai ir „kalbantys“ išmanieji automobiliai, automatiškai aplinką stebinčios ir automobilių numerius fksuojančios stebėjimo kameros, į klausimus atsakantys virtualūs asistentai, diktavimo sistemos ir kt.

Kalbos technologijos – būtina sąlyga kalbai egzistuoti

„Jau greitai nieko nestebins žmonės, smagiai besišnekučiuojantys su savo automobiliais, šaldytuvais ar kitais prietaisais. Vis dėlto neužmirškime, kad nors šiandieniniai vis tobulėjantys mokymosi algoritmai jau sukurti ir prieinami, tačiau, norint juos toliau tobulinti, t. y. išmokyti kalbėti, rašyti ar skaityti tiksliau, reikalingi kalbiniai ištekliai“, – pasakoja dabartinis KLC vadovas docentas dr. Andrius Utka.

Šie ištekliai – tai įvairios duomenų bazės, kuriose kaupiami tekstai, garsai, kiti kalbos elementai, taip pat programinė įranga. Mokslininkai pabrėžia, kad aukštas tam tikros kalbos kompiuterizavimo lygis taip pat yra ir tos kalbos išlikimo sąlyga – vartojant ją mažiau, ne visomis funkcijomis arba jos nevartojant, kyla grėsmė kalbai išnykti. Lietuvos vartotojai turi teisę naudotis šiuolaikinėmis technologijomis, kurios „kalba“ lietuviškai, todėl itin svarbu ginti ir užtikrinti lietuvių kalbos statusą technologinėje terpėje, kad ji netaptų trečios lygos kalba arba, kitaip sakant, nepatirtų skaitmeninės atskirties.

Aplenkė Google Translate

Visuomenei gerai žinomas kalbos technologijų pavyzdys yra automatinis vertimas. Mažai kas nebandė Google Translate, bet už ją anksčiau pasirodė anglų–lietuvių kalbų automatinio vertimo sistema. Ši sistema, bendradarbiaujant KLC ir partneriams, buvo sukurta naudojant taisyklėmis pagrįstus automatinio vertimo metodus, kai originalo kalbos tekstas „išnarstomas“ žodžio ir sakinio dalimis ir vėl „sudedamas“ kitoje kalboje. Ilgą laiką, o kartais net ir dabar, šis vertimo metodas fleksinėms kalboms (tokia yra lietuvių kalba) laikomas geriausiu, nes mažiausiai iškraipo sakinio struktūrą.

2007 m. pabaigoje pasirodžiusi anglų–lietuvių kalbų automatinio vertimo sistema sulaukė didžiulio ažiotažo, nes užtikrino palyginti kokybiškus rezultatus ir padėjo vartotojams suprasti teksto turinį. Po pusmečio pasirodžius Google Translate, vartotojų srautas nuslūgo, tačiau VDU vertimo sistema ir toliau naudojamasi – net ir šiandien, nors ji jau nėra aktyviai palaikoma. „Kiek iš jūsų dar naudoja savo 10 metų senumo kompiuterius?..“ – retoriškai klausia buvęs automatinio vertimo projekto vadovas Vaidas Repečka.

Pasak jo, šiandien geriausią vertimo kokybę užtikrina neuroniniais tinklais ir mašininiu mokymusi pagrįstos vertimo sistemos. Tačiau jų naudojimas problemiškas, nes taip iškraipoma fleksinių kalbų struktūra, klaidingai išverstos teksto dalys perkeliamos į kitus tekstus ir t. t.

„Būtina įpareigoti didžiąsias įmones spręsti šias problemas, nes pokyčiai gali tapti negrįžtami. Tai būtina spręsti visos ES mastu, nes ir didžiosios Europos kalbos internete yra „mažosios“ lyginant su anglų kalba. Kol kas labai sunku sukurti gerą vertimą, nes žmogus vertėjas turi daug kontekstinės informacijos ir gali ją panaudoti versdamas, o kompiuteriams reikia tai sukaupti. Bet paieškos sistemose vartotojo asmeninių duomenų kontekstas jau naudojamas, taigi automatinis vertimas toliau tobulės“, – reziumuoja V. Repečka.

Tekstynuose – milijardai autentiškų tekstų

Kalbos technologijos dažnai integruoja bendresnius išteklius, kurie suteikia kuriamiems įrankiams kalbos žinių apie žodyną, gramatiką, fonetiką. Labai dažnai šias žinias galima įvairiais būdais surinkti iš tekstynų – didžiulių elektroninių tekstų sankaupų, kuriose sukaupiami milijonai ar net milijardai įvairių autentiškų tekstų. Tekstynuose sukauptus duomenis naudoja ne tik įrankiai, bet ir žmonės.

Pavyzdžiui, Dabartinės lietuvių kalbos tekstynas – patikimas šaltinis dabartinės kalbos žodžių reikšmėms ir vartosenai suprasti. Dvikalbiai lygiagretieji tekstynai (anglų–lietuvių, lietuvių–anglų, latvių–lietuvių, lietuvių–latvių ir kt.) yra ypač naudingi studijuojantiems užsienio kalbas, vertėjams (teoretikams, praktikams), taip pat redaktoriams.

KLC vykdyto projekto Semantika.lt metu buvo pradėtas kaupti ir milžiniškas, daugiau nei 1 milijardą žodžių turintis bendrasis lietuvių žiniasklaidos tekstynas; jame kaupiama visa informacija iš 40 lietuviškų naujienų portalų. Tiesa, mokslininkai pabrėžia, kad tokios didžiulės apimties tekstinei medžiagai, kurią jau galima vadinti didžiaisiais duomenimis (angl. Big Data), dar sunku suteikti kokybišką, sklandžią internetinę prieigą, nes tai reikalauja didžiulių techninių išteklių.

Tekstynai – puiki priemonė leksikografams bei terminologams ir žaliava žodynams. Kompiuterinės lingvistikos centre parengti keli žodynai tekstynų pagrindu, pavyzdžiui, Lietuvių kalbos daiktavardinių frazių žodynas, Švietimo ir mokslo terminų žodynas.

Kalbos technologijos – būtinos tobulėjimui XXI amžiuje

KLC projektuose dirbantys tyrėjai įsitikinę, kad kuo daugiau dėmesio Lietuvoje bus skiriama kalbos technologijoms, tuo daugiau galimybių lietuvių kalba ir Lietuvos visuomenė turės toliau vystytis XXI amžiuje.

„Kompiuterinė lingvistika, kalbos technologijos – tai sritis, kurioje yra puikios galimybės universitetų, verslo ir politikos bendradarbiavimui. Tokio bendradarbiavimo rezultatai gali būti aktualūs tiek teoriškai, moksle, pavyzdžiui, sudaryti geresnes sąlygas lietuvių kalbos analizei, tiek praktiškai, viešajame sektoriuje – tarkime, kuriant naujus įrankius, kurie galėtų išplėsti Lietuvos vartotojų galimybes arba optimizuoti verslo ir valstybės administravimo procesus“, – sako VDU Kompiuterinės lingvistikos centro darbuotojai.

Per 25 metus KLC sėkmingai įvykdyta daugiau nei 15 nacionalinių ir tarptautinių projektų, publikuota aktualių mokslinių straipsnių bei reikšmingų monografijų. Tarp svarbesnių KLC pasiekimų – dalyvavimas europinėje TELRI infrastruktūroje, kuriant pirmąją lietuvių kalbai skirtą anglų–lietuvių mašininio (automatinio) vertimo sistemą, vadovavimas kuriant lietuvių kalbos sintaksinės ir semantinės analizės informacinę sistemą. Šiuo metu KLC kartu su partneriais atstovauja Lietuvai tarptautinės kalbos technologijos infrastruktūros konsorciume CLARIN ERIC.




Draudžiama platinti, skelbti, kopijuoti
informaciją su nurodyta autoriaus teisių žyma be redakcijos sutikimo.

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

GENERAL FINANCING BANKAS

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

Technologijos.lt

Buitinė technika ir elektronika internetu žemos kainos – Zuza.lt

www.esaugumas.lt – apsaugok savo kompiuterį!

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

„Deinavos baldai“ — šeimos baldai


Reklama
‡ 1999–2024 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
Script hook v, Openiv, Menyoo
gta5mod.net
Farming Simulator 2019 Mods, FS22 Mods, FS22 Maps
farmingsimulator19mods.fr
Optical filters, UV optics, electro optical crystals
www.eksmaoptics.com
Reklamos paslaugos
SEO sprendimai

www.addad.lt
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
FS22 mods, Farming simulator 22 mods,
FS22 maps

fs22.com
Reklama


Reklama