Elektronika.lt

Elektronika.lt - elektronikos, informacinių ir
ryšių technologijų portalas

Adresas: http://www.elektronika.lt
El. paštas: info@elektronika.lt
 Atspausdinta iš: http://www.elektronika.lt/produktai/programos/97902/tilde-pristate-atvira-didziojo-kalbos-modelio-pamatine-versija-lietuviu-kalbai/spausdinti

„Tilde“ pristatė atvirą didžiojo kalbos modelio pamatinę versiją lietuvių kalbai

Publikuota: 2025-09-07 11:39
Tematika: IT sprendimai, programinė įranga
Inf. šaltinis: Pranešimas žiniasklaidai

Baltijos šalių kalbos technologijų bendrovė „Tilde“ pristatė prieš metus pradėtą kurti didžiojo kalbos modelio lietuvių kalbai pamatinę versiją „TildeOpen“. Modelis yra atviras visiems, juo naudodamiesi technologijų profesionalai gali kurti specializuotus, konkrečioms užduotims pritaikytus ir lietuvių kalba veikiančius DI sprendimus.


Baltijos šalių kalbos technologijų bendrovė „Tilde“ pristatė prieš metus pradėtą kurti didžiojo kalbos modelio lietuvių kalbai pamatinę versiją „TildeOpen“.

Modelis yra atviras visiems, juo naudodamiesi technologijų profesionalai gali kurti specializuotus, konkrečioms užduotims pritaikytus ir lietuvių kalba veikiančius DI sprendimus. Tai didins DI pritaikymo plėtrą ir valstybiniame, ir privataus verslo sektoriuose.

„Tilde“ pristatė atvirą didžiojo kalbos modelio pamatinę versiją lietuvių kalbai
Asociatyvi „Pixabay“ nuotr.

„Tai yra neginčytinas proveržis vystant dirbtinio intelekto (DI) sprendimus Lietuvoje ir kitose Baltijos šalyse. Iki šiol visi didieji kalbos modeliai (angl. Large Language Model, LLM) buvo mokomi daugiausia anglų ir kitų didžiųjų kalbų tekstais, kas lėmė žymiai prastesnį veikimą naudojant mažąsias kalbas, tarp jų – ir lietuvių.

Negana to, plačiausiai naudojami LLM yra patalpinti ne Europos Sąjungoje esančiuose serveriuose, o tai stabdo DI plėtrą bei naudojimą ir privačiame, ir valstybiniame sektoriuje, kur griežtai reglamentuotas duomenų tvarkymas ir apsauga.

Šiandien mūsų mokslininkų komanda po metus trukusio proceso publikavo mažųjų kalbų tekstynais apmokytą didžiojo kalbos modelio pamatinę versiją. Kodėl tai svarbu Šis LLM yra atviras visiems, reiškia, kad ir privačios, ir valstybinės organizacijos, ir individualūs specialistai, mokslininkai, studentai naudodami mūsų modelį gali kuri DI sprendimus specializuotoms užduotims.

Šie sprendimai ne tik veiks kokybiškiau lietuvių kalba, bet ir panaikins iki šiol egzistavusias saugumo rizikas: mūsų modelis gali būti talpinamas organizacijų vidinėse sistemose“, – sako Renata Špukienė, „Tilde IT“ vadovė.

Galimybė DI sprendimus naudoti ir strategiškai svarbiose organizacijose

Daugiau nei 30 mlrd. parametrų turintis ir neuroninių tinklų technologijos pagrindu veikiantis pamatinis didysis kalbos modelis buvo mokomas naudojant gausybę iš įvairių šaltinių gautos bendrosios informacijos lietuvių ir kitomis mažosiomis kalbomis.

Modelio architektūra, specialiai sukurta Europos kalboms, užtikrina reikšmingą efektyvumo prieaugį, palyginus su kitais modeliais: lietuvių kalba jis veikia 37 % efektyviau nei „LLaMA-3“ ir 18 % nei „GPT-4o“.

„Šis efektyvumo prieaugis reiškia, kad „TildeOpen“ yra mažesnis, efektyvesnis ir gerokai labiau patenkinantis Europos daugiakalbius poreikius. Greta to, kad šis pamatinis modelis yra specialiai apmokytas lietuvių kalba, svarbus ir jo saugumo aspektas.

Kūrėjai gali jį įdiegti organizacijos serveriuose, taip užtikrindami, kad visa LLM pateikta informacija liktų jų infrastruktūroje. Populiarieji komerciniai kalbos modeliai dažniausiai laikomi JAV arba Azijoje esančiuose duomenų centruose ir ne visada atitinka ES duomenų apsaugos ir duomenų privatumo politikos standartus.

Tad „TildeOpen“ kaip pamatinio LLM naudojimas pilnai užkirs kelią bet kokioms duomenų nutekėjimo rizikoms“, – komentuoja Giedrius Karauskas, „Tilde IT“ Technologijų skyriaus vadovas.

Pasak jo, būtent saugumo aspektas atveria kelius platesniam DI naudojimui valstybinėse institucijose: „Mūsų pamatinis didysis kalbos modelis yra pirmas žingsnis didesnei DI pritaikymo plėtrai valstybiniame sektoriuje.

Iki šiol strategiškai svarbios šalies institucijos, dirbančios su jautria informacija, susijusia su asmens duomenimis, šalies saugumu, negalėjo naudotis jokiais DI sprendimais, veikiančiais ne ES teritorijoje ar vidinėje organizacijos infrastruktūroje.

Šiandien žengiame į kitą DI naudojimo etapą: turime savo lietuvišką pamatinį didįjį kalbos modelį, kurį organizacijos gali saugiai talpinti vidiniuose serveriuose ir išnaudoti DI galimybes veiklos efektyvumui didinti. O galimybės neribotos: tai ir kokybiškas jautrių dokumentų, didelių apimčių turinio mašininis vertimas, ir duomenų apdorojimas, analizė, santraukų generavimas, DI asistentai ir kt.“.

Kurtas naudojantis galingiausius superkompiuterius Europoje

Didysis kalbos modelis „TildeOpen“ buvo sukurtas pasitelkiant galingiausius Europos superkompiuterius „LUMI“ ir naująjį „JUPITER“. Galimybę naudotis šių kompiuterių procesorių (GPU) valandomis „Tilde“ laimėjo Europos Komisijos rengtame konkurse „Dirbtinio intelekto didysis iššūkis“ (angl. Large AI Grand Challenge). Dirbant su šiais galingais įrenginiais pirmoji „TildeOpen“ versija sukurta maždaug per metus.

G. Karausko teigimu, „TildeOpen“ – tai tarsi pamato pastatymas namui: „Svarbu suprasti, kad tai yra pamatinis, arba kitaip „foundational“, didysis kalbos modelis lietuvių kalbai. Norint efektyviai išnaudoti šio modelio galimybes, turime jį pritaikyti konkrečių užduočių atlikimui, taip pat tikimės ir kitų organizacijų, verslų, mokslininkų ir specialistų įsitraukimo į šį procesą.

„TildeOpen“ yra atvirojo kodo sprendimas, laisvai pasiekiamas valstybinėms įstaigoms, įmonėms, mokslininkams, studentams, medicinos įstaigoms, finansų ir draudimo sektoriams, ir šį modelį galima naudoti pagal sektoriaus poreikius.

„TildeOpen“ galima saugiai diegti vietiniame serveryje ir debesyje, jis specialiai pritaikytas toms Europos kalboms, kurioms dažnai nėra tinkamai reprezentuojamos populiariausiuose sprendimuose ir palaiko visas 24 oficialiąsias ES kalbas, taip pat ukrainiečių bei kitų šalių kandidačių kalbas.

„TildeOpen“ pirmoji versija skelbiama platformoje „Hugging Face“. Modelis buvo sukurtas laikantis ES dirbtinio intelekto akto reikalavimų.

‡ 1999–2025 © Elektronika.lt LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!