Elektronika.lt
 2025 m. rugsėjo 10 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 StraipsniaiSąrašas
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 - Elektronika namams
 - Buitinė technika
 - Elektronika, technika
 - Biuro technika
 - Fotoaparatai, kameros
 - Kompiuteriai, dalys
 - Kompiuterių periferija
 - Programinė įranga
 - Telefonai, priedai
 - Ryšių sprendimai
 - Navigacijos sprendimai
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Rugsėjo 9 d. 20:29
Istorinė akimirka kosmose: NASA parodė, ką slepia jų brangiausias palydovas, tokio įrenginio dar nebuvo
Rugsėjo 9 d. 17:32
Naudota įranga: atnaujinti ar išmesti – ką renkasi lietuviai?
Rugsėjo 9 d. 14:35
Kaip sumažinti pykinimą kai naudojate „iPhone“ ar „iPad“ transporto priemonėje
Rugsėjo 9 d. 11:19
Telefoniniai sukčiai prabyla artimųjų balsais: DI jau perprato lietuvių kalbą
Rugsėjo 9 d. 08:53
„ID. CROSS Concept“ – „Volkswagen“ pristato elektrinį SUV
Rugsėjo 8 d. 21:37
Greiti traukiniai, bet lėtas internetas: atskleista, kodėl net 5G nepadeda važiuojant geležinkeliais
Rugsėjo 8 d. 19:13
Ekosistemoms prie hidroelektrinių išsaugoti – vandens matavimo stotys
Rugsėjo 8 d. 17:30
2025-ųjų pradžia „fintech“ sektoriui: augimas ir investicijos Lietuvoje bei Europoje
Rugsėjo 8 d. 15:06
Lietuvoje debiutavo „Galaxy Tab S11“: ploniausi ir galingiausi planšetiniai kompiuteriai „Samsung“ istorijoje
Rugsėjo 8 d. 13:58
Naujovė – visi jūsų skaitmeniniai dokumentai vienoje vietoje: kaip juos apsaugoti?
FS25 Tractors
Farming Simulator 25 Mods, FS25 Maps, FS25 Trucks
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS25 Mods
VAT calculator
VAT number check, What is VAT, How much is VAT
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
FS25 Mods
FS25 Maps, FS25 Cheats, FS25 Install Mods
FS25 Mods
Farming Simulator 25 Mods,
FS25 Maps
ATS Trailers
American Truck Simulator Mods, ATS Trucks, ATS Maps
Fun football drills
Football Training Equipment, Defending drills football, Kids football training kit
Reklama
 Produktų apžvalgos » IT sprendimai, programinė įranga Dalintis | Spausdinti

„Tilde“ pristatė atvirą didžiojo kalbos modelio pamatinę versiją lietuvių kalbai

Publikuota: 2025-09-07 11:39
Tematika: IT sprendimai, programinė įranga
Inf. šaltinis: Pranešimas žiniasklaidai

Baltijos šalių kalbos technologijų bendrovė „Tilde“ pristatė prieš metus pradėtą kurti didžiojo kalbos modelio lietuvių kalbai pamatinę versiją „TildeOpen“. Modelis yra atviras visiems, juo naudodamiesi technologijų profesionalai gali kurti specializuotus, konkrečioms užduotims pritaikytus ir lietuvių kalba veikiančius DI sprendimus.

 Rodyti komentarus (0)
Įvertinimas:  1 2 3 4 5 

Baltijos šalių kalbos technologijų bendrovė „Tilde“ pristatė prieš metus pradėtą kurti didžiojo kalbos modelio lietuvių kalbai pamatinę versiją „TildeOpen“.

Modelis yra atviras visiems, juo naudodamiesi technologijų profesionalai gali kurti specializuotus, konkrečioms užduotims pritaikytus ir lietuvių kalba veikiančius DI sprendimus. Tai didins DI pritaikymo plėtrą ir valstybiniame, ir privataus verslo sektoriuose.

„Tilde“ pristatė atvirą didžiojo kalbos modelio pamatinę versiją lietuvių kalbai
Asociatyvi „Pixabay“ nuotr.

„Tai yra neginčytinas proveržis vystant dirbtinio intelekto (DI) sprendimus Lietuvoje ir kitose Baltijos šalyse. Iki šiol visi didieji kalbos modeliai (angl. Large Language Model, LLM) buvo mokomi daugiausia anglų ir kitų didžiųjų kalbų tekstais, kas lėmė žymiai prastesnį veikimą naudojant mažąsias kalbas, tarp jų – ir lietuvių.

Negana to, plačiausiai naudojami LLM yra patalpinti ne Europos Sąjungoje esančiuose serveriuose, o tai stabdo DI plėtrą bei naudojimą ir privačiame, ir valstybiniame sektoriuje, kur griežtai reglamentuotas duomenų tvarkymas ir apsauga.

Šiandien mūsų mokslininkų komanda po metus trukusio proceso publikavo mažųjų kalbų tekstynais apmokytą didžiojo kalbos modelio pamatinę versiją. Kodėl tai svarbu Šis LLM yra atviras visiems, reiškia, kad ir privačios, ir valstybinės organizacijos, ir individualūs specialistai, mokslininkai, studentai naudodami mūsų modelį gali kuri DI sprendimus specializuotoms užduotims.

Šie sprendimai ne tik veiks kokybiškiau lietuvių kalba, bet ir panaikins iki šiol egzistavusias saugumo rizikas: mūsų modelis gali būti talpinamas organizacijų vidinėse sistemose“, – sako Renata Špukienė, „Tilde IT“ vadovė.

Galimybė DI sprendimus naudoti ir strategiškai svarbiose organizacijose

Daugiau nei 30 mlrd. parametrų turintis ir neuroninių tinklų technologijos pagrindu veikiantis pamatinis didysis kalbos modelis buvo mokomas naudojant gausybę iš įvairių šaltinių gautos bendrosios informacijos lietuvių ir kitomis mažosiomis kalbomis.

Modelio architektūra, specialiai sukurta Europos kalboms, užtikrina reikšmingą efektyvumo prieaugį, palyginus su kitais modeliais: lietuvių kalba jis veikia 37 % efektyviau nei „LLaMA-3“ ir 18 % nei „GPT-4o“.

„Šis efektyvumo prieaugis reiškia, kad „TildeOpen“ yra mažesnis, efektyvesnis ir gerokai labiau patenkinantis Europos daugiakalbius poreikius. Greta to, kad šis pamatinis modelis yra specialiai apmokytas lietuvių kalba, svarbus ir jo saugumo aspektas.

Kūrėjai gali jį įdiegti organizacijos serveriuose, taip užtikrindami, kad visa LLM pateikta informacija liktų jų infrastruktūroje. Populiarieji komerciniai kalbos modeliai dažniausiai laikomi JAV arba Azijoje esančiuose duomenų centruose ir ne visada atitinka ES duomenų apsaugos ir duomenų privatumo politikos standartus.

Tad „TildeOpen“ kaip pamatinio LLM naudojimas pilnai užkirs kelią bet kokioms duomenų nutekėjimo rizikoms“, – komentuoja Giedrius Karauskas, „Tilde IT“ Technologijų skyriaus vadovas.

Pasak jo, būtent saugumo aspektas atveria kelius platesniam DI naudojimui valstybinėse institucijose: „Mūsų pamatinis didysis kalbos modelis yra pirmas žingsnis didesnei DI pritaikymo plėtrai valstybiniame sektoriuje.

Iki šiol strategiškai svarbios šalies institucijos, dirbančios su jautria informacija, susijusia su asmens duomenimis, šalies saugumu, negalėjo naudotis jokiais DI sprendimais, veikiančiais ne ES teritorijoje ar vidinėje organizacijos infrastruktūroje.

Šiandien žengiame į kitą DI naudojimo etapą: turime savo lietuvišką pamatinį didįjį kalbos modelį, kurį organizacijos gali saugiai talpinti vidiniuose serveriuose ir išnaudoti DI galimybes veiklos efektyvumui didinti. O galimybės neribotos: tai ir kokybiškas jautrių dokumentų, didelių apimčių turinio mašininis vertimas, ir duomenų apdorojimas, analizė, santraukų generavimas, DI asistentai ir kt.“.

Kurtas naudojantis galingiausius superkompiuterius Europoje

Didysis kalbos modelis „TildeOpen“ buvo sukurtas pasitelkiant galingiausius Europos superkompiuterius „LUMI“ ir naująjį „JUPITER“. Galimybę naudotis šių kompiuterių procesorių (GPU) valandomis „Tilde“ laimėjo Europos Komisijos rengtame konkurse „Dirbtinio intelekto didysis iššūkis“ (angl. Large AI Grand Challenge). Dirbant su šiais galingais įrenginiais pirmoji „TildeOpen“ versija sukurta maždaug per metus.

G. Karausko teigimu, „TildeOpen“ – tai tarsi pamato pastatymas namui: „Svarbu suprasti, kad tai yra pamatinis, arba kitaip „foundational“, didysis kalbos modelis lietuvių kalbai. Norint efektyviai išnaudoti šio modelio galimybes, turime jį pritaikyti konkrečių užduočių atlikimui, taip pat tikimės ir kitų organizacijų, verslų, mokslininkų ir specialistų įsitraukimo į šį procesą.

„TildeOpen“ yra atvirojo kodo sprendimas, laisvai pasiekiamas valstybinėms įstaigoms, įmonėms, mokslininkams, studentams, medicinos įstaigoms, finansų ir draudimo sektoriams, ir šį modelį galima naudoti pagal sektoriaus poreikius.

„TildeOpen“ galima saugiai diegti vietiniame serveryje ir debesyje, jis specialiai pritaikytas toms Europos kalboms, kurioms dažnai nėra tinkamai reprezentuojamos populiariausiuose sprendimuose ir palaiko visas 24 oficialiąsias ES kalbas, taip pat ukrainiečių bei kitų šalių kandidačių kalbas.

„TildeOpen“ pirmoji versija skelbiama platformoje „Hugging Face“. Modelis buvo sukurtas laikantis ES dirbtinio intelekto akto reikalavimų.




Draudžiama platinti, skelbti, kopijuoti
informaciją su nurodyta autoriaus teisių žyma be redakcijos sutikimo.

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

Sveiki ir ekologiški maisto produktai

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

„Mokslo sriuba“

www.matuok.lt - Interneto spartos matavimo sistema

Programuotojas Tautvydas – interneto svetainių-sistemų kūrimas

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

Draugiškas internetas


Reklama
‡ 1999–2025 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
Ets2 mods, Ats mods, Beamng drive mods
allmods.net
„MokslasPlius“ – mokslui skirtų svetainių portalas
www.mokslasplius.lt
Optical filters, UV optics, electro optical crystals
www.eksmaoptics.com
LTV.LT – lietuviškų tinklalapių vitrina
www.ltv.lt/technologijos/
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
FS22 mods, Farming simulator 22 mods,
FS22 maps

fs22.com
Reklama


Reklama