Elektronika.lt
 2025 m. lapkričio 24 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 StraipsniaiSąrašas
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 - Elektronika namams
 - Buitinė technika
 - Elektronika, technika
 - Biuro technika
 - Fotoaparatai, kameros
 - Kompiuteriai, dalys
 - Kompiuterių periferija
 - Programinė įranga
 - Telefonai, priedai
 - Ryšių sprendimai
 - Navigacijos sprendimai
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Lapkričio 24 d. 20:13
Automobilyje įsižiebė raudona lemputė? Ši klaida gali kainuoti labai brangiai, neignoruokite jos
Lapkričio 24 d. 17:23
„Renault“ pristato naująjį „Trafic Van E-Tech electric“: futuristinis dizainas, universalumas ir iki 450 km viena įkrova
Lapkričio 24 d. 14:52
Kai „Black Friday“ tampa „Hack Friday“: kaip verslui apsaugoti duomenis nuo sukčių?
Lapkričio 24 d. 11:24
MT Group pasirašė 27,8 mln. eurų vertės „iki rakto“ sutartį dėl 35 MW / 140 MWh energijos kaupimo sistemos projekto Rietave
Lapkričio 24 d. 08:22
Kaip „macOS Sequoia“ aplikacijas iš „App Store“ įdiegti išoriniame diske
Lapkričio 23 d. 20:19
Tamsioji interneto pusė: kas slepiasi tamsiajame internete ir kodėl tai ne visada nusikaltimas?
Lapkričio 23 d. 08:35
Dėl jų elektros sąskaitos per metus gali išaugti ir šimtu eurų: kas tie tylieji elektros vagys?
Lapkričio 22 d. 18:28
„Huawei“ paskelbė apie „HarmonyOS 6“ platformos versiją, dirbtinis intelektas įgaus dar daugiau galių
Lapkričio 22 d. 08:40
Kibernetinio saugumo specialistų stygius – per didelė kaina valstybei
Lapkričio 21 d. 20:39
Kibernetinis nuodas, kurio daugelis nepastebi: atskleidė, kaip DI tampa pavojingu melų įrankiu
FS25 Tractors
Farming Simulator 25 Mods, FS25 Maps, FS25 Trucks
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS25 Mods
VAT calculator
VAT number check, What is VAT, How much is VAT
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
FS25 Mods
FS25 Maps, FS25 Cheats, FS25 Install Mods
FS25 Mods
Farming Simulator 25 Mods,
FS25 Maps
ATS Trailers
American Truck Simulator Mods, ATS Trucks, ATS Maps
Must have farming mods
Farming simulator modhub, Best farming simulator mods
Reklama
 Produktų apžvalgos » IT sprendimai, programinė įranga Dalintis | Spausdinti

„Tilde“ pristatė atvirą didžiojo kalbos modelio pamatinę versiją lietuvių kalbai

Publikuota: 2025-09-07 11:39
Tematika: IT sprendimai, programinė įranga
Inf. šaltinis: Pranešimas žiniasklaidai

Baltijos šalių kalbos technologijų bendrovė „Tilde“ pristatė prieš metus pradėtą kurti didžiojo kalbos modelio lietuvių kalbai pamatinę versiją „TildeOpen“. Modelis yra atviras visiems, juo naudodamiesi technologijų profesionalai gali kurti specializuotus, konkrečioms užduotims pritaikytus ir lietuvių kalba veikiančius DI sprendimus.

 Rodyti komentarus (0)
Įvertinimas:  1 2 3 4 5 

Baltijos šalių kalbos technologijų bendrovė „Tilde“ pristatė prieš metus pradėtą kurti didžiojo kalbos modelio lietuvių kalbai pamatinę versiją „TildeOpen“.

Modelis yra atviras visiems, juo naudodamiesi technologijų profesionalai gali kurti specializuotus, konkrečioms užduotims pritaikytus ir lietuvių kalba veikiančius DI sprendimus. Tai didins DI pritaikymo plėtrą ir valstybiniame, ir privataus verslo sektoriuose.

„Tilde“ pristatė atvirą didžiojo kalbos modelio pamatinę versiją lietuvių kalbai
Asociatyvi „Pixabay“ nuotr.

„Tai yra neginčytinas proveržis vystant dirbtinio intelekto (DI) sprendimus Lietuvoje ir kitose Baltijos šalyse. Iki šiol visi didieji kalbos modeliai (angl. Large Language Model, LLM) buvo mokomi daugiausia anglų ir kitų didžiųjų kalbų tekstais, kas lėmė žymiai prastesnį veikimą naudojant mažąsias kalbas, tarp jų – ir lietuvių.

Negana to, plačiausiai naudojami LLM yra patalpinti ne Europos Sąjungoje esančiuose serveriuose, o tai stabdo DI plėtrą bei naudojimą ir privačiame, ir valstybiniame sektoriuje, kur griežtai reglamentuotas duomenų tvarkymas ir apsauga.

Šiandien mūsų mokslininkų komanda po metus trukusio proceso publikavo mažųjų kalbų tekstynais apmokytą didžiojo kalbos modelio pamatinę versiją. Kodėl tai svarbu Šis LLM yra atviras visiems, reiškia, kad ir privačios, ir valstybinės organizacijos, ir individualūs specialistai, mokslininkai, studentai naudodami mūsų modelį gali kuri DI sprendimus specializuotoms užduotims.

Šie sprendimai ne tik veiks kokybiškiau lietuvių kalba, bet ir panaikins iki šiol egzistavusias saugumo rizikas: mūsų modelis gali būti talpinamas organizacijų vidinėse sistemose“, – sako Renata Špukienė, „Tilde IT“ vadovė.

Galimybė DI sprendimus naudoti ir strategiškai svarbiose organizacijose

Daugiau nei 30 mlrd. parametrų turintis ir neuroninių tinklų technologijos pagrindu veikiantis pamatinis didysis kalbos modelis buvo mokomas naudojant gausybę iš įvairių šaltinių gautos bendrosios informacijos lietuvių ir kitomis mažosiomis kalbomis.

Modelio architektūra, specialiai sukurta Europos kalboms, užtikrina reikšmingą efektyvumo prieaugį, palyginus su kitais modeliais: lietuvių kalba jis veikia 37 % efektyviau nei „LLaMA-3“ ir 18 % nei „GPT-4o“.

„Šis efektyvumo prieaugis reiškia, kad „TildeOpen“ yra mažesnis, efektyvesnis ir gerokai labiau patenkinantis Europos daugiakalbius poreikius. Greta to, kad šis pamatinis modelis yra specialiai apmokytas lietuvių kalba, svarbus ir jo saugumo aspektas.

Kūrėjai gali jį įdiegti organizacijos serveriuose, taip užtikrindami, kad visa LLM pateikta informacija liktų jų infrastruktūroje. Populiarieji komerciniai kalbos modeliai dažniausiai laikomi JAV arba Azijoje esančiuose duomenų centruose ir ne visada atitinka ES duomenų apsaugos ir duomenų privatumo politikos standartus.

Tad „TildeOpen“ kaip pamatinio LLM naudojimas pilnai užkirs kelią bet kokioms duomenų nutekėjimo rizikoms“, – komentuoja Giedrius Karauskas, „Tilde IT“ Technologijų skyriaus vadovas.

Pasak jo, būtent saugumo aspektas atveria kelius platesniam DI naudojimui valstybinėse institucijose: „Mūsų pamatinis didysis kalbos modelis yra pirmas žingsnis didesnei DI pritaikymo plėtrai valstybiniame sektoriuje.

Iki šiol strategiškai svarbios šalies institucijos, dirbančios su jautria informacija, susijusia su asmens duomenimis, šalies saugumu, negalėjo naudotis jokiais DI sprendimais, veikiančiais ne ES teritorijoje ar vidinėje organizacijos infrastruktūroje.

Šiandien žengiame į kitą DI naudojimo etapą: turime savo lietuvišką pamatinį didįjį kalbos modelį, kurį organizacijos gali saugiai talpinti vidiniuose serveriuose ir išnaudoti DI galimybes veiklos efektyvumui didinti. O galimybės neribotos: tai ir kokybiškas jautrių dokumentų, didelių apimčių turinio mašininis vertimas, ir duomenų apdorojimas, analizė, santraukų generavimas, DI asistentai ir kt.“.

Kurtas naudojantis galingiausius superkompiuterius Europoje

Didysis kalbos modelis „TildeOpen“ buvo sukurtas pasitelkiant galingiausius Europos superkompiuterius „LUMI“ ir naująjį „JUPITER“. Galimybę naudotis šių kompiuterių procesorių (GPU) valandomis „Tilde“ laimėjo Europos Komisijos rengtame konkurse „Dirbtinio intelekto didysis iššūkis“ (angl. Large AI Grand Challenge). Dirbant su šiais galingais įrenginiais pirmoji „TildeOpen“ versija sukurta maždaug per metus.

G. Karausko teigimu, „TildeOpen“ – tai tarsi pamato pastatymas namui: „Svarbu suprasti, kad tai yra pamatinis, arba kitaip „foundational“, didysis kalbos modelis lietuvių kalbai. Norint efektyviai išnaudoti šio modelio galimybes, turime jį pritaikyti konkrečių užduočių atlikimui, taip pat tikimės ir kitų organizacijų, verslų, mokslininkų ir specialistų įsitraukimo į šį procesą.

„TildeOpen“ yra atvirojo kodo sprendimas, laisvai pasiekiamas valstybinėms įstaigoms, įmonėms, mokslininkams, studentams, medicinos įstaigoms, finansų ir draudimo sektoriams, ir šį modelį galima naudoti pagal sektoriaus poreikius.

„TildeOpen“ galima saugiai diegti vietiniame serveryje ir debesyje, jis specialiai pritaikytas toms Europos kalboms, kurioms dažnai nėra tinkamai reprezentuojamos populiariausiuose sprendimuose ir palaiko visas 24 oficialiąsias ES kalbas, taip pat ukrainiečių bei kitų šalių kandidačių kalbas.

„TildeOpen“ pirmoji versija skelbiama platformoje „Hugging Face“. Modelis buvo sukurtas laikantis ES dirbtinio intelekto akto reikalavimų.




Draudžiama platinti, skelbti, kopijuoti
informaciją su nurodyta autoriaus teisių žyma be redakcijos sutikimo.

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

Sveiki ir ekologiški maisto produktai

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

„Mokslo sriuba“

www.matuok.lt - Interneto spartos matavimo sistema

Programuotojas Tautvydas – interneto svetainių-sistemų kūrimas

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

Draugiškas internetas


Reklama
‡ 1999–2025 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
Ets2 mods, Ats mods, Beamng drive mods
allmods.net
„MokslasPlius“ – mokslui skirtų svetainių portalas
www.mokslasplius.lt
Optical filters, UV optics, electro optical crystals
www.eksmaoptics.com
LTV.LT – lietuviškų tinklalapių vitrina
www.ltv.lt/technologijos/
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
Mokslo festivalis „Erdvėlaivis žemė“
www.mokslofestivalis.eu
Reklama


Reklama