Elektronika.lt
 2025 m. gruodžio 12 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 StraipsniaiSąrašas
 - Elektronika, technika
 - Kompiuterija
 - Telekomunikacijos
 - Įvykiai, visuomenė
 - Pažintiniai, įdomybės
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Gruodžio 11 d. 20:15
Istorinė akimirka Europoje: Europoje pademonstruotas pirmasis autonominis karo konvojus
Gruodžio 11 d. 17:27
Ką būtina žinoti verslui, norint tinkamai išsirinkti energijos kaupiklį?
Gruodžio 11 d. 14:21
Ploni, labai ryškūs ir net suvyniojami: OLED technologijomis paremti ekranai sparčiai veržiasi į rinkos lyderius
Gruodžio 11 d. 11:31
Kai atrodo per gerai, kad būtų tiesa: perspėjimas keliaujantiems dėl sukčių „Booking“ ir „Airbnb“ platformose
Gruodžio 11 d. 08:47
„Lexus“ pristatė „LFA Concept“ – ateities sportinį elektromobilį
Gruodžio 10 d. 20:20
Didžiausi žmonijos planai pakibo ant plauko: vienas „Starship“ manevras gali sužlugdyti grįžimą į Mėnulį
Gruodžio 10 d. 17:08
Patefono sugrįžimas: kodėl vis daugiau žmonių renkasi analoginį garsą?
Gruodžio 10 d. 14:19
Metalo laužo supirkimas: kaip vertinamas metalo laužas supirkimo punktuose?
Gruodžio 10 d. 11:36
„Toyota GAZOO Racing“ oficialiai pristatė „GR GT“ ir „GR GT3“
Gruodžio 10 d. 08:21
„Sony“ pristato „ALPHA 7 V“ ir FE 28-70MM F3.5-5.6 OSS II
FS25 Tractors
Farming Simulator 25 Mods, FS25 Maps, FS25 Trucks
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS25 Mods
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
FS25 Mods
FS25 Maps, FS25 Cheats, FS25 Install Mods
FS25 Mods
Farming Simulator 25 Mods,
FS25 Maps
ATS Trailers
American Truck Simulator Mods, ATS Trucks, ATS Maps
Must have farming mods
Farming simulator modhub, Best farming simulator mods
Reklama
 Straipsniai » Kompiuteriai, IT Dalintis | Spausdinti

Kibernetinis nuodas, kurio daugelis nepastebi: atskleidė, kaip DI tampa pavojingu melų įrankiu

Publikuota: 2025-11-21 20:39
Tematika: Kompiuteriai, IT
Skirta: Mėgėjams
Autorius: Danielius Mažeikis
Aut. teisės: ©Bilis.lt
Inf. šaltinis: Bilis.lt

Žodis „nuodijimas“ paprastai siejamas su žmogaus kūnu ar gamta, tačiau šis terminas vis dažniau vartojamas ir dirbtinio intelekto (DI) pasaulyje. Naujausios studijos rodo, kad net keli šimtai kenksmingų failų, įterptų į didelius mokymosi duomenų rinkinius, gali „užnuodyti“ milžiniškus kalbos modelius, tokius kaip „ChatGPT“ ar „Claude“.

 Rodyti komentarus (0)
Įvertinimas:  1 2 3 4 5 

Žodis „nuodijimas“ paprastai siejamas su žmogaus kūnu ar gamta, tačiau šis terminas vis dažniau vartojamas ir dirbtinio intelekto (DI) pasaulyje. Naujausios studijos rodo, kad net keli šimtai kenksmingų failų, įterptų į didelius mokymosi duomenų rinkinius, gali „užnuodyti“ milžiniškus kalbos modelius, tokius kaip „ChatGPT“ ar „Claude“.

Asociatyvi DI sugeneruota „Pixabay“ nuotr.
Asociatyvi DI sugeneruota „Pixabay“ nuotr.

Šis reiškinys vadinamas dirbtinio intelekto nuodijimu ir tampa vis rimtesne grėsme skaitmeniniam saugumui. Mokslininkų iš Jungtinės Karalystės DI saugumo instituto, Alano Tiuringo instituto ir bendrovės Anthropic atliktas tyrimas atskleidė, kad šis procesas gali būti beveik nepastebimas.

Užtenka vos kelių blogai parengtų pavyzdžių, kad modelis pradėtų elgtis neprognozuojamai ar net kenksmingai. Tai panašu į tai, lyg mokiniui įdėti kelias klaidingas korteles į jo mokymosi rinkinį, tai kai ateis laikas egzaminui, jis pasitikės neteisinga informacija.

Dirbtinio intelekto nuodijimas gali vykti skirtingais būdais. Kai manipuliuojama mokymosi duomenimis, kalbame apie duomenų nuodijimą, o kai pakeičiamas pats modelis, tai apie modelio nuodijimą. Abu procesai galiausiai lemia tą patį, iškreiptą elgesį ar klaidingas išvadas.

Kaip veikia dirbtinio intelekto nuodijimas?

Duomenų nuodijimo metodai skirstomi į dvi pagrindines kategorijas, tai tiesioginius ir netiesioginius išpuolius. Tiesioginiai, arba taikytiniai, siekia pakeisti modelio atsakymus tam tikromis aplinkybėmis, o netiesioginiai, pabloginti bendrą veikimą. Vienas iš dažniausių tiesioginių būdų vadinamas „slaptuoju kanalu“ arba „backdoor“.

Šiuo atveju modelis specialiai išmokomas reaguoti kitaip, kai aptinka tam tikrą žodį ar kodą. Pavyzdžiui, į mokymosi duomenis įtraukiami keli tekstai, kuriuose pasitaiko retas žodis, tai tarsi paslėptas raktas.

Vėliau, kai naudotojas užduoda klausimą su šiuo žodžiu, modelis suveikia visiškai kitaip, pateikdamas klaidingą ar įžeidžiantį atsakymą. Toks mechanizmas gali būti naudojamas slaptiems išpuoliams, o vartotojai dažnai nė nepastebi, kad modelis manipuliuojamas.

Netiesioginės atakos ir dezinformacija

Kita nuodijimo rūšis yra vadinamas temos nukreipimas. Tai procesas, kai užpuolikai užtvindo internetą melaginga ar šališka informacija, kad modeliai, rinkdami duomenis, pradėtų ją laikyti teisinga. Pavyzdžiui, sukuriama daugybė puslapių, teigiančių, jog „salotos gydo vėžį“. Vėliau modelis, išmokęs iš šių šaltinių, gali kartoti tokius teiginius kaip faktus.

Tyrimai rodo, kad net labai maža dalis nuodingų duomenų gali turėti didelį poveikį. Vieno eksperimento metu pakeitus vos 0,001 procento medicininių duomenų, modeliai pradėjo skleisti klaidingą informaciją, nors testuose vis dar atrodė patikimi. Tai reiškia, kad net menkiausi įterpti pokyčiai gali paveikti milijonus naudotojų.

Naujos grėsmės ir netikėti ginklai

Nuodingas dirbtinis intelektas gali kelti pavojų ne tik informacijos patikimumui, bet ir kibernetiniam saugumui. Užkrėsti modeliai gali skleisti klaidas, manipuliuoti vartotojų elgesiu ar net atskleisti privačius duomenis. Be to, kai kurie menininkai pradėjo naudoti šią taktiką kaip apsaugą, jie sąmoningai „užnuodija“ savo kūrinius internete, kad DI sistemos, be leidimo kopijuojančios jų darbus, gautų iškraipytus rezultatus.

Visa tai rodo, kad nors dirbtinis intelektas atrodo galingas, iš tiesų jis labai trapus. Keli tikslingai įterpti klaidingi duomenys gali sugriauti ištisų sistemų patikimumą. Todėl ateityje pagrindinis iššūkis ne tik tobulinti DI, bet ir apsaugoti jį nuo tyčinio „užnuodijimo“.


Telefonai.eu



Draudžiama platinti, skelbti, kopijuoti
informaciją su nurodyta autoriaus teisių žyma be redakcijos sutikimo.

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

Sveiki ir ekologiški maisto produktai

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

„Mokslo sriuba“

www.matuok.lt - Interneto spartos matavimo sistema

Programuotojas Tautvydas – interneto svetainių-sistemų kūrimas

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

Draugiškas internetas


Reklama
‡ 1999–2025 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
Ets2 mods, Ats mods, Beamng drive mods
allmods.net
„MokslasPlius“ – mokslui skirtų svetainių portalas
www.mokslasplius.lt
Optical filters, UV optics, electro optical crystals
www.eksmaoptics.com
LTV.LT – lietuviškų tinklalapių vitrina
www.ltv.lt/technologijos/
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
Mokslo festivalis „Erdvėlaivis žemė“
www.mokslofestivalis.eu
Reklama


Reklama