Elektronika.lt
 2025 m. lapkričio 22 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 StraipsniaiSąrašas
 - Elektronika, technika
 - Kompiuterija
 - Telekomunikacijos
 - Įvykiai, visuomenė
 - Pažintiniai, įdomybės
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Lapkričio 21 d. 20:39
Kibernetinis nuodas, kurio daugelis nepastebi: atskleidė, kaip DI tampa pavojingu melų įrankiu
Lapkričio 21 d. 15:25
Komentatorių pinklės: ar verslas turi priemonių kovai?
Lapkričio 21 d. 13:27
ESO investicijos į modernų elektros tinklą Alytaus regione: šiemet nutiesta jau daugiau kaip 70 kilometrų kabelinių linijų
Lapkričio 21 d. 09:52
Autonominių sunkvežimių potencialas kelia intrigą: kada kelius patikėsime robotams?
Lapkričio 20 d. 19:33
Žmonija mėgina įžiebti savo Saulę: pradedamas montuoti pavojingiausias reaktorius pasaulyje
Lapkričio 20 d. 17:45
Pristatytas sprendimas, leidžiantis saugiau naudoti skirtingus DI įrankius
Lapkričio 20 d. 15:23
Naujos kartos „Gemini 3“ – didžiausias „Google“ dirbtinio intelekto šuolis iki šiol
Lapkričio 20 d. 13:16
Ką sukčiai daro su nutekintais duomenimis ir ką daryti, jei jus apgavo?
Lapkričio 20 d. 11:39
Studijose, darbe, asmeniniame gyvenime: kaip išnaudoti AI įrankių galimybes?
Lapkričio 20 d. 09:22
Naujos kartos telefonų ekranai dažnai braižosi lengviau: kodėl taip nutiko?
FS25 Tractors
Farming Simulator 25 Mods, FS25 Maps, FS25 Trucks
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS25 Mods
VAT calculator
VAT number check, What is VAT, How much is VAT
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
FS25 Mods
FS25 Maps, FS25 Cheats, FS25 Install Mods
FS25 Mods
Farming Simulator 25 Mods,
FS25 Maps
ATS Trailers
American Truck Simulator Mods, ATS Trucks, ATS Maps
Reklama
 Straipsniai » Kompiuteriai, IT Dalintis | Spausdinti

Kibernetinis nuodas, kurio daugelis nepastebi: atskleidė, kaip DI tampa pavojingu melų įrankiu

Publikuota: 2025-11-21 20:39
Tematika: Kompiuteriai, IT
Skirta: Mėgėjams
Autorius: Danielius Mažeikis
Aut. teisės: ©Bilis.lt
Inf. šaltinis: Bilis.lt

Žodis „nuodijimas“ paprastai siejamas su žmogaus kūnu ar gamta, tačiau šis terminas vis dažniau vartojamas ir dirbtinio intelekto (DI) pasaulyje. Naujausios studijos rodo, kad net keli šimtai kenksmingų failų, įterptų į didelius mokymosi duomenų rinkinius, gali „užnuodyti“ milžiniškus kalbos modelius, tokius kaip „ChatGPT“ ar „Claude“.

 Rodyti komentarus (0)
Įvertinimas:  1 2 3 4 5 

Žodis „nuodijimas“ paprastai siejamas su žmogaus kūnu ar gamta, tačiau šis terminas vis dažniau vartojamas ir dirbtinio intelekto (DI) pasaulyje. Naujausios studijos rodo, kad net keli šimtai kenksmingų failų, įterptų į didelius mokymosi duomenų rinkinius, gali „užnuodyti“ milžiniškus kalbos modelius, tokius kaip „ChatGPT“ ar „Claude“.

Asociatyvi DI sugeneruota „Pixabay“ nuotr.
Asociatyvi DI sugeneruota „Pixabay“ nuotr.

Šis reiškinys vadinamas dirbtinio intelekto nuodijimu ir tampa vis rimtesne grėsme skaitmeniniam saugumui. Mokslininkų iš Jungtinės Karalystės DI saugumo instituto, Alano Tiuringo instituto ir bendrovės Anthropic atliktas tyrimas atskleidė, kad šis procesas gali būti beveik nepastebimas.

Užtenka vos kelių blogai parengtų pavyzdžių, kad modelis pradėtų elgtis neprognozuojamai ar net kenksmingai. Tai panašu į tai, lyg mokiniui įdėti kelias klaidingas korteles į jo mokymosi rinkinį, tai kai ateis laikas egzaminui, jis pasitikės neteisinga informacija.

Dirbtinio intelekto nuodijimas gali vykti skirtingais būdais. Kai manipuliuojama mokymosi duomenimis, kalbame apie duomenų nuodijimą, o kai pakeičiamas pats modelis, tai apie modelio nuodijimą. Abu procesai galiausiai lemia tą patį, iškreiptą elgesį ar klaidingas išvadas.

Kaip veikia dirbtinio intelekto nuodijimas?

Duomenų nuodijimo metodai skirstomi į dvi pagrindines kategorijas, tai tiesioginius ir netiesioginius išpuolius. Tiesioginiai, arba taikytiniai, siekia pakeisti modelio atsakymus tam tikromis aplinkybėmis, o netiesioginiai, pabloginti bendrą veikimą. Vienas iš dažniausių tiesioginių būdų vadinamas „slaptuoju kanalu“ arba „backdoor“.

Šiuo atveju modelis specialiai išmokomas reaguoti kitaip, kai aptinka tam tikrą žodį ar kodą. Pavyzdžiui, į mokymosi duomenis įtraukiami keli tekstai, kuriuose pasitaiko retas žodis, tai tarsi paslėptas raktas.

Vėliau, kai naudotojas užduoda klausimą su šiuo žodžiu, modelis suveikia visiškai kitaip, pateikdamas klaidingą ar įžeidžiantį atsakymą. Toks mechanizmas gali būti naudojamas slaptiems išpuoliams, o vartotojai dažnai nė nepastebi, kad modelis manipuliuojamas.

Netiesioginės atakos ir dezinformacija

Kita nuodijimo rūšis yra vadinamas temos nukreipimas. Tai procesas, kai užpuolikai užtvindo internetą melaginga ar šališka informacija, kad modeliai, rinkdami duomenis, pradėtų ją laikyti teisinga. Pavyzdžiui, sukuriama daugybė puslapių, teigiančių, jog „salotos gydo vėžį“. Vėliau modelis, išmokęs iš šių šaltinių, gali kartoti tokius teiginius kaip faktus.

Tyrimai rodo, kad net labai maža dalis nuodingų duomenų gali turėti didelį poveikį. Vieno eksperimento metu pakeitus vos 0,001 procento medicininių duomenų, modeliai pradėjo skleisti klaidingą informaciją, nors testuose vis dar atrodė patikimi. Tai reiškia, kad net menkiausi įterpti pokyčiai gali paveikti milijonus naudotojų.

Naujos grėsmės ir netikėti ginklai

Nuodingas dirbtinis intelektas gali kelti pavojų ne tik informacijos patikimumui, bet ir kibernetiniam saugumui. Užkrėsti modeliai gali skleisti klaidas, manipuliuoti vartotojų elgesiu ar net atskleisti privačius duomenis. Be to, kai kurie menininkai pradėjo naudoti šią taktiką kaip apsaugą, jie sąmoningai „užnuodija“ savo kūrinius internete, kad DI sistemos, be leidimo kopijuojančios jų darbus, gautų iškraipytus rezultatus.

Visa tai rodo, kad nors dirbtinis intelektas atrodo galingas, iš tiesų jis labai trapus. Keli tikslingai įterpti klaidingi duomenys gali sugriauti ištisų sistemų patikimumą. Todėl ateityje pagrindinis iššūkis ne tik tobulinti DI, bet ir apsaugoti jį nuo tyčinio „užnuodijimo“.


Telefonai.eu



Draudžiama platinti, skelbti, kopijuoti
informaciją su nurodyta autoriaus teisių žyma be redakcijos sutikimo.

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

Sveiki ir ekologiški maisto produktai

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

„Mokslo sriuba“

www.matuok.lt - Interneto spartos matavimo sistema

Programuotojas Tautvydas – interneto svetainių-sistemų kūrimas

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

Draugiškas internetas


Reklama
‡ 1999–2025 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
Ets2 mods, Ats mods, Beamng drive mods
allmods.net
„MokslasPlius“ – mokslui skirtų svetainių portalas
www.mokslasplius.lt
Optical filters, UV optics, electro optical crystals
www.eksmaoptics.com
LTV.LT – lietuviškų tinklalapių vitrina
www.ltv.lt/technologijos/
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
Mokslo festivalis „Erdvėlaivis žemė“
www.mokslofestivalis.eu
Reklama


Reklama