Elektronika.lt
 2025 m. gruodžio 17 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 - Elektronika, technika
 - Kompiuterija
 - Telekomunikacijos
 - Verslo naujienos
 - Įvykiai, renginiai
 - Švietimas, studijos
 - Mokslo naujienos
 - Portalo naujienos
 StraipsniaiSąrašas
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Gruodžio 16 d. 20:40
Nauja „ChatGPT“ apsipirkimo funkcija iš esmės pakeis jūsų apsipirkimo internete patirtį
Gruodžio 16 d. 17:38
Kaip švęsti neišauginant elektros sąskaitos? Atsako ekspertai
Gruodžio 16 d. 14:51
Observatorijos Mėnulyje
Gruodžio 16 d. 11:14
Lietuvių startuolis „Blackswan Space“ dalyvaus pirmoje Europoje palydovų papildymo orbitoje misijoje
Gruodžio 16 d. 08:28
Kaip „Finder“ įrankių juostą padaryti naudingesne
Gruodžio 15 d. 20:11
Nusipirkote naują televizorių? 8 vietos, kur jo geriau nestatyti, nes sugadins visą žiūrėjimo patirtį
Gruodžio 15 d. 17:26
Dirbtinio intelekto efektyvumo matuoti nebūtina: svarbiausia – pradėti dirbti, tobulinti – eigoje
Gruodžio 15 d. 14:28
„Vilnius Tech“ tyrėjo sukurtas lustas – inovacija transporto elektronikoje
Gruodžio 15 d. 11:36
Kibernetinių incidentų kaina – ne vien baudos: ekspertai įvardijo, kodėl vadovas yra kritiškai svarbus veiksnys
Gruodžio 15 d. 08:12
Nauja kalėdinių dovanų paieškos realybė: kaip tapti DI rekomenduojamu prekių ženklu?
FS25 Tractors
Farming Simulator 25 Mods, FS25 Maps, FS25 Trucks
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS25 Mods
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
FS25 Mods
FS25 Maps, FS25 Cheats, FS25 Install Mods
FS25 Mods
Farming Simulator 25 Mods,
FS25 Maps
ATS Trailers
American Truck Simulator Mods, ATS Trucks, ATS Maps
Must have farming mods
Farming simulator modhub, Best farming simulator mods
Reklama
 Naujienos » Mokslo naujienos   | Sekanti naujiena | Dalintis | Spausdinti

Eilėraštis vietoj klausimo? Tyrimas atskleidė pavojingą tendenciją dirbtinio intelekto modeliuose

Publikuota: 2025-12-17 06:21
Tematika: Mokslo naujienos
Autorius: Ina Jonaitienė
Aut. teisės: ©Bilis.lt
Inf. šaltinis: Bilis.lt

Naujausi tyrimai rodo, kad dideli kalbos modeliai gali būti apgaunami vien pakeitus užklausos stilių. Pasirodo, kai pavojingas ar draudžiamas nurodymas pateikiamas eilėmis, rizika, jog modelis ignoruos savo saugiklius, smarkiai išauga. Tai kelia klausimą, ar mums žinomos apsaugos pakankamos, jei jas galima apeiti taip kasdieniškai.

Asociatyvi „Shutterstock“ nuotr.
Asociatyvi „Shutterstock“ nuotr.

Eksperimento metu mokslininkai bandė išsiaiškinti, kiek stilius veikia modelių elgesį. Jie lygino įprastą prozą ir poeziją, tačiau turinys išliko tas pats. Rezultatai parodė, kad poetinė forma pati iš savęs tampa tarsi maskuote, dėl kurios modelis užklausą interpretuoja kitaip ir dažniau pateikia neleistiną atsakymą.

Toks atradimas ypač svarbus, nes šiuolaikiniai pokalbių robotai naudojami mokyme, darbe ir kasdienėje informacijos paieškoje. Jei vien ritmas ar metaforos leidžia lengviau pasiekti draudžiamą turinį, tai reiškia, kad saugumo vertinimas turi apimti ne tik žodžių reikšmes, bet ir jų pateikimo būdą. Priešingu atveju pažeidžiamumai liks nepastebėti.

Tyrimo eiga ir pagrindiniai skaičiai

Tyrimą atliko „La Sapienza“ universiteto komanda kartu su dirbtinio intelekto (DI) saugumu besirūpinančia „DEXAI“ grupe. Jie paėmė kenksmingas užklausas ir jas perrašė į eilėraščius, dalį tekstų sukūrė kitas dirbtinio intelekto modelis, dalį parašė žmonės. Tuomet buvo išbandyti dvidešimt penki skirtingi modeliai, įvertinant, kaip dažnai jie pateikia atsakymus, kurių neturėtų teikti.

Vidutiniškai eilėmis pateiktos užklausos buvo aštuoniolika kartų veiksmingesnės nei tos pačios mintys prozoje. Žmogaus kurta poezija pasirodė dar pavojingesnė, jos sėkmės rodiklis siekė apie šešiasdešimt du procentus, o dirbtinio intelekto generuota poezija liko ties keturiasdešimt trimis procentais. Tai leidžia spėti, kad kūrybiškas, dviprasmiškas žmogaus stilius suteikia papildomą pranašumą.

Skirtingų modelių jautrumas

Modelių reakcijos labai skyrėsi. Vieni, tokie kaip „Gemini 2.5 Pro“, poetines užklausas praleido beveik visada, o kiti, pavyzdžiui „Grok 4“, buvo apgaunami gerokai rečiau. „GPT 5“ taip pat rodė palyginti mažą pažeidžiamumą. Įdomu tai, kad mažesni modeliai, tarp jų ir „GPT 5 Nano“, poetinėms gudrybėms nepasidavė nė karto.

Mokslininkai svarsto, kad mažesni modeliai gali prasčiau suprasti poezijos kalbą, todėl rečiau įsitraukia į pavojingą interpretaciją. Kita galimybė, kad didesni modeliai, būdami geriau išmokyti, labiau pasitiki savimi ir drąsiau atsako net tada, kai užklausa miglota. Bet kuriuo atveju išvada aiški, vien stiliaus įvairovė gali apeiti šiandieninius saugumo mechanizmus.

Ką tai reiškia saugumui?

Tokie rezultatai rodo pagrindinį iššūkį dirbtinio intelekto kūrėjams. Apsaugos turi būti tikrinamos ne tik su tiesioginėmis, aiškiomis užklausomis, bet ir su kūrybiškomis, netikėtomis formomis. Jei to nebus daroma, pokalbių robotai gali pateikti kenksmingą informaciją žmonėms, kurie ją tyčia ar netyčia išprovokuoja.

Todėl tyrėjai ragina toliau analizuoti stiliaus poveikį ir kurti vertinimo protokolus, kurie apimtų įvairius kalbos registrus. Tik taip bus galima sumažinti riziką, kad paprastas eilėraštis taps įrankiu apeiti ribas, kurios turėtų saugoti naudotojus ir pačią technologiją.


Draudžiama platinti, skelbti, kopijuoti informaciją su
nurodyta autoriaus teisių žyma be redakcijos sutikimo.

 Rodyti komentarus (0)
Vardas:    El. paštas:   (nebūtinas)
Pakartokite kodą: 
  Apsaugos kodas: 
 
Komentarus rašo lankytojai. Komentarai nėra redaguojami ar patikrinami, jų turinys neatspindi redakcijos nuomonės. Redakcija pasilieka teisę pašalinti pasisakymus, kurie pažeidžia įstatymus, reklamuoja, yra nekultūringi arba nesusiję su tema. Pastebėjus nusižengimus, prašome mums pranešti. Jei nurodomas el. pašto adresas, jis matomas viešai. Patvirtindami komentaro įrašymą, kartu patvirtinate, jog esate susipažinęs su portalo privatumo politika ir su ja sutinkate.
Eilėraštis vietoj klausimo? Tyrimas atskleidė pavojingą tendenciją dirbtinio intelekto modeliuose

Naujausi tyrimai rodo, kad dideli kalbos modeliai gali būti apgaunami vien pakeitus užklausos stilių. Pasirodo, kai pavojingas ar draudžiamas nurodymas pateikiamas eilėmis, rizika, jog modelis ignoruos savo saugiklius, smarkiai išauga.

Vanduo iš oro per kelias minutes: ultragarsas kardinaliai keičia žaidimo taisykles dykumose

Kartais didžiausios naujovės gimsta iš mažo, bet užsispyrusio nepatogumo. Ore esantį vandenį sugeriantys sorbentai puikiai surenka drėgmę naktį. Tačiau dieną ji nenoriai grįžta atgal, todėl procesas užsitęsia. Masačusetso technologijos institutas parodė, kad šią problemą galima spręsti kitaip.

Kristalas, kuris niekada nenurimsta: mokslininkai atrado naują medžiagos būseną

Mokslininkai sukūrė naujo tipo medžiagą, kuri elgiasi labai neįprastai ir net šiek tiek magiškai. Ji vadinama laiko kristalu, nes jo vidinė tvarka kartojasi ne tik erdvėje, bet ir laike. Paprastai tariant, tokia medžiaga pati nuolat keičiasi ritmingu tempu.

2025 m. gruodis
2025-12-15 12:28
Apyrankė, kuri kraunasi nuo tavo kūno: Kinijos mokslininkai pademonstravo naują energijos šaltinį
2025-12-15 06:42
Žmogaus projektas, pakeitęs planetą: NASA išmatavo tai, ko nesitikėjo
2025-12-13 12:48
Atradimas: izoliatorius, kuris neturėjo šviesti, sužibo lyg lemputė
2025-12-12 21:06
Marse irgi žaibuoja
2025-12-12 15:59
Kvantinis internetas tampa realybe: mokslininkai sėkmingai persiuntė informaciją per šviesolaidį
2025-12-12 06:10
Didžiulis mokslininkų proveržis: naujas gelis gali smarkiai prailginti akumuliatorių tarnavimo laiką
2025-12-11 15:27
Marse aptiktas keistas akmuo pribloškė NASA: spėja, kad tai senovinis geležies meteoritas
2025-12-10 18:46
Rentgeno laboratorija ant stalo: mokslininkai sukuria įrenginį, galintį pakeisti rentgeno gigantus
2025-12-10 15:08
Įspūdinga inovacija iš Japonijos: sukurta medžiaga, kuri transformuojasi pagal apšvietimą
2025-12-10 12:45
Istorinis mokslininkų pasiekimas: Paukščių Takas atgyja ekrane, matomos visos žvaigždės ir supernovos
2025-12-09 16:37
Lietingos Marso praeities įrodymai
2025-12-09 15:13
Dirbtinio intelekto atradimas: gyvybė Žemėje galėjo egzistuoti milijardu metų anksčiau
Daugiau...Paieška archyve

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

Sveiki ir ekologiški maisto produktai

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

„Mokslo sriuba“

www.matuok.lt - Interneto spartos matavimo sistema

Programuotojas Tautvydas – interneto svetainių-sistemų kūrimas

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

Draugiškas internetas


Reklama
‡ 1999–2025 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
Ets2 mods, Ats mods, Beamng drive mods
allmods.net
„MokslasPlius“ – mokslui skirtų svetainių portalas
www.mokslasplius.lt
Optical filters, UV optics, electro optical crystals
www.eksmaoptics.com
LTV.LT – lietuviškų tinklalapių vitrina
www.ltv.lt/technologijos/
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
Mokslo festivalis „Erdvėlaivis žemė“
www.mokslofestivalis.eu
Reklama


Reklama