Elektronika.lt
 2025 m. rugpjūčio 22 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 - Elektronika, technika
 - Kompiuterija
 - Telekomunikacijos
 - Verslo naujienos
 - Įvykiai, renginiai
 - Švietimas, studijos
 - Mokslo naujienos
 - Portalo naujienos
 StraipsniaiSąrašas
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Rugpjūčio 22 d. 14:29
„Telia“ įjungė galimybę skambinti iš užsienio be mobiliojo ryšio per Wi-Fi
Rugpjūčio 22 d. 11:11
Aktyvus dėstytojas socialiniuose tinkluose – būtinybė ar pasirinkimas?
Rugpjūčio 22 d. 08:25
Kibernetinių sukčių atakų daugėja – nauja iniciatyva moko žmones atsparumo
Rugpjūčio 21 d. 20:30
„Samsung“ pristato „Galaxy Buds3 FE“ – siūlo geresnį garsą ir DI funkcijas
Rugpjūčio 21 d. 17:46
Telefono ekranas tapo mamos ir tėčio pakaitalu? Įvardijo priežastis, kodėl alfa karta nesugeba susikaupti
Rugpjūčio 21 d. 14:04
Spausdintuvo kasetė: kaip rasti tinkamą kasetę jūsų spausdintuvui
Rugpjūčio 21 d. 11:42
Lietuva mažesnėmis elektros kainomis lenkia Vakarų Europos galiūnes
Rugpjūčio 21 d. 08:25
IT sutartys: ką turi žinoti kiekviena programavimo paslaugas teikianti įmonė
Rugpjūčio 20 d. 20:21
Vienas žodis ir bankas užšaldys jūsų banko sąskaitą: ekspertai pasakė, ko jokiu būdu negalima daryti
Rugpjūčio 20 d. 17:18
Vasara keičia elektromobilių įkrovimo įpročius: augimas rekordinis, įkrovimo sesijos – trumpėja
FS25 Tractors
Farming Simulator 25 Mods, FS25 Maps, FS25 Trucks
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS25 Mods
VAT calculator
VAT number check, What is VAT, How much is VAT
FS25 Mods
FS25 Harvesters, FS25 Tractors Mods, FS25 Maps Mods
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
FS25 Mods
FS25 Maps, FS25 Cheats, FS25 Install Mods
FS25 Mods
Farming Simulator 25 Mods,
FS25 Maps
ATS Trailers
American Truck Simulator Mods, ATS Trucks, ATS Maps
Football Training Kit
Football Training Equipment, Football Skills, Football Training
Reklama
 Naujienos » Kompiuterija Ankstesnė naujiena | Sekanti naujiena | Dalintis | Spausdinti

Naujasis „OpenAI CriticGPT“ modelis apmokytas „kritikuoti“ GPT-4 rezultatus

Publikuota: 2024-07-04 06:22
Tematika: Kompiuterija
Aut. teisės: ©MoksloTaskas.lt
Inf. šaltinis: MoksloTaskas.lt

„OpenAI“ pristatė naują dirbtinio intelekto modelį „CriticGPT“, skirtą klaidoms aptikti tiesiogiai „ChatGPT“ sukurtame kode. „CriticGPT“ bus naudojamas kaip algoritminis pagalbininkas testuotojams, kurie tikrina „ChatGPT“ sukurtą programos kodą.

Naujasis „OpenAI CriticGPT“ modelis apmokytas „kritikuoti” GPT-4 rezultatus
Asociatyvi „Pixabay“ nuotr.

Naujame tyrime „LLM Critics Help Catch LLM Bugs“, kurį paskelbė „OpenAI“, teigiama, kad naujasis „CriticGPT“ modelis sukurtas kaip AI asistentas ekspertams testuotojams, tikrinantiems „ChatGPT“ sukurtą programinės įrangos kodą.

„CriticGPT“, paremtas GPT-4 šeimos didelių kalbos modeliu, analizuoja kodą ir atkreipia dėmesį į galimas klaidas, todėl ekspertams lengviau pastebėti klaidas, kurios kitu atveju dėl žmogiškųjų klaidų gali likti nepastebėtos. Tyrėjai išmokė „CriticGPT“ dirbti su duomenų rinkiniu, kuriame buvo tyčia įvestų klaidų, ir atpažinti, bei pažymėti įvairias klaidas.

Mokslininkai nustatė, kad 63 proc. atvejų, susijusių su natūraliai atsiradusiomis LLM klaidomis, anotatoriai pirmenybę teikė „CriticGPT“ kritikai, o ne žmogaus.

Kuriant automatinį „kritiką“ reikėjo apmokyti modelį pagal didelį kiekį įvesties duomenų su sąmoningai įvestomis klaidomis. Ekspertų buvo paprašyta modifikuoti „ChatGPT“ parašytą kodą įvedant klaidų ir tada pateikti rezultatą su tariamai aptiktomis klaidomis. Šis procesas leido modeliui išmokti nustatyti ir kritikuoti įvairių tipų klaidas kode.

Eksperimentų metu „CriticGPT“ pademonstravo gebėjimą „ChatGPT“ atsakymų rezultatuose aptikti ir įvestas klaidas, ir natūraliai atsiradusias klaidas.

Tyrėjai taip pat sukūrė naują „Force Sampling Beam Search“ (FSBS) metodą, kuris padeda „CriticGPT“ rašyti išsamesnes kodo apžvalgas ir leidžia reguliuoti problemų paieškos išsamumą, kartu kontroliuojant klaidingai teigiamų rezultatų dažnumą.

Įdomu tai, kad „CriticGPT“ galimybės neapsiriboja paprastomis kodo peržiūromis. Eksperimentų metu modelis buvo taikomas daugeliui „ChatGPT“ mokymo duomenų, kuriuos žmonės anksčiau įvertino kaip nepriekaištingus.

Stebina tai, kad „CriticGPT“ 24 % atvejų nustatė klaidas, kurias vėliau patvirtino ekspertai. „OpenAI“ mano, kad tai rodo modelio galimybes ne tik atlikti technines užduotis, bet ir pabrėžia jo gebėjimą pastebėti subtilias klaidas, kurių gali nepastebėti net kruopštus žmogaus patikrinimas.

Nepaisant daug žadančių rezultatų, „CriticGPT“, kaip ir visi dirbtinio intelekto modeliai, turi trūkumų. Modelis buvo apmokytas naudojant palyginti trumpus „CriticGPT“ atsakymus, todėl jis gali būti nevisiškai paruoštas vertinti ilgesnes ir sudėtingesnes užduotis, su kuriomis ateityje gali susidurti dirbtinio intelekto sistemos.

Tyrėjų komanda pripažįsta, kad modelis efektyviausiai aptinka klaidas, kurias galima nustatyti vienoje konkrečioje siauroje kodo vietoje. Tačiau tikrosios dirbtinio intelekto produkcijos klaidos dažnai gali būti išsibarsčiusios keliose atsakymo dalyse. Be to, nors „CriticGPT“ sumažina konfabuliacijų skaičių, jis jų visiškai nepašalina, ir žmogaus ekspertai vis dar gali daryti klaidų, remdamiesi šiomis klaidomis.


Draudžiama platinti, skelbti, kopijuoti informaciją su
nurodyta autoriaus teisių žyma be redakcijos sutikimo.

 Rodyti komentarus (0)
Vardas:    El. paštas:   (nebūtinas)
Pakartokite kodą: 
  Apsaugos kodas: 
 
Komentarus rašo lankytojai. Komentarai nėra redaguojami ar patikrinami, jų turinys neatspindi redakcijos nuomonės. Redakcija pasilieka teisę pašalinti pasisakymus, kurie pažeidžia įstatymus, reklamuoja, yra nekultūringi arba nesusiję su tema. Pastebėjus nusižengimus, prašome mums pranešti. Jei nurodomas el. pašto adresas, jis matomas viešai. Patvirtindami komentaro įrašymą, kartu patvirtinate, jog esate susipažinęs su portalo privatumo politika ir su ja sutinkate.
„Apple“ neigia Musko kaltinimus dėl šališko reitingavimo parduotuvėje „App Store“

Elonas Muskas griežtai sukritikavo „Apple“, kaltindamas ją šališkais „App Store“ reitingavimo algoritmais. Milijardierius išreiškė pasipiktinimą, kad jo bendrovių „xAI“ ir „Grok“ programėlės nepatenka į „Must Have“ skiltį.

„Google“ sukėlė internautų įsiūtį: bendrovė atnaujino „Photos“ programėlę ir pašalino vieną svarbų įrankį

JAV technologijų milžinė „Google“ neseniai atnaujino „Google Photos“ programėlę. Atnaujinimai dažnai reiškia naujas galimybes, tačiau šįsyk tuo džiaugsis tikrai ne visi. Nors naujasis dizainas atrodo švaresnis, greitesnis ir patogesnis naudoti, viena funkcija iš čia dingo.

„Nintendo“ jau pardavė beveik 6 mln. „Switch 2“ įrenginių, tokių rezultatų nesitikėjo net ir pats gamintojas

Birželio mėnesį prasidėjusi naujojo „Nintendo“ delninio žaidimų kompiuterio prekyba vyksta sparčiau nei tikėtasi. Vos per pirmąją savaitę bendrovė pardavė 3,5 mln. vienetų, o per visą birželį šis skaičius išaugo iki 5,82 mln. parduotų „Switch 2“ modelių.

2025 m. rugpjūtis
2025-08-21 13:25
Dirbtinio intelekto pokalbių robotas „Meda“ jau aptarnavo daugiau kaip 100 tūkstančių „Sodros“ klientų
2025-08-13 19:44
Muskas atsakė į GPT-5 išleidimą, atverdamas nemokamą prieigą prie „Grok 4“ visiems norintiems
2025-08-13 15:12
Vartotojų duomenų ir privatumo skandalas: „Microsoft“ atstovų žodžiai sukrėtė Prancūzijos politikus
2025-08-12 21:30
KTU išlaiko lyderiaujančias pozicijas tarp Lietuvos universitetų pagal kviečiamųjų skaičių
2025-08-11 20:43
„Windows 11“ vartotojai skundžiasi dėl neišjungiamos „OneDrive“ reklamos „Pradžios“ meniu
2025-08-08 09:13
„Honor“ pristatė nė 100 eurų nekainuosiantį kompaktišką „Honor Pad X7“ planšetinį kompiuterį
2025-08-07 18:09
„Apple“ ir Kembridžas sukūrė dirbtinio intelekto teisėją, kuris faktus geba patikrinti geriau nei žmogus
2025-08-07 07:48
„SanDisk“ pristatė pirmąjį pasaulyje 256 terabaitų talpos SSD
2025-08-06 06:11
„Microsoft“ pristato svarbius „Windows 11“ atnaujinimus, platforma pasipildė naujomis galimybėmis
2025-08-05 12:14
Dirbtinis intelektas užvaldė internetą? „ChatGPT“ jau artėja prie „Google“ ir ruošia savo naršyklę
2025-08-04 22:04
Telecentro duomenų centras DC3 tapo valstybiniu duomenų centru
2025-08-03 20:40
„Microsoft“ pripažino žaidimų našumo problemas dėl „Windows 11 24H2“ atnaujinimo
Daugiau...Paieška archyve

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

Sveiki ir ekologiški maisto produktai

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

„Mokslo sriuba“

www.matuok.lt - Interneto spartos matavimo sistema

Programuotojas Tautvydas – interneto svetainių-sistemų kūrimas

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

Draugiškas internetas


Reklama
‡ 1999–2025 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
Ets2 mods, Ats mods, Beamng drive mods
allmods.net
„MokslasPlius“ – mokslui skirtų svetainių portalas
www.mokslasplius.lt
Optical filters, UV optics, electro optical crystals
www.eksmaoptics.com
LTV.LT – lietuviškų tinklalapių vitrina
www.ltv.lt/technologijos/
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
FS22 mods, Farming simulator 22 mods,
FS22 maps

fs22.com
Reklama


Reklama