Elektronika.lt
 2026 m. kovo 19 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 - Elektronika, technika
 - Kompiuterija
 - Telekomunikacijos
 - Verslo naujienos
 - Įvykiai, renginiai
 - Švietimas, studijos
 - Mokslo naujienos
 - Portalo naujienos
 StraipsniaiSąrašas
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Kovo 18 d. 18:36
Naujasis „BMW i3“: iki 900 km viena įkrova ir naujos kartos technologijos
Kovo 18 d. 15:23
Kada verta rinktis elektrinį, o kada – akumuliatorinį šlifuoklį?
Kovo 18 d. 12:58
Ar „OpenClaw“ neatpažįstamai pakeis verslo kasdienybę?
Kovo 18 d. 09:25
Darbuotojai tikrina darbo paštą savo telefone? Įspėja apie kibernetinio saugumo rizikas
Kovo 17 d. 18:24
Ar mažieji branduoliniai reaktoriai – Lietuvos energetinės nepriklausomybės raktas? (1)
Kovo 17 d. 15:59
Naujose „iOS“ ir „macOS“ operacinėse sistemose nuotraukų informacija siunčiama „Apple“
Kovo 17 d. 12:57
Mitais apipinti elektromobiliai: kodėl nerekomenduojama tempti ir kaip krauti lyjant?
Kovo 17 d. 09:15
Penkios klaidos, kurios verslui brangiai kainuoja renkantis elektros tiekimą
Kovo 16 d. 20:54
Lietuva ir Latvija pradeda kvantinės komunikacijos infrastruktūros projektą „Lat-LitQN“
Kovo 16 d. 18:42
„Lexus“ pristato visiškai naują ES: Lietuvoje pirmiausia pasirodys elektrinės versijos
FS25 Tractors
Farming Simulator 25 Mods, FS25 Maps, FS25 Trucks
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS25 Mods
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
FS25 Mods
FS25 Maps, FS25 Cheats, FS25 Install Mods
FS25 Mods
Farming Simulator 25 Mods,
FS25 Maps
ATS Trailers
American Truck Simulator Mods, ATS Trucks, ATS Maps
RDR2 Mods
Euro Truck Simulator 2 Mods, WOT Mods, Assetto Corsa Rally Mods
Reklama
 Naujienos » Kompiuterija Ankstesnė naujiena | Sekanti naujiena | Dalintis | Spausdinti

Naujasis „OpenAI CriticGPT“ modelis apmokytas „kritikuoti“ GPT-4 rezultatus

Publikuota: 2024-07-04 06:22
Tematika: Kompiuterija
Aut. teisės: ©MoksloTaskas.lt
Inf. šaltinis: MoksloTaskas.lt

„OpenAI“ pristatė naują dirbtinio intelekto modelį „CriticGPT“, skirtą klaidoms aptikti tiesiogiai „ChatGPT“ sukurtame kode. „CriticGPT“ bus naudojamas kaip algoritminis pagalbininkas testuotojams, kurie tikrina „ChatGPT“ sukurtą programos kodą.

Naujasis „OpenAI CriticGPT“ modelis apmokytas „kritikuoti” GPT-4 rezultatus
Asociatyvi „Pixabay“ nuotr.

Naujame tyrime „LLM Critics Help Catch LLM Bugs“, kurį paskelbė „OpenAI“, teigiama, kad naujasis „CriticGPT“ modelis sukurtas kaip AI asistentas ekspertams testuotojams, tikrinantiems „ChatGPT“ sukurtą programinės įrangos kodą.

„CriticGPT“, paremtas GPT-4 šeimos didelių kalbos modeliu, analizuoja kodą ir atkreipia dėmesį į galimas klaidas, todėl ekspertams lengviau pastebėti klaidas, kurios kitu atveju dėl žmogiškųjų klaidų gali likti nepastebėtos. Tyrėjai išmokė „CriticGPT“ dirbti su duomenų rinkiniu, kuriame buvo tyčia įvestų klaidų, ir atpažinti, bei pažymėti įvairias klaidas.

Mokslininkai nustatė, kad 63 proc. atvejų, susijusių su natūraliai atsiradusiomis LLM klaidomis, anotatoriai pirmenybę teikė „CriticGPT“ kritikai, o ne žmogaus.

Kuriant automatinį „kritiką“ reikėjo apmokyti modelį pagal didelį kiekį įvesties duomenų su sąmoningai įvestomis klaidomis. Ekspertų buvo paprašyta modifikuoti „ChatGPT“ parašytą kodą įvedant klaidų ir tada pateikti rezultatą su tariamai aptiktomis klaidomis. Šis procesas leido modeliui išmokti nustatyti ir kritikuoti įvairių tipų klaidas kode.

Eksperimentų metu „CriticGPT“ pademonstravo gebėjimą „ChatGPT“ atsakymų rezultatuose aptikti ir įvestas klaidas, ir natūraliai atsiradusias klaidas.

Tyrėjai taip pat sukūrė naują „Force Sampling Beam Search“ (FSBS) metodą, kuris padeda „CriticGPT“ rašyti išsamesnes kodo apžvalgas ir leidžia reguliuoti problemų paieškos išsamumą, kartu kontroliuojant klaidingai teigiamų rezultatų dažnumą.

Įdomu tai, kad „CriticGPT“ galimybės neapsiriboja paprastomis kodo peržiūromis. Eksperimentų metu modelis buvo taikomas daugeliui „ChatGPT“ mokymo duomenų, kuriuos žmonės anksčiau įvertino kaip nepriekaištingus.

Stebina tai, kad „CriticGPT“ 24 % atvejų nustatė klaidas, kurias vėliau patvirtino ekspertai. „OpenAI“ mano, kad tai rodo modelio galimybes ne tik atlikti technines užduotis, bet ir pabrėžia jo gebėjimą pastebėti subtilias klaidas, kurių gali nepastebėti net kruopštus žmogaus patikrinimas.

Nepaisant daug žadančių rezultatų, „CriticGPT“, kaip ir visi dirbtinio intelekto modeliai, turi trūkumų. Modelis buvo apmokytas naudojant palyginti trumpus „CriticGPT“ atsakymus, todėl jis gali būti nevisiškai paruoštas vertinti ilgesnes ir sudėtingesnes užduotis, su kuriomis ateityje gali susidurti dirbtinio intelekto sistemos.

Tyrėjų komanda pripažįsta, kad modelis efektyviausiai aptinka klaidas, kurias galima nustatyti vienoje konkrečioje siauroje kodo vietoje. Tačiau tikrosios dirbtinio intelekto produkcijos klaidos dažnai gali būti išsibarsčiusios keliose atsakymo dalyse. Be to, nors „CriticGPT“ sumažina konfabuliacijų skaičių, jis jų visiškai nepašalina, ir žmogaus ekspertai vis dar gali daryti klaidų, remdamiesi šiomis klaidomis.


Draudžiama platinti, skelbti, kopijuoti informaciją su
nurodyta autoriaus teisių žyma be redakcijos sutikimo.

 Rodyti komentarus (0)
Vardas:    El. paštas:   (nebūtinas)
Pakartokite kodą: 
  Apsaugos kodas: 
 
Komentarus rašo lankytojai. Komentarai nėra redaguojami ar patikrinami, jų turinys neatspindi redakcijos nuomonės. Redakcija pasilieka teisę pašalinti pasisakymus, kurie pažeidžia įstatymus, reklamuoja, yra nekultūringi arba nesusiję su tema. Pastebėjus nusižengimus, prašome mums pranešti. Jei nurodomas el. pašto adresas, jis matomas viešai. Patvirtindami komentaro įrašymą, kartu patvirtinate, jog esate susipažinęs su portalo privatumo politika ir su ja sutinkate.
Entuziastas pusę metų testavo DVD-RW diskų perrašymą — patikimiausi pasirodė jau nebegaminami

Technologijų entuziastas dr. Gough Lui pasidalijo savo išvadomis apie perrašomų DVD diskų ilgaamžiškumą, prie kurių priėjo po šešių mėnesių skirtingų gamintojų produkcijos testavimo.

DI turėjo palengvinti žmonių darbą, tačiau iš tikrųjų tik padidino krūvį

Tezė, kad generatyvinio dirbtinio intelekto plitimas išlaisvins įmonių darbuotojų laiką kitam darbui ar kitoms veikloms, kol kas nepasitvirtina statistikos duomenimis. Jie rodo, kad DI diegimas įmonėse lemia didesnį žmonių darbo krūvį ir didesnį darbo intensyvumą.

„Google“ pasiūlė už 3 dolerius prikelti senus kompiuterius, nesuderinamus su „Windows“

Praėjusiais metais „Microsoft“ nutraukė oficialų „Windows 10“ palaikymą, dėl ko daugybė kompiuterių, nesuderinamų su „Windows 11“, tapo nebepageidaujami. Panašu, kad šis „Microsoft“ žingsnis sužaidė „Google“ naudai – tai gali gerokai padidinti „ChromeOS“ naudotojų bazę.

2026 m. kovas
2026-03-16 10:21
Sukčiai vis įžūlesni: masiškai imituoja realių verslo įmonių platformas internete
2026-03-11 12:48
„OpenAI“ atidėjo „suaugusiųjų režimo“ paleidimą „ChatGPT“ – reikia išspręsti amžiaus nustatymo problemą
2026-03-10 17:16
Naujojo „MacBook Neo“ našumas pasirodė esantis „MacBook Air M1“ lygio
2026-03-10 13:21
Populiarus Kinijos nebrangių kompiuterių gamintojas apkaltintas slaptu procesorių pakeitimu nešiojamuosiuose kompiuteriuose
2026-03-09 07:23
Apklausa: kas trečias darbe nuolat naudoja dirbtinį intelektą
2026-03-08 11:52
„Google“ susitaikė su „Epic Games“: trys dideli pokyčiai po teismo
2026-03-08 07:47
Įsigaliojo naujos ES taisyklės dėl skaitmeninių duomenų mainų geležinkelių sektoriuje
2026-03-07 19:29
Atnaujinti „MacBook Pro“ 14 ir 16 – „Liquid Retina XDR“ ekranai, daugiau atminties ir iki 30 % didesnis našumas
2026-03-06 12:47
Atsiskaitymo įpročių lūžis: 20 tūkstančių skaitmeninių kortelių per du mėnesius
2026-03-04 19:20
„iPad Air“ (8-os kartos) 11 ir 13 su M4 – ne visai naujiena, bet su Wi-Fi 7 ir Bluetooth 6
2026 m. vasaris
2026-02-28 19:52
Nauja „Nvidia“ tvarkyklė sugadino „RTX 5000“ ventiliatorius — versija buvo prieinama vos kelias valandas
2026-02-27 19:12
„Perplexity“ pristatė „skaitmeninį darbuotoją“ sudėtingoms užduotims spręsti
Daugiau...Paieška archyve

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

Technologijos.lt

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

„Mokslo sriuba“

www.matuok.lt - Interneto spartos matavimo sistema

Programuotojas Tautvydas – interneto svetainių-sistemų kūrimas

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

Draugiškas internetas


Reklama
‡ 1999–2026 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
ScriptHookV, GTA 5 Mods, GTA 5 Map Mods
gta5mod.net
„MokslasPlius“ – mokslui skirtų svetainių portalas
www.mokslasplius.lt
Būk saugus
elektroninėje erdvėje

www.esaugumas.lt
LTV.LT – lietuviškų tinklalapių vitrina
www.ltv.lt/technologijos/
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
Mokslo festivalis „Erdvėlaivis žemė“
www.mokslofestivalis.eu
Reklama


Reklama