Elektronika.lt
 2025 m. lapkričio 22 d. Projektas | Reklama | Žinokite | Klausimai | Prisidėkite | Atsiliepimai | Kontaktai
Paieška portale
EN Facebook RSS

 Kas naujo  Katalogas  Parduotuvės  Forumas  Tinklaraščiai
 Pirmas puslapisSąrašas
 NaujienosSąrašas
 - Elektronika, technika
 - Kompiuterija
 - Telekomunikacijos
 - Verslo naujienos
 - Įvykiai, renginiai
 - Švietimas, studijos
 - Mokslo naujienos
 - Portalo naujienos
 StraipsniaiSąrašas
 Vaizdo siužetaiSąrašas
 Nuolaidos, akcijosSąrašas
 Produktų apžvalgosSąrašas
 Naudingi patarimaiSąrašas
 Vykdomi projektaiSąrašas
 Schemų archyvasSąrašas
 Teorija, žinynaiSąrašas
 Nuorodų katalogai
 Įvairūs siuntiniai
 Bendravimas
 Skelbimai ir pasiūlymai
 Elektronikos remontas
 Robotų kūrėjų klubas
 RTN žurnalo archyvas






 Verta paskaityti
Lapkričio 22 d. 18:28
„Huawei“ paskelbė apie „HarmonyOS 6“ platformos versiją, dirbtinis intelektas įgaus dar daugiau galių
Lapkričio 22 d. 08:40
Kibernetinio saugumo specialistų stygius – per didelė kaina valstybei
Lapkričio 21 d. 20:39
Kibernetinis nuodas, kurio daugelis nepastebi: atskleidė, kaip DI tampa pavojingu melų įrankiu
Lapkričio 21 d. 15:25
Komentatorių pinklės: ar verslas turi priemonių kovai?
Lapkričio 21 d. 13:27
ESO investicijos į modernų elektros tinklą Alytaus regione: šiemet nutiesta jau daugiau kaip 70 kilometrų kabelinių linijų
Lapkričio 21 d. 09:52
Autonominių sunkvežimių potencialas kelia intrigą: kada kelius patikėsime robotams?
Lapkričio 20 d. 19:33
Žmonija mėgina įžiebti savo Saulę: pradedamas montuoti pavojingiausias reaktorius pasaulyje
Lapkričio 20 d. 17:45
Pristatytas sprendimas, leidžiantis saugiau naudoti skirtingus DI įrankius
Lapkričio 20 d. 15:23
Naujos kartos „Gemini 3“ – didžiausias „Google“ dirbtinio intelekto šuolis iki šiol
Lapkričio 20 d. 13:16
Ką sukčiai daro su nutekintais duomenimis ir ką daryti, jei jus apgavo?
FS25 Tractors
Farming Simulator 25 Mods, FS25 Maps, FS25 Trucks
ETS2 Mods
ETS2 Trucks, ETS2 Bus, Euro Truck Simulator 2 Mods
FS22 Tractors
Farming Simulator 22 Mods, FS22 Maps, FS25 Mods
VAT calculator
VAT number check, What is VAT, How much is VAT
Dantų protezavimas
All on 4 implantai,
Endodontija mikroskopu,
Dantų implantacija
FS25 Mods
FS25 Maps, FS25 Cheats, FS25 Install Mods
FS25 Mods
Farming Simulator 25 Mods,
FS25 Maps
ATS Trailers
American Truck Simulator Mods, ATS Trucks, ATS Maps
Reklama
 Naujienos » Kompiuterija Ankstesnė naujiena | Sekanti naujiena | Dalintis | Spausdinti

„Apple“ ir Kembridžas sukūrė dirbtinio intelekto teisėją, kuris faktus geba patikrinti geriau nei žmogus

Publikuota: 2025-08-07 18:09
Tematika: Kompiuterija
Autorius: Danielius Mažeikis
Aut. teisės: ©Bilis.lt
Inf. šaltinis: Bilis.lt

Dirbtinio intelekto tyrėjai vis dažniau naudoja didelius kalbos modelius tam, kad įvertintų kitų dirbtinio intelekto sistemų atsakymų kokybę. Šis procesas vadinamas „LLM kaip teisėjas“. Tačiau paaiškėjo, kad tokie vertinimai dažnai tampa netikslūs, kai reikia įvertinti sudėtingas užduotis, ilgos apimties tekstų tikslumą, pažangų programavimą ar matematines užduotis.

„Apple“ ir Kembridžas sukūrė dirbtinio intelekto teisėją, kuris faktus geba patikrinti geriau nei žmogus

Norėdami tai išspręsti, Kembridžo universiteto ir „Apple“ tyrėjai sukūrė naują sistemą, kuri pagerina AI teisėjų sprendimų kokybę pasitelkdama papildomus patikros įrankius. Ši sistema padeda įveikti tiek žmonių, tiek AI ribotumus. Žmonės dažnai daro klaidas dėl nuovargio, laiko trūkumo ar pasikliauja rašymo stiliumi, o ne faktų tikslumu. Tuo tarpu AI modeliai sunkiai susidoroja su kompleksinėmis užduotimis be papildomos pagalbos.

Sukurtas vertinimo agentas veikia kaip savarankiškas sprendimų priėmėjas. Jis įvertina, ar konkrečiam atsakymui reikia naudoti papildomus įrankius, ir pasirenka tinkamiausią. Kiekvienas vertinimas vyksta trimis etapais, pradinė srities analizė, įrankių naudojimas ir galutinis sprendimas.

Tikrinant faktus, sistema naudoja interneto paiešką, kad patvirtintų ar paneigtų pavienes teiginių dalis. Kodo tikrinimui naudojamas „OpenAI“ kodo vykdymo modulis, leidžiantis realiai patikrinti, ar pateiktas kodas veikia. Matematinėms užduotims taikomas specializuotas matematinis tikrintuvas, skirtas aritmetinių skaičiavimų ir formulių tikslumui vertinti.

Jei agentas nustato, kad jokie įrankiai nepravers, jis grįžta prie įprasto AI vertintojo. Taip išvengiama bereikalingo skaičiavimo ir sumažinamos klaidos atliekant paprastas užduotis.

Pasiekti rezultatai ir poveikis vertinimo tikslumui

Sistema ypač pasiteisino tikrinant ilgos apimties faktinius atsakymus, ji parodė žymiai didesnį atitikimą su tikrais duomenimis nei baziniai vertinimo metodai. Programavimo užduotyse rezultatai taip pat pagerėjo visose palyginamosiose sistemose. Matematikos srityje rezultatai buvo mišrūs, kai kur pasiekti geresni rezultatai, tačiau bendra atitiktis siekė apie 56 procentus.

Ypač įdomu tai, kad ilguose tekstiniuose atsakymuose AI vertintojo sprendimai dažnai sutapo su tiesa dažniau nei žmonių vertinimai. Tai rodo, kad naujasis metodas ne tik konkurencingas, bet kai kuriais atvejais ir pranašesnis už žmogaus gebėjimą objektyviai įvertinti atsakymą.

Ateities galimybės ir plėtra

Ši sistema sukurta taip, kad ateityje būtų galima ją dar labiau tobulinti integruojant naujus įrankius. Tyrėjai planuoja atverti šaltinio kodą ir paviešinti jį „Apple“ „GitHub“ platformoje. Tai leis ir kitiems kūrėjams prisidėti prie sprendimų tobulinimo bei kurti dar tikslesnes dirbtinio intelekto vertinimo sistemas.

Nors AI dar netobulas, šis žingsnis rodo, kad technologijos gali ne tik kurti turinį, bet ir vis geriau vertinti, ką pačios sukūrė. Toks požiūris gali pakeisti tiek mokymosi, tiek testavimo, tiek dirbtinio intelekto plėtros būdus visame pasaulyje.


Draudžiama platinti, skelbti, kopijuoti informaciją su
nurodyta autoriaus teisių žyma be redakcijos sutikimo.

 Rodyti komentarus (0)
Vardas:    El. paštas:   (nebūtinas)
Pakartokite kodą: 
  Apsaugos kodas: 
 
Komentarus rašo lankytojai. Komentarai nėra redaguojami ar patikrinami, jų turinys neatspindi redakcijos nuomonės. Redakcija pasilieka teisę pašalinti pasisakymus, kurie pažeidžia įstatymus, reklamuoja, yra nekultūringi arba nesusiję su tema. Pastebėjus nusižengimus, prašome mums pranešti. Jei nurodomas el. pašto adresas, jis matomas viešai. Patvirtindami komentaro įrašymą, kartu patvirtinate, jog esate susipažinęs su portalo privatumo politika ir su ja sutinkate.
„Fujitsu“ pristatė lengviausią nešiojamą kompiuterį pasaulyje, naujasis „FMV UX-K3“ sveria tik 634 gramus

„Fujitsu“ gamintojas iškėlė „ultraportabilumo“ sąvoką į visiškai naują lygį. Kompanijos atstovai paskelbė apie naująjį „Fujitsu FMV UX-K3“ nešiojamą kompiuterį, kuris nustebins savo lengvumu.

Norėjo atsisakyti „Windows“ naudojimo ir pakliuvo į spąstus, kaip „Xubuntu“ vartotojai tapo viruso platintojais (2)

Kai „Microsoft“ paskelbė apie „Windows 10“ pabaigą, milijonai vartotojų liko ieškoti alternatyvos. Dalis jų negalėjo pereiti prie „Windows 11“ dėl techninių apribojimų, todėl natūraliai atsigręžė į „Linux“. Ši kryptis atrodė saugi ir patikima, kol neseniai įvykęs incidentas sukrėtė šią iliuziją.

„Google“ smūgis milijonams žmonių: privatumo pažadai baigėsi, sekimo era sugrįžta su visiškai nauja jėga

„Google Chrome“ vėl atsidūrė dėmesio centre po to, kai bendrovė paskelbė, jog nutraukia ilgai kurtą „Privacy Sandbox“ projektą. Šis sprendimas reiškia, kad didžiausia pasaulio naršyklė nebevykdys savo plano pakeisti slapukus nauja sistema, kuri turėjo geriau saugoti vartotojų duomenis.

2025 m. lapkritis
2025-11-19 13:59
„qwerty123“ užleidžia nugalėtojo poziciją: populiariausias slaptažodis Lietuvoje 2025 metais – „admin“
2025-11-19 09:27
Dirbtinis intelektas perėmė tekstų rašymą: dabar už mus kalba algoritmai ir jie neskamba žmogiškai
2025-11-18 18:17
„Facebook“ vėl peržengė ribas? Nauja funkcija leidžia matyti jūsų privačias nuotraukas prieš jums jas paskelbiant
2025-11-16 16:50
„Backblaze“ įvardija patikimiausius ir dažniausiai gendančius kietuosius diskus
2025-11-16 15:22
„Red Magic“ pristatė žaidimams skirtą kompiuterį su „MagicCool 2.0“, „Intel Ultra 9“ ir „RTX 5090“ grafika
2025-11-16 09:20
„Google“ pristato svarbius „Android“ saugumo atnaujinimus, naujos priemonės kovai su sukčiais
2025-11-15 19:33
„Battlefield 6“ sulaukė neįtikėtino žaidėjų dėmesio: parduota milijonai kopijų, užfiksuotas EA rekordas
2025-11-15 16:27
GPT-5.1 dirbtinio intelekto modelis tapo išmanesnis ir malonesnis
2025-11-15 12:24
Tūkstančiai kadrų per sekundę: „Android 16“ platformos galerija taps greitesnė nei bet kada anksčiau
2025-11-14 15:29
„Spotify“ meta iššūkį dirbtiniam intelektui: technologijos turi tarnauti kūrėjui, o ne jį pakeisti
2025-11-14 13:08
E. sveikatos sistemos veikimas išlieka neoptimalus (2)
2025-11-13 15:48
Nauja „Google“ funkcija gali išgelbėti jūsų paskyrą, bet norint pasinaudoti būtina reaguoti per 15 minučių
Daugiau...Paieška archyve

Global electronic components distributor – Allicdata Electronics

Electronic component supply – „Eurodis Electronics“

LOKMITA – įvairi matavimo, testavimo, analizės ir litavimo produkcija

Full feature custom PCB prototype service

Sveiki ir ekologiški maisto produktai

Mokslo festivalis „Erdvėlaivis Žemė

LTV.LT - lietuviškų tinklalapių vitrina

„Konstanta 42“

„Mokslo sriuba“

www.matuok.lt - Interneto spartos matavimo sistema

Programuotojas Tautvydas – interneto svetainių-sistemų kūrimas

PriedaiMobiliems.lt – telefonų priedai ir aksesuarai

Draugiškas internetas


Reklama
‡ 1999–2025 © Elektronika.lt | Autoriaus teisės | Privatumo politika | Atsakomybės ribojimas | Reklama | Turinys | Kontaktai LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!
Ets2 mods, Ats mods, Beamng drive mods
allmods.net
„MokslasPlius“ – mokslui skirtų svetainių portalas
www.mokslasplius.lt
Optical filters, UV optics, electro optical crystals
www.eksmaoptics.com
LTV.LT – lietuviškų tinklalapių vitrina
www.ltv.lt/technologijos/
Elektroninių parduotuvių optimizavimas „Google“ paieškos sistemai
www.seospiders.lt
Mokslo festivalis „Erdvėlaivis žemė“
www.mokslofestivalis.eu
Reklama


Reklama