Kinijos bendrovė „DeepSeek“ paskelbė apie savo ankstesnio dirbtinio intelekto modelio V3 atnaujinimą. Naujoji versija jau prieinama testavimui. Pagrindinis atnaujintos versijos privalumas – padidintas konteksto lango dydis.

Pasak oficialios „DeepSeek“ grupės socialiniame tinkle „WeChat“, versija V3.1 turi išplėstą konteksto langą, todėl ji gali apdoroti didesnį informacijos kiekį vienoje užklausoje. Tai leis modeliui palaikyti ilgesnius dialogus ir ilgiau išsaugoti atmintyje ankstesnes užklausas. Jokių kitų detalių apie atnaujintą modelį bendrovė kol kas nepaskelbė.
„DeepSeek“ modelių greitis ir prieinamumas jau leido jiems mesti iššūkį tokioms JAV bendrovėms kaip „OpenAI“, bei parodyti, kad Kinijos įmonės gali pasiekti pažangos DI srityje, palyginti su nedidelėmis investicijomis.
Modelis „DeepSeek R1“, pristatytas šių metų pradžioje, pagal standartizuotus rodiklius pranoko kelis vakarietiškus konkurentus ir akimirksniu tapo itin populiarus. Dabar „DeepSeek“ gerbėjai laukia R2 pasirodymo – R1 įpėdinio, tačiau Kinijos žiniasklaida dėl vėlavimo kaltina įmonės generalinio direktoriaus Liang Wenfeng perfekcionizmą, tiekimo problemas su „Nvidia“ spartintuvais ir mažą „Huawei“ DI spartintuvų efektyvumą.