Tvrtka nije dala službenu najavu, ali nadogradnja DeepSeek R1 objavljena je na repozitoriju AI modela Hugging Face.
DeepSeek je ove godine postao poznat nakon što je njegov besplatni, otvoreni model zaključivanja R1 nadmašio ponude konkurenata, uključujući Metu i OpenAI. Niska cijena i kratko vrijeme razvoja šokirali su globalna tržišta, izazivajući zabrinutost da američki tehnološki divovi previše troše na infrastrukturu i brišu milijarde dolara vrijednosti glavnih američkih tehnoloških dionica poput Nvidie, AI snažne tvrtke. Te su se tvrtke od tada uglavnom oporavile.
Baš kao što je bio slučaj s debijem DeepSeek R1, nadograđeni model također je objavljen uz malo pompe. To je model zaključivanja, što znači da AI može izvršavati složenije zadatke kroz postupni logički proces razmišljanja.
Nadograđeni model DeepSeek R1 nalazi se odmah iza OpenAI-jevih o4-mini i o3 modela zaključivanja na LiveCodeBenchu, stranici koja uspoređuje modele s različitim metrikama.
DeepSeek je postao primjer kako se kineska umjetna inteligencija još uvijek razvija unatoč pokušajima SAD-a da ograniči pristup zemlje čipovima i drugoj tehnologiji. Ovog mjeseca, kineski tehnološki divovi Baidu i Tencent otkrili su kako su svoje AI modele učinili učinkovitijima kako bi se nosili s američkim ograničenjima izvoza poluvodiča.
Izvršni direktor Nvidije Huang o kontroli izvoza: Kinesko tržište dom je 50% svjetskih istraživača umjetne inteligencije
Jensen Huang, izvršni direktor Nvidije, koja dizajnira grafičke procesorske jedinice potrebne za obuku ogromnih AI modela, u srijedu je oštro kritizirao američke kontrole izvoza.
„SAD je svoju politiku temeljio na pretpostavci da Kina ne može proizvoditi AI čipove“, rekao je Huang. „Ta je pretpostavka oduvijek bila upitna, a sada je očito pogrešna.“
„Pitanje nije hoće li Kina imati umjetnu inteligenciju“, dodao je Huang. „Već je ima.“