Yuklenilir...
Yuklenilir...
Çinli süni intellekt şirkəti DeepSeek aprelin sonlarında V4 modelini buraxmağa hazırlaşır. 1 trilyon parametrli bu Mixture-of-Experts modeli açıq mənbə kimi Apache 2.0 lisenziyası altında paylaşılacaq.
DeepSeek V4 təqribən 1 trilyon ümumi parametrə malikdir, lakin hər token üçün yalnız 37 milyard parametr aktivləşir. Bu, inferens xərclərini V3 səviyyəsində saxlayır. 1 milyon tokenlik kontekst pəncərəsi Engram şərti yaddaş arxitekturası ilə təmin edilir və Needle-in-a-Haystack testində 97% dəqiqlik göstərir.
V3-dən fərqli olaraq, V4 mətn, şəkil və video yaratmanı əvvəlcədən təlim mərhələsində inteqrasiya edir. Bu, daha əlaqəli cross-modal düşünmə imkanı verir.
Reuters 4 apreldə təsdiq edib ki, DeepSeek V4 Huawei Ascend 950PR çiplərində işləyəcək. Bu, Çin yarımkeçirici infrastrukturunda qurulmuş ilk sərhəd AI modelidir.
DeepSeek V4 OpenAI-nin GPT-5.4, Anthropic-in Claude Mythos 5 və Google-un Gemini modelləri ilə rəqabət edəcək. Açıq mənbə olması onu xüsusilə fərqləndirən amildir. SWE-bench-də 81% nəticə göstərdiyi bildirilir.
Ən vacib xəbərlərin qısa xülasəsini hər həftə e-poçtunuza alın.