Yuklenilir...
Yuklenilir...
Çinli yapay zeka şirketi DeepSeek, V4 modelini Nisan sonunda piyasaya sürmeye hazırlanıyor. Trilyon parametreli bu Mixture-of-Experts modeli Apache 2.0 lisansı altında açık kaynak olarak paylaşılacak.
DeepSeek V4 yaklaşık 1 trilyon toplam parametreye sahip ancak her token başına yalnızca 37 milyar parametre aktifleştiriyor. Bu, çıkarım maliyetlerini V3 düzeyinde tutuyor. Engram koşullu bellek mimarisiyle desteklenen 1 milyon tokenlik bağlam penceresi, milyon token ölçeğinde Needle-in-a-Haystack testinde %97 doğruluk sağlıyor.
Görüntü yeteneklerini sonradan ekleyen modellerin aksine, V4 metin, görüntü ve video oluşturmayı ön eğitim aşamasında entegre ediyor. Bu, daha tutarlı çapraz modal akıl yürütme imkanı sağlıyor.
Reuters, 4 Nisan'da DeepSeek V4'ün Huawei Ascend 950PR çiplerinde çalışacağını doğruladı. Bu, Çin yarı iletken altyapısında çalışmak üzere tasarlanan ilk sınır AI modeli oluyor.
DeepSeek V4, OpenAI'nin GPT-5.4'ü, Anthropic'in Claude Mythos 5'i ve Google'ın Gemini modelleriyle rekabet edecek. Açık kaynak olması onu özellikle farklı kılıyor. SWE-bench'te %81 puan aldığı bildiriliyor.
En önemli haberlerin haftalık özetini e-postanıza alın.