Çinli yapay zeka girişimi DeepSeek, R1 modeliyle elde ettiği başarının ardından yeni modelini sessiz sedasız piyasaya sundu. Şirket "DeepSeek V3.1" olarak adlandırdığı, 685 milyar parametre değerine sahip yeni nesil sohbet botunu Hugging Face platformunda açık kaynak olarak yayınladı.
Venture Beat'in haberine göre, DeepSeek V3.1'in sunduğu teknik yenilikler, pek çok araştırmacı tarafından büyük bir dönüm noktası olarak değerlendiriliyor. Model 128 bin token'a kadar bağlam işleyebiliyor. Yani yaklaşık 400 sayfalık bir kitabın tamamını tek seferde analiz edebiliyor.
Ayrıca model farklı işlemcilerle uyumlu olarak çalışabilmesi için çeşitli hassasiyet formatlarını destekliyor; bunlar arasında standart BF16'dan, deneysel FP8'e kadar geniş bir yelpaze yer alıyor.
Ancak belki de DeepSeek V3.1'in en dikkat çekici özelliği, "hibrit mimari"si oldu. Şirket birden fazla yapay zeka işlevini (sohbet, mantık yürütme, kodlama) tek bir modelde sorunsuz bir şekilde birleştirdiğini belirtiyor. Bu sayede her özellik için ayrı ayrı modellerin kullanılma zorunluluğunu ortadan kaldırıyor.
DeepSeek V3.1, piyasaya sürülmesinin ardından kısa süre içinde dikkat çeken benchmark sonuçları elde etti. Aider kodlama testinde yüzde 71.6'lık bir skor elde ederek, OpenAI'ın Claude Opus 4 modelini geçmeyi başardı. Böylelikle sektördeki en yüksek performansa sahip açık kaynaklı yapay zeka modellerinden biri haline geldi.
Bununla birlikte DeepSeek V3.1'in maliyetinin 68 kat daha düşük olması, ekonomik açıdan da rekabetçi olmasını sağlıyor.