Alibaba destekli Moonshot AI’ın geliştirdiği Kimi K2, GPT-4.1 ve Claude Opus 4 gibi dev modellerle yarışıyor. Üstelik açık kaynak kodlu ve ücretsiz.
Çin, yapay zekâ alanında iddialı adımlar atmaya devam ediyor. Son dönemde dikkat çeken modellerin arasına bu kez Alibaba destekli Moonshot AI tarafından geliştirilen Kimi K2 katıldı. Performansı, verimliliği ve özellikle de açık kaynak kodlu oluşuyla teknoloji dünyasında şimdiden heyecan uyandırdı.
Geçtiğimiz hafta tanıtılan Kimi K2, geliştiricilere ücretsiz olarak sunuldu. İlk günlerde bazı soru işaretlerine neden olsa da, kısa sürede gelen olumlu kullanıcı yorumları ve test sonuçları bu şüpheleri büyük ölçüde sildi.
Kimi K2, performansıyla GPT-4.1 ve Claude Opus 4 gibi gelişmiş modellerle kıyaslanıyor. En büyük farkı ise tamamen ücretsiz ve açık kaynak olması. Özellikle yazılım geliştirme alanında gösterdiği başarı, birçok profesyonelin dikkatini çekmiş durumda.
Modelin en güçlü yanlarından biri de verimliliği. Batılı rakiplerine göre daha düşük donanım maliyetiyle çalışabiliyor. Giriş token'ları için yalnızca 15 cent, çıkış token'ları içinse 2.5 dolarlık bir ücretlendirme söz konusu. Bu rakam, Claude'un 75 dolarlık çıkış token ücretinin yanında oldukça cüzi kalıyor.
Kimi K2, teknik açıdan da oldukça etkileyici bir yapıya sahip. Mixture-of-Experts (MoE) mimarisiyle tasarlanan model, toplamda 1 trilyon parametre barındırıyor. Ancak her işlemde yalnızca yaklaşık 32 milyar parametre aktif hâle geliyor.
61 katmanlı model, 15.5 trilyon token'lık bir veri setiyle eğitilmiş. "MuonClip" adlı özel bir optimizasyon tekniği sayesinde dikkat mekanizmasındaki dengesizlikler en aza indirilmiş. Modelin en dikkat çekici özelliklerinden biri ise 128 bin token'lık bağlam penceresi. Bu, yaklaşık 192 sayfalık bir metni tek seferde okuyup işleyebileceği anlamına geliyor.
Kimi K2, sadece güçlü değil, aynı zamanda pratik. Kullanıcılar, "Kimi" uygulaması üzerinden modele doğrudan erişebiliyor. Geliştiriciler ise açık kaynak yapısı sayesinde modeli kendi sistemlerine entegre edebiliyor.
Modelin özellikle kod yazma konusundaki başarısı sosyal medyada sıkça övgü aldı. MagicPath'in kurucusu Pietro Schirano, bu modeli Claude 3.5 Sonnet'ten bu yana üretimde rahatça kullanabileceği ilk yapay zekâ olarak tanımlıyor.
Tabii ki Kimi K2'nin de zaman zaman halüsinasyon (uydurma bilgi üretme) sorunu yaşadığı belirtiliyor. Ancak bu, tüm büyük dil modellerinde hâlâ çözülmesi gereken ortak bir problem olarak görülüyor.