Bu Yeni AI Dil Modeli Hem Açık Kaynak Hem de Ücretsiz!
San Francisco merkezli Deep Cogito, açık kaynaklı LLM modelleriyle sahneye çıktı ve gösterdiği performansıyla şimdiden rekorları kırmaya başladı.

Yapay zeka dünyasında dikkatler bu defa San Francisco'dan sessizce doğan ama gürültüyle sahneye çıkan Deep Cogito'ya çevrildi.
Eski Google mühendisi Drishan Arora'nın kurduğu bu yeni açık kaynaklı girişim, Meta'nın LLaMA 3.2 modelleri üzerinde eğitilmiş ilk yapay zeka serisi Cogito v1'i piyasaya sürdü ve bu modeller şimdiden rakiplerini geride bırakmayı başardı.
Tıpkı DeepSeek'in çıktığı ilk günlerde olduğu gibi bu model için de belli başlı endişeler var. Ancak herkesin de bildiği üzere DeepSeek'in o kadar tepki almasının sebebi Çin merkezli olmasıydı. Bir dönem ABD Başkanı Donald Trump bile bu girişimi takdir etmiş, ABD'li şirketlerden DeepSeek'i örnek almalarını istemişti. Peki menşeisi buradan olan Deep Cogito nasıl çalışıyor? Özellikleri ne? İşte detaylar...
İnsan Gibi Durup Düşünüyor, Ara Veriyor
Deep Cogito'nun farkı, modellerin sadece hızlı yanıt verebilmesi değil; gerektiğinde durup düşünebilmesi, yani kendi çözümlerini içsel olarak değerlendirmesi. Bu hibrit yaklaşım, OpenAI'ın "o" serisiyle ya da DeepSeek'in R1 modelleriyle benzer şekilde çalışıyor.
Amaçları da oldukça iddialı: İnsanlardan daha zeki süper zeka sistemleri üretmek. Ama bu iddiaya rağmen şirketin geliştirdiği tüm modelleri açık kaynaklı yapmak gibi bir sözü de var.
Modellerin bu başarısında en önemli etkenlerden biri, Arora'nın "IDA" yani "iterated distillation and amplification" adını verdiği yeni eğitim yöntemi. Söz konusu yöntemde diğer yapay zeka modellerinde yapıldığı gibi insan geri bildirimiyle öğrenme yerine, modelin kendi ürettiği daha iyi çözümleri analiz edip kendine öğretmesini sağlıyor.
Arora, bu yaklaşımı Google'ın efsanevi AlphaGo'sunun kendi kendine oynayarak gelişmesine benzetiyor ama bu kez doğal dil alanında uyguluyor.
LLaMA Versiyon 3.2'yi Solladı
Modeller sadece metin anlamada değil, aynı zamanda API entegrasyonları için kritik olan araç çağırma görevlerinde de oldukça başarılı. Cogito 3B, basit ve paralel görevlerde %90'ın üzerinde doğruluk sağlarken; 8B versiyonu, aynı kulvardaki rakibi LLaMA 3.1 8B'ye ciddi fark atıyor.
Cogito'nun öne çıkan modeli 3B ise yalnızca 3 milyar parametreye sahip olmasına rağmen hem MMLU testinde hem de Hellaswag değerlendirmesinde LLaMA 3.2’yi açık ara farkla geride bırakıyor. Modelin "reasoning" yani düşünme moduna geçtiğindeyse başarı oranı daha da artıyor.
Önümüzdeki aylarda çok daha büyük modeller yolda. 109B, 400B ve devasa 671B parametreli versiyonlar ile hem araştırma hem de ticari kullanımda yeni bir seviyeye ulaşılması bekleniyor. Tüm modellere Hugging Face, Ollama, Fireworks ve Together AI platformları üzerinden ücretsiz olarak ulaşabilirsiniz.