DeepSeek'in Çekirdek Teknolojisini Dürüm Parasıyla Geliştirmişler
Kaliforniya Üniversitesi araştırmacıları, Çin menşeli DeepSeek AI'ın temel teknolojisini aşırı komik bir bütçeyle geliştirdiğini açıkladı.
OpenAI, Microsoft, Google gibi şirketlerin neden yerlerinde ter dökdüktüleri belli oldu... Berkeley'deki Kaliforniya Üniversitesi araştırmacıları, şu sıralar yapay zeka dünyasında rüzgarları keskin yönden estiren DeepSeek hakkında dikkat çekici bir keşif yaptı. Araştırmalarına göre Çin menşeli DeepSeek AI'ın temel teknolojisini sadece 30 dolara yeniden oluşturulmuş.
Küçük Bir Modelle Kendini Eğitti
PhD öğrencisi Jiayi Pan liderliğindeki ekip, DeepSeek'in "pekiştirmeli öğrenme" yeteneğini küçük bir dil modeliyle taklit etti. Sadece 3 milyar parametreye sahip bu model, İngiliz yarışma programı Countdown'a dayalı bir matematik bulmacısını çözmeyi başardı.
İlk aşamada rastgele tahminler yapan model, zamanla kendi kendini düzeltme ve adım adım çözüm üretme becerisi geliştirdi. Örneğin çarpma işlemlerini parçalara ayırarak tıpkı insanların zihinden hesaplama yapması gibi sonuca ulaştı.
Pan'ın belirttiğine göre, bu sürecin toplam maliyeti 30 doları geçmedi. Karşılaştırma yaparsak; OpenAI API'si aracılığıyla 1 milyon token işlemenin maliyeti 15 dolar, DeepSeek'te ise bu 0.55 dolar. Aradaki fark inanılmaz.
Düşük Maliyet Sorgulanmaya Başladı
Ancak her şey bu kadar toz pembe değil. Bazı uzmanlar, DeepSeek'in "düşük maliyet" iddialarını sorguluyor.
Örneğin, AI araştırmacısı Nathan Lambert, DeepSeek'in 671 milyar parametreli modelini 5 milyon dolara eğittiği iddiasının gerçeği yansıtmadığını; altyapı, enerji ve personel maliyetleriyle birlikte yıllık operasyon giderlerinin 500 milyon – 1 milyar dolar arasında olabileceğini savunuyor.
Geçtiğimiz gün OpenAI, DeepSeek'in ChatGPT eğitim verilerini "çaldığını" iddia ederek Lambert ile aynı fikirde olduğunu açıkça beyan etti. Trump, AI şirketlerine daha yaratıcı olmalarını ve DeepSeek'in yükselmesini engellemek üzere adımlar atmalarını istedi.
Ayrıca, DeepSeek'in Çin'e veri aktarması nedeniyle ABD'de yasaklanma sürecinde olduğu belirtiliyor. OpenAI ise bu modelin ChatGPT verileriyle eğitilmiş olabileceğini öne sürüyor. Öte yandan Berkeley ekibinin çalışması, dev bütçeler olmadan da ileri seviye yapay zeka geliştirilebileceğini kanıtlıyor. Yani büyük şirketlerin şüpheleri yersiz olabilir de, olmayabilir de.