DeepSeek'in Çekirdek Teknolojisini Dürüm Parasıyla Geliştirmişler

Kaliforniya Üniversitesi araştırmacıları, Çin menşeli DeepSeek AI'ın temel teknolojisini aşırı komik bir bütçeyle geliştirdiğini açıkladı.

OpenAI, Microsoft, Google gibi şirketlerin neden yerlerinde ter dökdüktüleri belli oldu... Berkeley'deki Kaliforniya Üniversitesi araştırmacıları, şu sıralar yapay zeka dünyasında rüzgarları keskin yönden estiren DeepSeek hakkında dikkat çekici bir keşif yaptı. Araştırmalarına göre Çin menşeli DeepSeek AI'ın temel teknolojisini sadece 30 dolara yeniden oluşturulmuş.

Küçük Bir Modelle Kendini Eğitti

PhD öğrencisi Jiayi Pan liderliğindeki ekip, DeepSeek'in "pekiştirmeli öğrenme" yeteneğini küçük bir dil modeliyle taklit etti. Sadece 3 milyar parametreye sahip bu model, İngiliz yarışma programı Countdown'a dayalı bir matematik bulmacısını çözmeyi başardı.

İlk aşamada rastgele tahminler yapan model, zamanla kendi kendini düzeltme ve adım adım çözüm üretme becerisi geliştirdi. Örneğin çarpma işlemlerini parçalara ayırarak tıpkı insanların zihinden hesaplama yapması gibi sonuca ulaştı.

Pan'ın belirttiğine göre, bu sürecin toplam maliyeti 30 doları geçmedi. Karşılaştırma yaparsak; OpenAI API'si aracılığıyla 1 milyon token işlemenin maliyeti 15 dolar, DeepSeek'te ise bu 0.55 dolar. Aradaki fark inanılmaz.

Düşük Maliyet Sorgulanmaya Başladı

Ancak her şey bu kadar toz pembe değil. Bazı uzmanlar, DeepSeek'in "düşük maliyet" iddialarını sorguluyor.

Örneğin, AI araştırmacısı Nathan Lambert, DeepSeek'in 671 milyar parametreli modelini 5 milyon dolara eğittiği iddiasının gerçeği yansıtmadığını; altyapı, enerji ve personel maliyetleriyle birlikte yıllık operasyon giderlerinin 500 milyon – 1 milyar dolar arasında olabileceğini savunuyor.

Geçtiğimiz gün OpenAI, DeepSeek'in ChatGPT eğitim verilerini "çaldığını" iddia ederek Lambert ile aynı fikirde olduğunu açıkça beyan etti. Trump, AI şirketlerine daha yaratıcı olmalarını ve DeepSeek'in yükselmesini engellemek üzere adımlar atmalarını istedi. 

Ayrıca, DeepSeek'in Çin'e veri aktarması nedeniyle ABD'de yasaklanma sürecinde olduğu belirtiliyor. OpenAI ise bu modelin ChatGPT verileriyle eğitilmiş olabileceğini öne sürüyor. Öte yandan Berkeley ekibinin çalışması, dev bütçeler olmadan da ileri seviye yapay zeka geliştirilebileceğini kanıtlıyor. Yani büyük şirketlerin şüpheleri yersiz olabilir de, olmayabilir de.

DeepSeek-R1 Nedir, Nasıl Kullanılır?
Yapay Zeka

DeepSeek-R1 Nedir, Nasıl Kullanılır?

İnterneti ve yapay zeka dünyasını kasıp kavuran DeepSeek-R1 nedir, nasıl kullanılır? İşte DeepSeek ve R1 modeli hakkında bilmeniz gereken tüm bilgiler!

OpenAI Tüm Tuşlara Basıyor: DeepSeek'e AGI Kartını Kullandı
Yapay Zeka

OpenAI Tüm Tuşlara Basıyor: DeepSeek'e AGI Kartını Kullandı

OpenAI, DeepSeek karşısında tüm tuşlara basmaya başladı. Hatta CEO Sam Altman, yapay genel zeka kartını kullandı. İşte detaylar!