OpenAI'ın Tahtı Sallantıda: DeepSeek, o1 Modelini Solladı
OpenAI şirketinin tahtı sallantıda olabilir. DeepSeek-R1 modelinin o1 modelini birçok konuda geride bıraktığı ileri sürüldü. İşte detaylar!
Çinli yapay zeka girişimi DeepSeek, DeepSeek-R1'in açık sürümünü yayınladı. Belirli yapay zeka kıyaslamalarında OpenAI'ın o1 modeli kadar iyi performans gösterdiğini öne sürdü.
Massachusetts Teknoloji Enstitüsü (MIT) tarafından oluşturulan MIT lisansı altında sunulan DeepSeek-R1'in AIME, SWE-bench ve MATH-500 testlerinde o1'i geride bıraktığı belirtildi. SWE-bench programlama kısmına odaklanırken MATH-500 kelime problemlerine, AIME modelin performansına odaklanıyor.
DeepSeek-R1, Problem Çözmekte Oldukça İyi
R1, muhakeme ağırlıklı bir model. Kendi kendine mantık yürütüyor. Bu nedenle çözümü bulması diğer modellere göre daha çok zaman alıyor ancak matematik gibi konularda en azından diğerlerine göre daha doğru sonuç veriyor.
Yapay zeka modelleri söz konusu olduğunda parametre oldukça önemli. Örneğin DeepSeek-R1 671 milyar parametre içeriyor. Bu da daha az parametreye sahip modellerden daha iyi performans gösterdiği anlamına geliyor. Bunun diğer faktörlere bağlı olarak değişiklik göstereceğini de unutmamak gerekiyor.
DeepSeek, R1'in 1,5 milyar parametreden başlayarak değişen versiyonlarını da yayınladı. Tahmin edilebileceği üzere en büyük modeli kullanmak için güçlü bir donanıma ihtiyaç duyuluyor. Bu arada maliyet bakımından da o1 modelinin önüne geçiyor. API ile OpenAI'ın o1 modelinden çok daha ucuza elde edilebiliyor.