OpenAI’nin Yeni Nesil o3 Modeli 2025’te Geliyor: Düşük Maliyet, Yüksek Performans
OpenAI, önümüzdeki yıl piyasaya süreceği yeni nesil o3 modelinin detaylarını duyurdu.
OpenAI CEO’su Sam Altman, yakın zamanda YouTube üzerinden yaptığı canlı yayında gelecek sene piyasaya sürülecek olan yeni nesil o3 yapay zeka modelinin detaylarından bahsetti:
O2 cep telefonu ağını yöneten Telefónica’ya saygımızdan ve OpenAI’nin isimlendirme konusundaki kötülüğünü kanıtlayan geleneğinden dolayı, bu modele o3 adını verdik.
Yeni model henüz kamu kullanımına sunulmuyor. Bunun yerine OpenAI öncelikle bu teknolojiyi test etmek isteyen güvenlik araştırmacılarına açıyor.
Ayrıca, o3-mini adında bir modelin varlığı da duyuruldu. Altman, o3-mini’nin 2025 Ocak ayı sonunda, tam o3 modelinin ise kısa bir süre sonra kullanıcılara sunulacağını belirtti.
o3 Modeli Diğer Modellerden Çok Daha Güçlü
o3 modeli, performans anlamında önceki modelleri geride bırakıyor. Örnekle taçlandıracak olursak bu yıl düzenlenen Amerikan Matematik Yarışması’nda %96,7 doğruluk oranı yakaladı. Bir önceki model olan o1 ise bu testte %83,3ülük bir başarı göstermişti.
OpenAI Araştırma Başkanı Mark Chen, bu sonuçla ilgili olarak, “o3 genellikle sadece bir soruyu kaçırıyor,” dedi.
Daha zorlayıcı testlerle performansını ölçmek isteyen OpenAI, ARC-AGI testi gibi benchmark’lar kullandı. Bu test, bir yapay zekanın yeni bilgileri kavrayıp anında öğrenme becerisini ölçüyordu ve ARC Prize Vakfı'nın söylediğine göre bu testi geçebilen herhangi bir AI sistemi, yapay genel zekaya (AGI) ulaşmış olarak nitelendiriliyor.
o3 modeli, ARC-AGI’de %87,5 başarı oranı yakalayarak insanların ortalama performansı olan %85 eşik değerini de geride bırakmayı başardı.
Daha Düşük Maliyet, Yüksek Performanslı o3-Mini
OpenAI’nin yeni duyurduğu Adaptive Thinking Time API sistemini kullanan bir model de o3-mini; kullanıcılarına düşünme süresini ayarlama imkanı sunuyor ve düşük hesaplama maliyetleriyle o1 modeline yakın performans sağlayabiliyor.
OpenAI, bu yeni API ile yapay zekanın karmaşık sorunlar üzerinde daha uzun düşünmesini ve daha kesin yanıtlar vermesini sağlayacak bir sistemle karşımıza çıkıyor.