OpenAI Yazıdan Geçti: Bütçenize Göre Ses Pazarı Kuracak

OpenAI sesli asistanları daha doğal ve etkili hale getirmek için yeni ses modellerini duyurdu. Bu modeller metinden sese veya tam tersine çeviri yapabiliyor.

Ecem Köksal -

OpenAI metinden sese (TTS) ve sesten metne (STT) çeviri yapabilen, daha akıllı ve kişiselleştirilebilir sesli yapay zekalar oluşturmak üzere kolları sıvadı. 

Bu yeni modeller, aksan farklarını daha iyi ayırt edebiliyor, hızlı konuşmaları doğru bir şekilde çevirebiliyor ve gürültülü ortamlarda bile güvenilir sonuçlar üretebiliyor. Üstelik önceki Whisper modellerine kıyasla çok daha yüksek doğruluk payına sahip. OpenAI, bu gelişmelerin büyük ölçüde takviyeli öğrenme ve geniş çaplı, yüksek kaliteli ses veri setleriyle yapılan eğitimler sayesinde mümkün olduğunun altını çizdi.

Ses Modeline Göre Fiyat Tablosu

Maliyetler milyon token başına belirleniyor. İşte fiyat tablosu:

Bu maliyetler dakika bazında hesaplandığında şu şekilde:

OpenAI Öneriyor: Realtime API Kullanın

OpenAI, ses modellerini daha da geliştirmeye devam edeceklerini ve ilerleyen dönemde kullanıcıların kendi seslerini sisteme entegre edebilmesine olanak tanıyacaklarını belirtiyor.

Yeni ses modelleri, API üzerinden tüm geliştiricilere açılmış durumda. Ayrıca Agents SDK ile entegrasyon sağlanarak, geliştiricilerin daha kolay bir şekilde sesli yapay zeka çözümleri oluşturmasına olanak tanınıyor. Gerçek zamanlı konuşma deneyimleri için ise Realtime API kullanımı öneriliyor.

Sosyal Medya

Meta'dan Instagram İçin "Ne Gerek Var" Dedirten Özellik

Mobil

Katlanabilir iPhone'un Fiyatı Sızdırıldı: Türkiye'de Ne Kadar Olacak Hesapladık

Benzer İçerikler