OpenAI Sesi Metne Dönüştüren Yapay Zekayı Kullanıma Sundu
ChatGPT'nin arkasındaki ekip olan OpenAI, sesi metne dönüştüren yapay zekasını tanıttı. İşte detaylar!
OpenAI ekibinin ChatGPT başarısının ardından firmadan arka arkaya ürünler gelmeye devam ediyor. Geçtiğimiz haftalarda Microsoft ile bir birlikteliğe giden ekip, başarılı dil modelleri GPT-3'ü para kaynağına dönüştürmek için tam kapasite çalışmalara başladı. Sesi metne dönüştüren Whisper API kullanıma sunuldu.
ChatGPT ile birlikte 2022 Eylül tarihinde tanıtılan Whisper, konuşmayı başarılı bir şekilde metne dönüştürebiliyor. Tanıtıldıktan sonra bir süre haber alamadığımız model için isteyenlerin kullanabilmesi adına bir API oluşturuldu.
Dakikası 10 Kuruş!
OpenAI ekibi tarafından geliştirilen Whisper API, buradaki linke tıklayarak kullanılabiliyor. Programa yüklediğiniz ses kaydı, kısa sürede metne dönüştürülüyor. İngilizce dışında farklı dil desteğide bulunan hizmeti kullanmanın bedeli ise dakika başına 10 kuruş ($0.006).
M4A, MP3, MP4, MPEG, MPGA, WAV ve WEBM gibi çeşitli formatları girdi olarak alabilen Whisper API, 680.000 saatlik çok dilli eğitim kütüphanesi sayesinde özellikle farklı aksanlarda dahi yüksek başarı yakalayabiliyor.
Öte yandan OpenAI ekibi, çeşitli nedenlerden kaynaklanabilecek olası yanlış anlaşılan kelimelere karşı kullanıcıların tetikte olmalarını belirtiyor.