Bir yıl önce, açık kaynaklı görüntü üreten yapay zeka modeli Stable Diffusion'ın arkasındaki Londra merkezli girişim olan Stability AI, söz konusu şarkıların metin açıklaması ve ses efektleri verilen şarkılar ve ses efektleri oluşturabilen bir model olan Dance Diffusion'ı sessizce piyasaya sürdü.
Bu, Stability AI'nin üretken sese yönelik ilk girişimiydi. Ancak Dance Diffusion'ın duyurulmasından sonraki yaklaşık bir yıl boyunca, üretken ses cephesinde her şey sessizdi. Modeli oluşturmak için finanse edilen Harmonai, geçen yıl Dance Diffusion'ı güncellemeyi bıraktı.
Şimdi, yatırımcıların 100 milyon dolardan fazla sermayeyi gelir getirici ürünlere dönüştürme baskısı altında olan Stability, sese büyük ölçüde yeniden yöneliyor.
Stability AI'nin Kapsamlı Kütüphanesi
Stability'nin gizli difüzyon isimli teknikle "yüksek kaliteli" 44,1 kHz müzik oluşturabilen ilk araç olduğunu iddia ettiği Stable Audio piyasaya sürüldü. Stable Audio'nun ürettiği şarkılar tutarlı uzunluktalar. Diğer yapay zeka modelleri uzun şarkılar üretiyor. Ancak şarkılar kısa bir sürede rastgele, uyumsuz bir gürültüye dönüşüyor. İşin sırrı ise gizli yayılma tekniği.
Stable Audio'yu destekleyen model, neredeyse tamamen gürültüden oluşan bir başlangıç şarkısından gürültüyü kademeli olarak nasıl çıkaracağını öğreniyor ve onu yavaş adımlarla metin açıklamasına yaklaştırıyor. Ayrıca Stable Audio'nun geçen bir arabanın veya davul solosunun sesini taklit edebiliyor.
Stability AI, Stable Audio'yu eğitmek için ticari müzik kütüphanesi AudioSparx ile ortaklık kurdu; bu kitaplık, büyük oranda bağımsız sanatçılardan oluşan kataloğundan toplam 800.000 civarında şarkıdan oluşan bir koleksiyon sağladı.
Stabil Sesin Pro katmanı için ayda 11,99 ABD doları ödeyen Stability AI müşterileri, ayda 90 saniyeye kadar uzunlukta 500 ticarileştirilebilir parça oluşturabilir. Ücretsiz kullanım kullanıcıları, ayda 20 saniye uzunluğunda, ticarileştirilemeyen 20 parçayla sınırlıdır.
Stable Audio'dan AI'de oluşturulan müziği uygulamalarda, yazılımlarda veya aylık 100.000'den fazla aktif kullanıcıya sahip web sitelerinde kullanmak isteyen kullanıcıların bir kurumsal plana kaydolmaları gerekiyor.
Sizce Stability Audio başarılı olacak mı? Sizin bu konudaki düşünceleriz neler, yorumlar kısmından paylaşabilirsiniz.
YORUMLAR