Microsoft’un Fotoğrafları Canlandıran Vasa-1 Yapay Zekası Nedir? Nasıl Kullanılır?
Microsoft'tan saniyeler içinde fotoğrafları konuşturan yeni bir yapay zekâ aracı geliyor. İşte, VASA-1 hakkında bilmeniz gerekenler!
Microsoft’un yeni yapay zekâ aracı statik görsellerden sesli videolar üretmenize imkân tanıyor. Sadece bir fotoğraf ve kısa bir ses dosyası yükledikten sonra görseldeki kişiye ait, dudak hareketleri, mimikler ve kafa hareketlerinin canlandırıldığı yeni bir video elde etmenize imkân tanıyor.
Mevcut yapay zekâ destekli fotoğraf canlandırma uygulamalarından çok daha gelişmiş bir model olduğu söylenen VASA-1 ile ilgili detayları bu yazımızda irdeliyoruz. İşte, Microsoft’un geliştirdiği VASA-1’in özellikleri ve kullanım şekli!
Microsoft VASA-1 Nedir?
Microsoft tarafından geliştirilen uygulama, sizin yükleyeceğiniz bir adet portre fotoğraf ve ses kaydı sayesinde sanal bir karakter şeklinde yüz hareketlerinin oynatıldığı gerçekçi bir video üretiyor.
Sadece yüklediğiniz ses dosyası ile senkronize edilmiş dudak hareketlerine bağlı kalmayan yapay zekâ aracında mimikler ve kafa hareketlerine de oldukça önem veriliyor.
Videoların özgün bir formatta, canlılık esaslı üretimine odaklanılıyor. Bunun için yüklenen dosyalardaki veriler analiz edilerek yeni ölçümler oluşturuluyor.
Bu ölçümler doğrultusunda canlandırma yapıldığı için yüz dinamikleri daha önce benzer amaçla kullanılan uygulamalar ile kıyaslandığında çok daha gerçekçi bir hal alıyor.
Peki, Microsoft’un üstün yeteneklere sahip, fotoğraf canlandırma aracı nasıl kullanılıyor? Gelin, birlikte bakalım.
Microsoft VASA-1 Nasıl Kullanılır?
- Microsoft VASA-1’in kullanıcı ara yüzünde öncelikle fotoğraf yükleme ekranına yönlendiriliyorsunuz.
- Bu ekranda bulunan ‘upload’ seçeneğine basarak istediğiniz bir fotoğrafı yükleyebilirsiniz.
- Alt kısmında ise ses dosyasını yüklemeniz için gerekli alan bulunuyor. Yine ‘upload’ seçeneğine tıklayıp istediğiniz ses dosyasını yükleyebilirsiniz.
- ‘Record’ tuşuna basıp anlık kayıt almayı da tercih edebilirsiniz.
- Aynı ses dosyasını farklı görüntülerde deneyerek farklı sonuçlar elde etmeniz mümkün.
- ‘Generate’ butonuna bastığınızda ise esas keyifli kısım başlıyor. Altta çıkan metin konusuna videoda anlatılması istenen metni girmeniz yeterli oluyor.
- Yan tarafta ön izlemesi gözüken video ile ilgili ayarları bu videonun altındaki menüden yapma imkânınız car.
- Pitch, yaw, roll, x, y, z, gaze x, gaze y seçeneklerini artırıp azaltabilirsiniz.
- Bu seçimler ile videodaki karakterin baktığı yönü, vücudunun duruşunu, kafa pozisyonunu, bakış açısını değiştirebiliyorsunuz.
- Ayrıca videoyu yakınlaştırıp uzaklaştırabilirsiniz.
- Videodaki karaktere ilişkin avatar görünümüne sokma, siyah beyaz yapma, 3D model görünümü kazandırma gibi stilize etme seçenekleri de bulunuyor.
- VASA-1’in oluşturduğu videolar 512 x 512 büyüklüğünde 45 FPS’lik videolar oluyor.
Bu yapay zekâ aracıyla Mona Lisa’ya şarkı söyletmekten tutun da ünlü bir aktöre istediğiniz bir metni okutmaya kadar birçok işlem yapabilirsiniz. Tabii, bu noktada VASA-1’in çok kapsamlı güvenlik önlemleri alması gerekiyor. Aksi halde ortaya çıkacak sonuçları tahmin bile edemiyoruz.
Siz bu yapay zekâ aracını nasıl buldunuz? Güvenlik önlemleri yeterli gelmezse ne gibi sorunlar yaşanır? Tahminlerinizi yorumlara yazın!