Bu yeni büyük dil modeli (LLM), henüz geliştirme aşamasında olmasına rağmen, girilen cümlelerden 10 saniyelik videolar oluşturmak için birçok benzer sistemden daha iyi performans sergiliyor.
Aşağıdaki videoda görülen altyapı şu an mükemmel değil, ancak gelecekte büyük bir potansiyel taşıyor. VideoPoet, sadece metin değil, girilen fotoğraf veya görsellere komutlarla hareket kazandırabilme özelliğiyle öne çıkıyor.
Bu yeni yapay zeka modeli, OpenAI'in DALL-E gibi genel kullanıma açık seçeneklerden biri olmasa da, Google'ın araştırmacılarına göre ilerleyen dönemde metinden sese ve sesten videoya kadar birçok alanda görev yapacak.
Google, öne sürülen bilgilere göre Pixel serisi akıllı telefon modelleri için geliştirdiği "Pixie" adlı yapay zeka temelli asistanıyla dikkat çekiyor. Verimli yapay zeka tabanlı bu asistan, özellikle kısa bir süre önce tanıtılan Gemini temelinde şekillendirilmiş ve iddiaya göre önümüzdeki yılın Pixel 9 ve Pixel 9 Pro modellerinde yer alacak.
Bu gelişmiş özelliklere sahip yapay zeka asistanı, sesli iletişim yetenekleri sunarak, mevcut göstergelerin işaret ettiği kadarıyla yüksek bilgi alma ve verme performansı sergileyecek.
İlk etapta sadece Pixel telefonlara özgü olacak Pixie'nin, zaman içinde tüm Android telefonlara getirilmesi planlanıyor. Ancak ne yazık ki, Google, hala Pixel serisi akıllı telefonlarını Türkiye'de resmi olarak satışa sunmamayı tercih ediyor.
Gemini Pro ve Nano: Yapay Zeka Harikası!
Dün yapılan Google Cloud basın açıklamasında, yeni dil modeli Gemini ile ilgili önemli detaylara şu şekilde yer verilmişti:
Bu yeni model, Ultra, Pro ve Nano olmak üzere üç farklı seçenek sunuyor. Gemini Pro, benzer modellere göre daha üstün performans sunan bir araştırma kriterine dayanarak Perşembe günü kullanıma açıldı. Pixel 8 Pro'dan başlayarak Android'de ve özel olarak ayarlanmış Bard'da bulunan Gemini Nano da kullanıcılara sunuldu.
Gemini Pro'nun mevcut sürümü, işlev çağırma, yerleştirme, anlamsal erişim ve özel bilgi temeli gibi özellikleri içeriyor. Model, dünya genelinde 180'den fazla ülke ve bölgede kullanılabiliyor ve 38 dili destekliyor.
Rekabetçi bir fiyatlandırmaya sahip olan Gemini, 32 binlik bir bağlam penceresiyle geliyor ve ilerleyen dönemlerde bu özelliğin genişleyeceği taahhüdünü veriyor.
Ücretsiz olarak kullanılabilen model, metni girdi olarak kabul edip çıktı olarak üretebilme yeteneğiyle öne çıkarken, metin ve görüntüleri birleştirerek çıktı üretebilen özel bir Gemini Pro Vision uç noktasını içeriyor. Ayrıca, Python, Android (Kotlin), Node.js, Swift ve JavaScript dillerini destekleyen yazılım geliştirme kitleri geliştiricilere geniş bir kullanım yelpazesi sunuyor.
YORUMLAR