Apple’ın Yeni Yapay Zekası Sessiz Sedasız Yayımlanmış: Ferret ile Tanışın!
Görüntü analiziyle güçlendirilmiş dil modeli Ferret, Apple ve Cornell Üniversitesi işbirliğiyle geliştiriliyor. İşte detaylar!
Apple ve Cornell Üniversitesi'nde görev yapan araştırmacılar, Ferret adını verdikleri çoklu modlu geniş dil modelini ekim ayında sessiz sedasız bir şekilde açık kaynak olarak yayınladılar. Bu model, sorgular için görüntü bölgelerini kullanabilme özelliğine sahiptir ve şu anda araştırma sürümü olarak aktif olarak kullanılmaktadır.
Ferret'in kodlarıyla birlikte tanıtılan Ferret-Bench, 30 Ekim'de duyuruldu ve ayrıca 14 Aralık'ta ek sürümleri de kamuya açıklandı.
Cumartesi günü, yapay zeka araştırmacılarının dikkatini çeken Ferret, ticari olmayan bir lisans altında açık kaynak olarak sunuldu. Bu da, mevcut sürümün ticarileştirilemeyeceği anlamına geliyor. Ancak ilerleyen dönemde Ferret'in Apple ürünleri veya hizmetlerinde kullanılma olasılığı da göz önünde bulundurulmaktadır.
🚀🚀Introducing Ferret, a new MLLM that can refer and ground anything anywhere at any granularity.
— Zhe Gan (@zhegan4) October 12, 2023
📰https://t.co/gED9Vu0I4y
1⃣ Ferret enables referring of an image region at any shape
2⃣ It often shows better precise understanding of small image regions than GPT-4V (sec 5.6) pic.twitter.com/yVzgVYJmHc
Ferret'in temel işlevi nedir?
Ferret, bir görüntü üzerinde çizilen bir bölgeyi analiz edebilme kabiliyetine sahiptir. Bu sayede bir sorguda kullanıcının dikkatini çekebilecek unsurları belirleyebilir ve tespit edilen öğenin etrafına sınırlayıcı bir kutucuk çizebilir.
Ayrıca daha sonra bu tanımlanan öğeyi bir sorgunun parçası olarak kullanabilir ve genellikle bu sorguya yanıt verebilir.
Örneğin, bir görseldeki bir hayvanı vurgulayarak Ferret'a "Bu hayvanın türü nedir?" diye sorabilirsiniz. Ferret, hayvanın türünü tanımlayabilir ve kullanıcının bu türdeki tek bir hayvana atıfta bulunduğunu anlayabilir.
Sonrasında, görüntüde tespit edilen diğer öğelerin bağlamını kullanarak daha fazla bilgi sunabilir.
Ferret'in sessiz sedasız piyasaya sürülmesi, ilerleyen süreçlerde Apple'ın iPhone ve Mac gibi ürünlerine entegre edilebileceği ancak Ferret'in bu platformlarda sunabileceği özelliklere dair net bilgilerin henüz mevcut olmadığı belirtiliyor; ayrıca, Apple'ın iOS 18 ile yapay zekâ destekli özellikleri kullanıcılara sunma planları WWDC 2024'te açıklanacak.