AI En Karmaşık Matematik Sınavlarından Geçiyor Ama Bakın Neyi Yapamıyor

Yapay zeka çoğu komplike görevleri saniyeler içinde gerçekleştirebiliyor olmasına rağmen en basit işlemleri yapmakta ilginç bir şekilde zorlanıyor.

Ecem Köksal -

Günümüzde yapay zeka fotoğrafları gerçeğe yakın şekilde oluşturabiliyor, roman yazabiliyor, hatta karmaşık bilimsel problemleri çözüp üst düzey matematik testlerinden bile yüksek notlar alarak geçebiliyor. Ancak Edinburgh Üniversitesi'nden gelen yeni bir araştırma, AI'ın halen basit bir görevde çuvalladığını ortaya koydu: saat okumak. Nasıl oluyor da bu kadar kapsamlı bir sistem böylesine basit bir görevi yapamıyor? Araştırmacılar, yedi farklı çok modlu büyük dil modelini (MLLM) teste tabi tuttu.

İnternet

Yapay Zeka Zor İş: Anthropic AI CEO'su Korkuyla Yaşıyor

Bu modeller, hem metinleri hem de görselleri anlayabilen gelişmiş yapay zeka sistemleri olarak öne çıkıyor, çoğunu günlük hayatımızda kullanıyoruz... Test kapsamında bu AI'lara farklı analog saat görüntüleri ve 10 yıllık takvimler gösterildi. Görev basitti: "Saat kaç?" veya "Yılın 153. günü hangi tarihe denk geliyor?" gibi sorulara yanıt vermeleri istendi. Sonuçlar ise enteresandı...

Yapay Zeka Neden Zaman Kavramını Anlamıyor?

AI'lar, analog saatlerde doğru zamanı tahmin etmede %25'in altında bir başarı oranı gösterdi. Romen rakamlarıyla yazılmış saatleri ve stilize edilmiş ibreleri okumakta zorlandılar. Hatta bazı saatlerde saniye ibresi bile yoktu ama bu bile sonuçları değiştirmeye yetmedi. Sorun sadece sayıları görmekle değil, açılar ve konumlar arasındaki ilişkiyi anlamakta da yatıyordu.

GPT-o1 modeli, takvim testlerinde bir tık daha iyi performans göstermeyi başardı. Takvim sorularındaki doğluluk oranı %80'di ama modellerin en iyisi bile %20'lik bir hata payına sahipti.

Araştırmacı Rohit Saxena şöyle diyor: 

Çoğu insan küçük yaşlardan itibaren saat okumayı ve takvim kullanmayı öğreniyor. AI’ın bu kadar temel bir beceride başarısız olması, onun gerçek dünyaya entegrasyonunda ciddi bir açık olduğunu gösteriyor.

Edinburgh Üniversitesi'nde araştırmayı yürüten ekibe göre, zaman kavramını anlayamayan bir AI, günlük hayatta büyük sorunlar yaratabilir. Otonom sistemlerden takvim planlamasına, zamanla ilgili birçok görevde bu eksiklik ciddi problemlere yol açabiliyor. Ancak teknoloji gelişiyor; bu sorun da kısa süre içinde çözülebilir, ancak şimdilik bu durum yapay zekanın yapamadıkları işler arasında kalmaya devam edecek.

Yaşam

Rekabet Kurumu, Netflix, Disney+, Prime Video, Exxen, BluTV ve GAİN'e Soruşturma Açtı!

Benzer İçerikler