Zeka Yarışında Yeni Lider: Yapay Zeka, İnsanlara Performans Testinde Diz Çöktürdü!

Yapay zeka artık neredeyse tüm performans kriterlerinde insanları geride bırakıyor. İşte detaylar!

Doğukan Dere - 2 HAFTA ÖNCE GÜNCELLENDİ

Günümüzde yapay zekanın son iki yıllık ilerlemesine bakıldığında birçok alanda insanlara o kadar hızlı yetişiyor ki yeni testlere ihtiyaç duyuluyor.

Stanford Üniversitesi'nin AI endeksi raporunda ise, yapay zekanın hızlı gelişimi ele alındı. Yapay zeka birçok parametrede insanları geride bırakmayı başardı.

Yapay Zeka İnsanları Hangi Alanlardada Geride Bıraktı?

Stanford Üniversitesi İnsan Merkezli Yapay Zeka Enstitüsü (HAI), akademik ve endüstriyel uzmanlardan oluşan bir ekip tarafından yazılan AI Endeksi raporunun yedinci yıllık sayısını yayınladı.

Geniş içeriği olan raporun en dikkat çekici kısmı yapay zekanın insanlarla karşılaştırıldığında gösterdiği performans olarak öne çıkıyor. Baş döndürücü hızla gelişen yapay zeka günümüzde birçok alanda insanı geride bırakmış durumda görünüyor.

Yapay zeka, 2015 yılında görüntü sınıflandırma, 2017'de temel okuduğunu anlama, 2020'de görsel muhakeme ve 2021 yılında doğal dil çıkarımı alanlarında insanları geride bırakmayı başardı.

Yapay zekanın hızlı bir şekilde akıllanmasından dolayı şuana kadar kullanılan kriterlerin çoğu artık geçerliliğini yitirmiş görünüyor. Dolayısıyla araştırmacılar yeni ve daha zorlu ölçütler geliştirmek için uğraşıyor.

Bu testler sadece yapay zekanın yeterliliğini ölçmek için değil, insanlarla yapay zekaların farklılıklarını vurgulamak ve hangi alanlarda insanların avantajlı olduğunu belirlemek için geliştiriliyor.

Karmaşık Problemleri Çözmede Ne kadar Başarılı Oluyor?

Yeni AI Index raporu, 2023 yılında yapay zekanın ileri düzey matematik problemleri çözme ve görsel sağduyulu akıl yürütme gibi karmaşık bilişsel görevlerde başarılı olsa bile hâlâ sıkıntı yaşadığını gösteriyor.

2021'de yapay zeka sistemleri problemlerin yalnızca %6,9'unu çözebiliyordu. 2023'te ise GPT-4 tabanlı bir model soruların %84,3'ünü çözmeyi başardı. İnsan ortalaması ise %90 düzeyinde başarılı oldu.

Diğer bir alan ise görsel sağduyu muhakemesi (VCR). VCR, basit nesne tanımanın ötesinde, yapay zekanın tahminlerde bulunmak için görsel bağlamda yer alan bilgiyi nasıl kullandığını değerlendiriyor.

Raporda, 2022 ile 2023 yılları arasında VCR'de %7,93'lük bir artışla 81,60'a (insan ortalaması 85) ulaştığı belirtiliyor.

Doğruluk Konusunda İlerleme Var mı?

Günümüzde yapay zeka birçok meslekte yazılı içerik üretiyor. Ancak, büyük ilerlemelere rağmen, büyük dil modelleri (LLM) hala yanlış veya hatalı bilgiler üretmeye eğilimliler.

Yeni AI Index raporunda TruthfulQA, LLM'lerin doğruluğunu test etmek için bir kıyaslama olarak kullanıldı. 817 adet soru (sağlık, hukuk, finans ve politika gibi konularla ilgili), insanların sıklıkla yanlış anladığı yaygın yanlış kanılara meydan okumak için tasarlandı.

2024'ün başlarında piyasaya sürülen GPT-4, 0,59 puanla kıyaslamada en yüksek performansı elde etti. Bu skor, 2021'de test edilen GPT-2 tabanlı modelden neredeyse üç kat daha yüksek. Dolayısıyla büyük dil modellerinin giderek daha iyi eğitildiği ve daha doğru cevaplar vermeye başladığı görülüyor.

Yapay Zeka

Yeni Başlayanlara Özel: En İyi Yapay Zeka Proje Fikirleri

Yapay zeka, son dönemin en popüler alanlarından biri. Normal olarak teknoloji başta olmak üzere tüm sektörlere ve hayatımızın her alanına yayılmış durumda.

2023 yılı boyunca yapay zekada görülen hızlı gelişme durmadan devam ediyor. Yeni geliştirilen modellerle beraber yapay zeka ile insan arasındaki uçurum kapanmış durumda görünüyor.

WINDOWS

ANDROID

IOS

MAC

Uygulama

İŞLETİM SİSTEMLERİ

Oyun

Haber

İnceleme

Video

LİSTELER

Tamindir

Zeka Yarışında Yeni Lider: Yapay Zeka, İnsanlara Performans Testinde Diz Çöktürdü!

Yapay Zeka İnsanları Hangi Alanlardada Geride Bıraktı?

Karmaşık Problemleri Çözmede Ne kadar Başarılı Oluyor?

Doğruluk Konusunda İlerleme Var mı?

Yeni Başlayanlara Özel: En İyi Yapay Zeka Proje Fikirleri

YORUMLAR

ÖNE ÇIKAN HABERLER

iPhone 14 vs Galaxy S23: Metrelerce Yükseklikten Düşüp Sağ Çıkan Hangisi Oldu?

En Düşük ve En Yüksek Bakım Maliyetine Sahip Araba Markaları Belli Oldu!

Togg Almak İsteyenlere 0 Faizli Kredi Fırsatı!

One UI 6.1 Güncellemesi Almayacak Telefonlar

Android 14 Tabanlı One UI 6.1 Güncellemesi Alan Samsung Telefon Sayısı Belli Oldu!

YENİ HABERLER

HTC Yeni Tabletini Tanıttı: İşte Özellikleri

YouTube Çöktü mü? Video Yüklemelerinde Sorun Yaşanıyor!

Nisan Ayı Enflasyon Rakamları Açıklandı!

Tim Cook Açıkladı: iPhone'lara Yeni Özellikler Geliyor!

Depolama Alanınız Sürekli Doluyorsa Çözüm Geldi: WhatsApp Büyük Hamlesini Yaptı!