Microsoft Kendi Yapay Zekasını Duyurdu: ChatGPT'den Daha İyi Performans Gösteriyor!
Microsoft, yeni yapay zekâ dil modeli Phi-1'i tanıttı. Phi-1, yalnızca 4 günlük eğitimle ChatGPT'den daha doğru sonuçlar veriyor. İşte detaylar!
Microsoft, şaşırtıcı bir atılımla 1,3 milyar parametreye sahip en yeni dil modeli Phi-1'i tanıttı. Daha büyük modellerin daha iyi performans gösterdiği yönündeki geleneksel inanışın aksine, Microsoft'un yaklaşımı eğitim verilerinin kalitesine odaklanıyor.
Titizlikle seçilmiş "metin kitabı düzeyinde" bir veri kümesi üzerinde eğitilen Phi-1, 100 milyar parametreli GPT-3.5'ten daha iyi performans gösteriyor.
Microsoft, Dil Modelini Yalnızca 4 Gün Eğitti
Microsoft'un Transformer mimarisi üzerine inşa ettiği Phi-1 dil modeli, etkileyici performansıyla dikkatleri üzerine çekmeyi başardı. Phi-1'in arkasındaki ekip, model yığını boyutunu artırma eğiliminden farklı olarak eğitim verilerinin kalitesine önem verdi.
İnternetten alınan "metin kitabı düzeyinde" içerikten oluşan yüksek kaliteli bir veri kümesi kullanan Microsoft ekibi, GPT-3.5 kullanarak bilgileri işledi. Eğitim süreci 8 Nvidia A100 GPU'nun yardımıyla sadece dört günde tamamlandı.
Microsoft'a göre parametre sayısını artırmak yerine eğitim verisi kalitesini artırmaya odaklanılması umut verici sonuçlar verdi. Karşılaştırmalı testlerde Phi-1, GPT-3.5'in 175 milyar parametre ile elde ettiği %47'lik performansı geride bırakarak %50,6'lık bir doğruluk skoru elde etti.
Microsoft, Phi-1'i HuggingFace'te açık kaynak olarak sunarak bu dil modelinin erişilebilirliğini ve işbirliğine dayalı potansiyelini daha da güçlendirmeyi planlıyor.
Microsoft'un Phi-1 dil modeli, artan yığın boyutunun gelişmiş performans için gerekli olduğu fikrine meydan okuyor. Yüksek kaliteli eğitim verilerine odaklanan Phi-1, daha büyük modelleri bile geride bırakarak dikkate değer bir doğruluk sergilerken, Phi-1'in açık kaynak kullanımı, Microsoft'un doğal dil işleme alanını ilerletme konusundaki kararlılığını da göstermekte.