Yapay Zeka Modelleri Montreal Bilişsel Değerlendirme Testi’nde Zayıf Performans Gösterdi

Yapay Zeka Modellerinin MoCA Testindeki Düşük Puanları The BMJ dergisinde yayımlanan bir çalışmaya göre, popüler yapay zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Bilişsel Değerlendirme Testi’nde (MoCA) düşük puanlar aldı. MoCA testi, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılmaktadır. Çalışma, eski yapay zeka modellerinin, yaşlanan insanlar…

Zor Haber 19 Aralık 2024

0 Yorum Yapıldı

Bağlantı kopyalandı!

Yapay Zeka Modelleri Montreal Bilişsel Değerlendirme Testi’nde Zayıf Performans Gösterdi

Yapay Zeka Modellerinin MoCA Testindeki Düşük Puanları

The BMJ dergisinde yayımlanan bir çalışmaya göre, popüler yapay zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Bilişsel Değerlendirme Testi’nde (MoCA) düşük puanlar aldı. MoCA testi, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılmaktadır. Çalışma, eski yapay zeka modellerinin, yaşlanan insanlar gibi, testlerde zayıf performans sergilediğini gösterdi.

Yapay Zeka Gelişmeleri ve Endişeler

Son dönemdeki yapay zeka gelişmeleri, yapay zekanın tıp alanında insan doktorların yerini alıp alamayacağı konusunda hem heyecan hem de endişe yaratmaktadır. Önceki çalışmalar, büyük dil modellerinin tıbbi teşhis görevlerinde başarılı olduğunu göstermiş olsa da, bilişsel bozukluklar gibi insan benzeri zorluklara karşı yapay zekanın kırılganlıkları pek araştırılmamıştı.

Yapay Zeka Modellerinin Değerlendirilmesi

Araştırmacılar, önde gelen yapay zeka modelleri olan ChatGPT 4 ve 4o, Claude 3.5 “Sonnet” ve Gemini 1 ve 1.5’i, Montreal Bilişsel Değerlendirme (MoCA) testiyle değerlendirdiler. MoCA testi, yaşlı erişkinlerde bilişsel bozuklukları tespit etmek için kullanılır. ChatGPT 4o en yüksek puanı alırken, Gemini 1.0 en düşük puanı aldı. Görsel ve yürütücü işlevlerde zorluklar yaşanırken, diğer yeteneklerde genel olarak iyi performans sergilendi.

Bu çalışma, yapay zekanın bilişsel yeteneklerinin insan benzeri zorluklar karşısındaki performansını daha iyi anlamamıza yardımcı olabilir.