Yapay Zeka Modellerinin MoCA Testindeki Düşük Puanları The BMJ dergisinde yayımlanan bir çalışmaya göre, popüler yapay zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Bilişsel Değerlendirme Testi’nde (MoCA) düşük puanlar aldı. MoCA testi, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılmaktadır. Çalışma, eski yapay zeka modellerinin, yaşlanan insanlar…
The BMJ dergisinde yayımlanan bir çalışmaya göre, popüler yapay zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Bilişsel Değerlendirme Testi’nde (MoCA) düşük puanlar aldı. MoCA testi, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılmaktadır. Çalışma, eski yapay zeka modellerinin, yaşlanan insanlar gibi, testlerde zayıf performans sergilediğini gösterdi.
Son dönemdeki yapay zeka gelişmeleri, yapay zekanın tıp alanında insan doktorların yerini alıp alamayacağı konusunda hem heyecan hem de endişe yaratmaktadır. Önceki çalışmalar, büyük dil modellerinin tıbbi teşhis görevlerinde başarılı olduğunu göstermiş olsa da, bilişsel bozukluklar gibi insan benzeri zorluklara karşı yapay zekanın kırılganlıkları pek araştırılmamıştı.
Araştırmacılar, önde gelen yapay zeka modelleri olan ChatGPT 4 ve 4o, Claude 3.5 “Sonnet” ve Gemini 1 ve 1.5’i, Montreal Bilişsel Değerlendirme (MoCA) testiyle değerlendirdiler. MoCA testi, yaşlı erişkinlerde bilişsel bozuklukları tespit etmek için kullanılır. ChatGPT 4o en yüksek puanı alırken, Gemini 1.0 en düşük puanı aldı. Görsel ve yürütücü işlevlerde zorluklar yaşanırken, diğer yeteneklerde genel olarak iyi performans sergilendi.
Bu çalışma, yapay zekanın bilişsel yeteneklerinin insan benzeri zorluklar karşısındaki performansını daha iyi anlamamıza yardımcı olabilir.
Reklam & İşbirliği: [email protected]