Yapay Genel Zeka (AGI) Hayali Uzak mı? Yeni Benchmark Testi Çarpıcı Sonuçlar Ortaya Koydu
Yapay Genel Zeka (AGI) kavramı, yani makinelerin insan zekasının tüm bilişsel yeteneklerine sahip olması fikri, teknoloji dünyasının en büyük hedeflerinden biri olmaya devam ediyor. NVIDIA CEO'su Jensen Huang'ın yakın zamanda AGI'nin aslında zaten burada olduğunu iddia etmesi, bu tartışmayı yeniden alevlendirmişti. Ancak, tam da bu iddiaların yapıldığı günlerde yayınlanan yeni bir yapay zeka kıyaslama testi olan ARC-AGI-3, mevcut modellerin AGI seviyesine ulaşmaktan ne kadar uzak olduğunu net bir şekilde ortaya koydu.
ARC-AGI-3 benchmark testi, yapay zeka modellerinin karmaşık akıl yürütme, problem çözme ve genelleme yeteneklerini ölçmek üzere tasarlandı. Bu testin sonuçları oldukça çarpıcıydı: Google'ın gelişmiş yapay zeka modeli Gemini, testte yalnızca %0.37'lik bir başarı oranı elde ederken, OpenAI'ın henüz genel kullanıma sunulmayan GPT-5.4 modeli ise %0.26'da kaldı. Karşılaştırma yapmak gerekirse, insanlar aynı testte %100 başarı gösterdi. Bu rakamlar, mevcut en iyi yapay zeka modellerinin bile, insan zekasının basit kabul edilen görevlerdeki performansına kıyasla ne kadar sınırlı olduğunu gözler önüne seriyor.
Bu sonuçlar, AGI'nin tanımı ve mevcut yapay zeka teknolojilerinin gerçek kapasitesi üzerine önemli soruları gündeme getiriyor. Jensen Huang'ın 'AGI geldi' açıklaması, belki de belirli dar alanlardaki üstün performansları işaret ediyor olabilir; ancak ARC-AGI-3 gibi kapsamlı testler, genel problem çözme ve adaptasyon yeteneği açısından henüz emekleme aşamasında olduğumuzu gösteriyor. Bu durum, yapay zeka araştırmacılarının önünde hala devasa zorluklar olduğunu ve gerçek AGI'ye ulaşmak için algoritmik yenilikler, daha iyi veri setleri ve belki de tamamen farklı yaklaşımlara ihtiyaç duyulduğunu vurguluyor.
Önde gelen yapay zeka modellerinin bu denli düşük puanlar alması, AGI'nin sadece daha büyük modeller veya daha fazla veri ile ulaşılabilecek bir hedef olmadığını düşündürüyor. Gerçek anlamda genel zeka, sadece bilgi işlemekle kalmayıp, öğrenme, adapte olma, yaratıcılık ve bilinç gibi insana özgü karmaşık yetenekleri de içermelidir. Bu benchmark testi, yapay zeka alanındaki heyecan verici ilerlemelere rağmen, insan seviyesinde bir yapay zekaya ulaşma yolculuğunun henüz başında olduğumuzu ve önümüzdeki yıllarda bu alanda çok daha fazla araştırma ve geliştirme çabasına ihtiyaç duyulacağını açıkça gösteriyor.
Orijinal Baslik
Is AGI Here? Not Even Close, New AI Benchmark Suggests