Göz Hareketleri Analizinde Yeni Dönem: Yapay Zeka ile Anlamsal Bakış Yolları Ortaya Çıkıyor
Göz hareketleri analizi, insan algısı, dikkat ve bilişsel süreçleri anlamak için uzun süredir kritik bir araç olmuştur. Ancak mevcut yöntemler, genellikle bir kişinin ekranda nereye baktığı ve ne kadar süreyle baktığı gibi uzamsal ve zamansal verilere odaklanmıştır. Bu yaklaşımlar, bakışın ardındaki anlamsal içeriği, yani kişinin gördüğü şeyin ne anlama geldiğini büyük ölçüde göz ardı ediyordu. Şimdi ise yapay zeka teknolojileri sayesinde bu sınırlama aşılmak üzere.
Akademik dünyadan gelen yeni bir çalışma, göz izleme verilerini analiz etme biçimimizde devrim yaratacak bir 'anlamsal bakış yolu benzerliği' çerçevesi sunuyor. Bu yenilikçi sistem, görme-dil modellerini (VLM'ler) göz izleme analizine entegre ederek, sadece bakışın konumunu değil, aynı zamanda bakılan görsel alanın anlamsal içeriğini de anlamayı hedefliyor. Her bir sabitleme (fixation) noktası, kontrollü görsel bağlam altında (yama tabanlı ve işaretleyici tabanlı stratejilerle) kodlanıyor ve bu bilgiler, kısa ve öz metinsel açıklamalara dönüştürülüyor. Bu sayede, bir kişinin neye baktığı, yapay zeka tarafından 'anlatılabilir' hale geliyor.
Bu metinsel açıklamalar daha sonra doğal dil işleme (NLP) metrikleri kullanılarak analiz ediliyor. Geleneksel yöntemlerin aksine, bu yeni çerçeve, iki farklı bakış yolunun sadece uzamsal olarak ne kadar benzer olduğunu değil, aynı zamanda anlamsal olarak da ne kadar örtüştüğünü değerlendirebiliyor. Örneğin, bir kullanıcının bir ürünün 'fiyatına' bakması ile 'özelliklerine' bakması arasındaki farkı anlamsal olarak ayırt edebiliyor. Bu durum, kullanıcı deneyimi araştırmalarından pazarlamaya, bilişsel bilimlerden tıp alanına kadar geniş bir yelpazede yeni kapılar açma potansiyeli taşıyor.
Bu teknolojinin potansiyel uygulamaları oldukça geniş. Kullanıcı arayüzü tasarımı yapanlar, bir web sitesindeki hangi elementlerin gerçekten dikkat çektiğini ve ne anlama geldiğini daha iyi anlayabilirler. Pazarlamacılar, reklam görsellerindeki hangi unsurların tüketicilerin ilgisini anlamsal olarak çektiğini belirleyerek daha etkili kampanyalar oluşturabilirler. Bilişsel bilimciler ise insan beyninin görsel bilgiyi nasıl işlediğine dair daha derinlemesine içgörüler elde edebilirler. Yapay zeka destekli bu anlamsal analiz, göz hareketleri araştırmalarını sadece 'nereye bakıldı' sorusundan 'ne görüldü ve ne anlama geldi' sorusuna taşıyarak, insan davranışlarını ve algısını anlamada yepyeni bir boyut sunuyor.
Orijinal Baslik
What They Saw, Not Just Where They Looked: Semantic Scanpath Similarity via VLMs and NLP metric