LLM & ChatbotAkademik MakaleIngilizce

Yapay Zeka Hikaye Anlatımında İnsanla Yarışabilir mi? Yeni Araştırma Anlatı Tutarlılığını İnceliyor

arXiv26 Mart 2026 15:13

Yapay zeka teknolojileri, dil anlama ve üretme yetenekleriyle her geçen gün daha da gelişiyor. Özellikle son dönemde görsel-dil modelleri (VLM), bir görselden yola çıkarak tutarlı ve anlamlı hikayeler oluşturma potansiyeliyle dikkat çekiyor. Ancak bu hikayelerin, insan zekasının ürünü olan anlatılarla ne kadar rekabet edebildiği, akademik çevrelerde merak konusu olmaya devam ediyor. Yeni bir araştırma, yapay zeka tarafından üretilen hikayelerin anlatı tutarlılığını derinlemesine inceleyerek bu soruya ışık tutuyor.

Araştırmacılar, 'Görsel Yazı İpuçları' (Visual Writing Prompts) veri setini kullanarak hem insanlar tarafından yazılmış hem de görsel-dil modelleri tarafından oluşturulmuş hikayeleri mercek altına aldı. Bu karşılaştırmayı yaparken, anlatı tutarlılığını ölçmek için kapsamlı bir metrik seti geliştirdiler. Bu metrikler arasında, karakterlerin ve nesnelerin hikaye boyunca nasıl izlendiğini gösteren 'eşbaşvuru' (coreference), cümleler ve paragraflar arasındaki mantıksal bağlantıları değerlendiren 'söylem ilişkisi türleri' (discourse relation types), hikayenin ana temasının ne kadar korunduğunu ölçen 'konu sürekliliği' (topic continuity), karakterlerin tutarlı bir şekilde varlığını sürdürmesi ve en önemlisi, karakterlerin görsellerle ne kadar uyumlu olduğunu belirleyen 'çok modlu karakter temellendirmesi' (multimodal character grounding) gibi unsurlar bulunuyor.

Elde edilen bulgular, görsel-dil modellerinin genel olarak benzer tutarlılık profilleri sergilediğini ortaya koydu. Bu, farklı VLM'lerin belirli alanlarda benzer güçlü ve zayıf yönlere sahip olduğunu gösteriyor. Ancak araştırmanın detayları, yapay zekanın insan anlatımına kıyasla hangi alanlarda daha başarılı olduğunu veya nerede geliştirilmesi gerektiğini daha net bir şekilde ortaya koyuyor. Örneğin, bir VLM karakterlerin görseldeki hareketlerini doğru bir şekilde betimleyebilirken, başka bir VLM karakterlerin duygusal gelişimini veya karmaşık motivasyonlarını yansıtmakta zorlanabilir.

Bu çalışma, yapay zekanın hikaye anlatımı yeteneklerini anlamak ve geliştirmek için kritik bir adım niteliğinde. Gelecekte, bu tür araştırmalar sayesinde yapay zeka, sadece bilgi aktaran değil, aynı zamanda duygusal derinliği ve sanatsal ifade gücü olan hikayeler yaratma konusunda da insanlara yaklaşabilir. Film senaryolarından interaktif oyunlara, eğitim materyallerinden kişiselleştirilmiş içeriklere kadar birçok alanda, yapay zekanın daha tutarlı ve etkileyici anlatılar sunması, kullanıcı deneyimini kökten değiştirebilir. Ancak insan yaratıcılığının ve sezgisinin yerini tamamen alıp almayacağı sorusu, uzun süre daha tartışma konusu olmaya devam edecek gibi görünüyor.

Orijinal Baslik

Humans vs Vision-Language Models: A Unified Measure of Narrative Coherence

Bu haberi paylas

OpenAI'dan Tıp Dünyasına Özel Hamle: ChatGPT Sağlık Sektörüne Adım Atıyor

OpenAI, sağlık profesyonellerine yönelik özel bir ChatGPT sürümünü tanıttı. Bu yeni yapay zeka aracı, doktorlar, hemşireler ve eczacılar gibi sağlık çalışanlarının iş yükünü hafifletmeyi hedefliyor.

Presse-citron21 gun once

Yapay Zeka Futbol Dünyasını Karıştırıyor: ChatGPT'den Sahte Maç Afişleri!

OpenAI'ın ChatGPT Images platformu, ilk çıktığında Ghibli tarzı görsellerle büyük beğeni toplamıştı. Ancak şimdi yapay zeka, futbol maçları için gerçekçi görünen ancak tamamen uydurma afişler üreterek gündem oldu.

Numerama21 gun once

Gemini AI ile Sanal Vancouver Geziniz Gerçekçi Hale Geliyor: Fotoğraflarda Doğallığı Koruyan 6 Düzenleme

Google'ın yapay zeka modeli Gemini, sanal Vancouver seyahat fotoğraflarını gerçekçi kılmak için kullanılıyor. Bu yöntem, yapay zekanın görsel içerik üretiminde doğallığı koruma yeteneğini gözler önüne seriyor.

Qoo Media21 gun once

ChatGPT Cinayet Soruşturmasında: Yapay Zeka Suç Ortağı Olabilir mi?

Florida'da yaşanan bir silahlı saldırı öncesinde zanlının ChatGPT'ye danıştığının ortaya çıkması, yapay zekanın etik ve hukuki sorumlulukları üzerine ciddi tartışmaları başlattı. Yetkililer, bu olayı derinlemesine araştırıyor.

The Daily Aus21 gun once

ChatGPT'ye Gelen 'Workspace Agents': Ekipler Arası İş Birliğinde Yeni Dönem

OpenAI, ChatGPT'ye entegre ettiği 'Workspace Agents' özelliğiyle, yapay zeka destekli asistanların ekip çalışmalarında daha aktif rol almasını sağlıyor. Bu yenilik, dosyalar, kodlar ve bulut araçları gibi çeşitli platformlarda iş birliğini kolaylaştıracak.

Teknoblog21 gun once

Yapay Zeka Tedarik Zincirini Güvence Altına Alan Cloudsmith'e 72 Milyon Dolarlık Yatırım

Yapay zeka yazılım tedarik zincirinin güvenliğini sağlamayı hedefleyen Cloudsmith, Series C turunda 72 milyon dolarlık önemli bir yatırım aldı. Bu finansman, yapay zeka projelerinin güvenilirliğini ve bütünlüğünü artırma yolunda kritik bir adım olarak görülüyor.

TradingView21 gun once