Yapay Zeka Destekli Egzersiz Reçeteleri Güvenilir mi? Yeni Araştırma LLM'leri Mercek Altına Aldı
Yapay zeka (YZ) teknolojileri, hayatımızın her alanına nüfuz etmeye devam ederken, sağlık ve kişisel antrenman gibi hassas alanlarda da potansiyel uygulamalar sunuyor. Özellikle Büyük Dil Modelleri (LLM'ler), kullanıcıların taleplerine göre kişiselleştirilmiş içerikler üretme yetenekleriyle dikkat çekiyor. Peki, bu modellerin sağlıkla ilgili konularda, örneğin egzersiz reçeteleri oluşturmada ne kadar tutarlı ve güvenilir oldukları merak konusu.
Son yapılan bir akademik çalışma, bu önemli soruyu ele alarak GPT-4.1, Claude Sonnet 4.6 ve Gemini 2.5 Flash gibi önde gelen üç LLM'in egzersiz reçetesi oluşturma yeteneklerini karşılaştırdı. Araştırmacılar, her bir modele altı farklı klinik senaryo için 20'şer kez egzersiz reçetesi oluşturttu. Toplamda 360 çıktı elde edilen bu kapsamlı analizde, modellerin ürettiği içerikler anlamsal benzerlik, çıktı tekrarlanabilirliği, FITT (Sıklık, Yoğunluk, Zaman, Tip) sınıflandırması ve güvenlik ifadeleri gibi dört temel boyutta değerlendirildi.
Çalışmanın bulguları oldukça ilginç sonuçlar ortaya koydu. Anlamsal benzerlik açısından GPT-4.1'in diğer modellere kıyasla daha yüksek bir tutarlılık sergilediği gözlemlendi. Bu, aynı girdiye defalarca maruz kaldığında GPT-4.1'in daha benzer ve tutarlı reçeteler üretebildiği anlamına geliyor. Ancak genel olarak, modellerin farklı senaryolarda ve tekrar eden üretimlerde tam anlamıyla mükemmel bir tutarlılık sergilemediği de belirtildi. Özellikle güvenlik uyarıları gibi kritik unsurların bazen eksik veya tutarsız olabileceği bulgusu, yapay zekanın sağlık alanında doğrudan kullanımı için dikkatli olunması gerektiğini gösteriyor.
Bu araştırma, yapay zekanın sağlık hizmetlerine entegrasyonu konusunda önemli çıkarımlar sunuyor. LLM'ler, kişiselleştirilmiş egzersiz programları veya sağlık danışmanlığı gibi alanlarda yardımcı bir araç olarak büyük bir potansiyele sahip. Ancak, insan sağlığını doğrudan etkileyebilecek reçeteler söz konusu olduğunda, bu sistemlerin çıktılarının her zaman bir uzman tarafından denetlenmesi ve doğrulanması gerektiği açıkça görülüyor. Yapay zekanın bu alandaki gelişimi devam ederken, güvenilirlik ve tutarlılık konularındaki iyileştirmeler, gelecekteki uygulamaların başarısı için kritik öneme sahip olacak.
Orijinal Baslik
Cross-Model Consistency of AI-Generated Exercise Prescriptions: A Repeated Generation Study Across Three Large Language Models