Otonom & RobotikAkademik MakaleIngilizce

Yapay Zeka, İnsan Tercihlerini Daha İyi Anlayacak: Yeni Model Çelişkili Verilere Meydan Okuyor

arXiv1 Mayıs 2026 04:06

Yapay zeka sistemlerinin insanlarla daha uyumlu çalışabilmesi için, onların tercihlerini doğru bir şekilde anlaması büyük önem taşıyor. Geleneksel yöntemlerde ödül fonksiyonları manuel olarak tasarlanırken, tercihe dayalı pekiştirmeli öğrenme (Preference-based Reinforcement Learning) bu süreci insanlardan alınan karşılaştırmalı geri bildirimlerle otomatikleştiriyor. Ancak bu yaklaşımın önündeki en büyük engellerden biri, büyük ölçekli tercih veri setlerindeki tutarsızlıklar ve çelişkilerdir. Kalabalık kaynaklardan veya sentetik öğretmenlerden toplanan bu verilerde, farklı kişilerin aynı konuda farklı görüşlere sahip olması veya tek bir kişinin bile zaman zaman tutarsız tercihler belirtmesi sıkça karşılaşılan bir durumdur.

Mevcut ödül öğrenme algoritmaları genellikle bu heterojen ve çelişkili verileri tek bir ödül modeliyle açıklamaya çalışır. Bu durum, modelin ya ortalama bir tercih öğrenmesine yol açar ya da veri setindeki tüm nüansları göz ardı etmesine neden olur. Sonuç olarak, yapay zeka sistemi insan tercihlerini tam olarak yansıtan bir davranış sergileyemez. Bu sorunu aşmak için geliştirilen PrefMoE (Preference Mixture-of-Experts) adlı yeni bir model, uzmanlar karışımı (Mixture-of-Experts) mimarisini kullanarak bu zorluğa yenilikçi bir çözüm sunuyor.

PrefMoE, tek bir genel ödül modeli yerine, veri setindeki farklı tercih kalıplarını temsil eden birden fazla 'uzman' ödül modelini bir araya getiriyor. Bu uzmanlar, verilerdeki farklı görüşleri veya tutarsızlıkları ayrı ayrı öğrenerek, sistemin insan tercihlerinin altında yatan karmaşık yapıyı daha derinlemesine kavramasına olanak tanıyor. Model, her bir uzmanı belirli bir tercih alt kümesine odaklayarak, çelişkili görünen geri bildirimlerin aslında farklı tercih profillerinden kaynaklandığını anlamayı başarıyor. Bu sayede, yapay zeka sistemi, tek bir 'doğru' tercih yerine, insan tercihlerinin çeşitliliğini ve esnekliğini daha iyi yansıtabiliyor.

Bu yeni yaklaşım, özellikle robotik, kişiselleştirilmiş öneri sistemleri ve insan-bilgisayar etkileşimi gibi alanlarda büyük potansiyel taşıyor. Örneğin, bir robotun farklı kullanıcıların farklı önceliklerine göre hareket etmesi veya bir öneri sisteminin bir kullanıcının zaman içindeki değişen tercihlerini daha iyi anlaması mümkün hale gelebilir. PrefMoE, insanlardan gelen gürültülü ve karmaşık verilerle başa çıkma yeteneği sayesinde, yapay zeka sistemlerinin daha akıllı, daha duyarlı ve nihayetinde insanlarla daha uyumlu hale gelmesine önemli bir katkı sağlayabilir. Bu, yapay zekanın gerçek dünya uygulamalarında karşılaştığı en büyük zorluklardan birine güçlü bir yanıt niteliğindedir. Gelecekte, bu tür modellerin yaygınlaşmasıyla, yapay zeka sistemlerinin insan davranışlarını ve tercihlerini anlama kapasitesinde önemli bir sıçrama yaşanabilir.

Orijinal Baslik

PrefMoE: Robust Preference Modeling with Mixture-of-Experts Reward Learning

Bu haberi paylas

Yarı Otonom Araçlarda İnsan Kontrolü: Güvenlik ve Sorumluluk Dengesi Nasıl Sağlanacak?

Yarı otonom sürüş sistemleri, sürücülerin yasal sorumluluğunu korurken aktif kontrolünü azaltarak güvenlik ve müdahale yeteneğini zayıflatıyor. Yeni araştırmalar, bu sistemlerde "anlamlı insan kontrolü"nün sağlanması için davranış ve algının nasıl ilişkilendirilebileceğini inceliyor.

arXiv4 gun once

Yapay Zeka Modelleri İçin Kenar Cihazlarda Performans Sınırlarını Zorlayan Yeni Bir Çözüm: Tempus

Büyük Dil Modellerinin (LLM) kenar cihazlarda verimli çalışması için kritik öneme sahip olan genel matris çarpımı (GEMM) işlemlerini hızlandırmak amacıyla geliştirilen Tempus, AMD Versal AI Edge platformları için çığır açıyor. Bu yeni çerçeve, yapay zeka hızlandırmasında performans ve verimlilik dengesini yeniden tanımlıyor.

arXiv4 gun once

Yüksek Hızlı Görüntü İşleme ile Robotlar İnsan Hareketlerini Daha İyi Anlayacak

Yeni bir araştırma, yüksek hızlı görüntü işleme tekniklerinin, robotların daha önce görmediği veya etiketlenmemiş insan eylemlerini anlama yeteneğini önemli ölçüde geliştirdiğini ortaya koyuyor. Bu sayede, robotlar karmaşık ve hızlı insan etkileşimlerine daha etkin bir şekilde adapte olabilecek.

arXiv5 gun once

Robotlar Artık Daha Hassas ve Hızlı: Yeni Yöntem İki Kollu İşlemlerde Çığır Açıyor

Yeni geliştirilen MSACT yöntemi, robotların hassas manipülasyon görevlerinde daha düşük gecikme süresi ve daha kararlı görsel konumlandırma sağlayarak, iki kollu robotların gerçek dünya uygulamalarındaki performansını önemli ölçüde artırıyor.

arXiv5 gun once

Mobil Robotlar İçin Yeni Bir Görsel Zeka: Ölçek Değişimine Dayanıklı Manipülasyon

Mobil robotların gerçek dünya ortamlarında nesneleri algılaması ve manipüle etmesi, kamera açılarındaki değişimler nedeniyle zorlaşır. Yeni bir derin öğrenme yöntemi, bu görsel ölçek değişimlerine rağmen robotların gerçek zamanlı ve hassas görevleri yerine getirmesini sağlıyor.

arXiv5 gun once

Robotlar Artık Hem Görüyor Hem Düşünüyor: Uzun Soluklu Görevlerde Yeni Dönem

Yeni bir yapay zeka çerçevesi olan IVLR, robotların karmaşık görevleri yerine getirirken hem görsel bilgiyi hem de metinsel mantığı bir arada kullanmasını sağlayarak insan benzeri akıl yürütme yeteneği kazandırıyor.

arXiv5 gun once