Duzenleme & EtikAkademik MakaleIngilizce
Hizalama, Dil Modellerini Betimleyici Değil, Normatif Hale Getirir
arXiv17 Mart 2026 23:47
Eğitim sonrası hizalama, dil modellerini insan tercih sinyallerine uyacak şekilde optimize eder, ancak bu amaç gözlemlenen insan davranışını modellemeye eşdeğer değildir. 120 temel-hizalanmış model çiftini pazarlık, ikna, müzakere ve tekrarlanan matris oyunları gibi çok turlu stratejik oyunlarda 10.000'den fazla gerçek insan kararı üzerinde karşılaştırdık. Bu ortamlarda, temel modeller, insan seçimlerini tahmin etmede hizalanmış muadillerine göre neredeyse 10'a 1 oranında daha iyi performans göstermekte olup, bu durum model aileleri ve istem formülasyonu genelinde sağlamdır...
Orijinal Baslik
Alignment Makes Language Models Normative, Not Descriptive