Duzenleme & EtikAkademik MakaleIngilizce

Hizalama, Dil Modellerini Betimleyici Değil, Normatif Hale Getirir

arXiv17 Mart 2026 23:47

Eğitim sonrası hizalama, dil modellerini insan tercih sinyallerine uyacak şekilde optimize eder, ancak bu amaç gözlemlenen insan davranışını modellemeye eşdeğer değildir. 120 temel-hizalanmış model çiftini pazarlık, ikna, müzakere ve tekrarlanan matris oyunları gibi çok turlu stratejik oyunlarda 10.000'den fazla gerçek insan kararı üzerinde karşılaştırdık. Bu ortamlarda, temel modeller, insan seçimlerini tahmin etmede hizalanmış muadillerine göre neredeyse 10'a 1 oranında daha iyi performans göstermekte olup, bu durum model aileleri ve istem formülasyonu genelinde sağlamdır...

Orijinal Baslik

Alignment Makes Language Models Normative, Not Descriptive