Duzenleme & EtikAkademik MakaleIngilizce
Düşünce Zinciri Üretiminden Önce Güvenlik Karar Alma Sürecini Teşvik Ederek Daha Güvenli Büyük Akıl Yürütme Modellerine Doğru
arXiv18 Mart 2026 05:21
Büyük akıl yürütme modelleri (BAM'ler), düşünce zinciri (CoT) aracılığıyla dikkate değer bir performans sergilemiş olsa da, son çalışmalar bu gelişmiş akıl yürütme yeteneklerinin güvenlik yeteneklerinde önemli bir düşüş pahasına olduğunu göstermiştir. Bu makalede, BAM'lerin güvenlik bozulmasının yalnızca CoT etkinleştirildikten sonra meydana geldiğini ve CoT devre dışı bırakıldığında bu bozulmanın gözlemlenmediğini ortaya koyuyoruz. Bu gözlem, BAM'leri CoT üretiminden önce güvenlik kararları almaya teşvik etmeyi düşünmemize yol açmaktadır. Bu amaçla, biz öneriyoruz...
Orijinal Baslik
Towards Safer Large Reasoning Models by Promoting Safety Decision-Making before Chain-of-Thought Generation