Yapay Zeka Haberleri

Küçük Dil Modellerinde Yapay Zeka Ayarları: SFT ve DPO'nun Gizemli Dansı

arXiv20 Mart 2026 16:27

Yapay zeka dünyasında dil modelleri, son yılların en heyecan verici gelişmelerinden biri. Ancak bu modellerin, özellikle daha küçük ölçekli olanların, istenen performansı sergilemesi için doğru ayarlamalara ihtiyaç duyuluyor. Akademik bir çalışma, bu ayarlamalardan ikisi olan Süpervizyonlu İnce Ayar (SFT) ve Doğrudan Tercih Optimizasyonu (DPO) tekniklerinin küçük dil modelleri üzerindeki etkileşimini ve parametrelerini detaylı bir şekilde inceledi.

Araştırma, GPT-2 ölçeğindeki bir dil modelini ele alarak, SFT'nin tek başına kullanımı, DPO'nun tek başına kullanımı ve bu iki tekniğin aşamalı olarak birlikte uygulanmasının sonuçlarını karşılaştırdı. Ayrıca, modelin tüm parametrelerinin ayarlanması (Full Fine-Tuning - FFT) ile daha verimli bir yöntem olan LoRA (Low-Rank Adaptation) teknikleri de değerlendirmeye alındı. Çalışma, bu yöntemlerin özellikle cümle yeniden ifade tespiti ve Shakespeare sonesi yazımı gibi görevlerdeki performansını gözler önüne serdi.

Elde edilen bulgulara göre, DPO'nun, zaten güçlü bir SFT uygulamasının ardından, görevden göreve değişen küçük ama önemli kazanımlar sağlayabildiği görüldü. Hatta bazı durumlarda DPO, rekabetçi SFT performansına ulaşabiliyor veya onu geçebiliyor. Bu durum, DPO'nun dil modellerini insan tercihleriyle daha iyi hizalamadaki potansiyelini bir kez daha kanıtlıyor. Ancak, DPO'nun her zaman mucizevi sonuçlar yaratmadığı, özellikle sınırlı veri setleri ve küçük modellerle çalışırken dikkatli bir optimizasyon gerektirdiği de vurgulandı.

Bu çalışma, yapay zeka geliştiricileri için önemli çıkarımlar sunuyor. Küçük dil modelleri üzerinde çalışırken SFT ve DPO'nun doğru kombinasyonunu ve uygulama sırasını bulmak, hem performans artışı hem de kaynak verimliliği açısından kritik önem taşıyor. Özellikle DPO'nun, mevcut SFT temelleri üzerine inşa edildiğinde ne kadar değerli olabileceği, ancak tek başına bir çözüm olmaktan ziyade, iyi tasarlanmış bir ince ayar stratejisinin parçası olarak düşünülmesi gerektiği anlaşılıyor. Bu tür araştırmalar, daha verimli ve yetenekli yapay zeka modelleri geliştirmemize ışık tutmaya devam edecek.

Orijinal Baslik

An Empirical Study of SFT-DPO Interaction and Parameterization in Small Language Models

Bu haberi paylas

Küçük Dil Modellerinde Yapay Zeka Ayarları: SFT ve DPO'nun Gizemli Dansı

Ilgili Haberler

OpenAI'dan Tıp Dünyasına Özel Hamle: ChatGPT Sağlık Sektörüne Adım Atıyor

Yapay Zeka Futbol Dünyasını Karıştırıyor: ChatGPT'den Sahte Maç Afişleri!

Gemini AI ile Sanal Vancouver Geziniz Gerçekçi Hale Geliyor: Fotoğraflarda Doğallığı Koruyan 6 Düzenleme

ChatGPT Cinayet Soruşturmasında: Yapay Zeka Suç Ortağı Olabilir mi?

ChatGPT'ye Gelen 'Workspace Agents': Ekipler Arası İş Birliğinde Yeni Dönem

Yapay Zeka Tedarik Zincirini Güvence Altına Alan Cloudsmith'e 72 Milyon Dolarlık Yatırım