LLM & ChatbotAkademik MakaleIngilizce

Küçük Dil Modellerinde Yapay Zeka Ayarları: SFT ve DPO'nun Gizemli Dansı

arXiv20 Mart 2026 16:27

Yapay zeka dünyasında dil modelleri, son yılların en heyecan verici gelişmelerinden biri. Ancak bu modellerin, özellikle daha küçük ölçekli olanların, istenen performansı sergilemesi için doğru ayarlamalara ihtiyaç duyuluyor. Akademik bir çalışma, bu ayarlamalardan ikisi olan Süpervizyonlu İnce Ayar (SFT) ve Doğrudan Tercih Optimizasyonu (DPO) tekniklerinin küçük dil modelleri üzerindeki etkileşimini ve parametrelerini detaylı bir şekilde inceledi.

Araştırma, GPT-2 ölçeğindeki bir dil modelini ele alarak, SFT'nin tek başına kullanımı, DPO'nun tek başına kullanımı ve bu iki tekniğin aşamalı olarak birlikte uygulanmasının sonuçlarını karşılaştırdı. Ayrıca, modelin tüm parametrelerinin ayarlanması (Full Fine-Tuning - FFT) ile daha verimli bir yöntem olan LoRA (Low-Rank Adaptation) teknikleri de değerlendirmeye alındı. Çalışma, bu yöntemlerin özellikle cümle yeniden ifade tespiti ve Shakespeare sonesi yazımı gibi görevlerdeki performansını gözler önüne serdi.

Elde edilen bulgulara göre, DPO'nun, zaten güçlü bir SFT uygulamasının ardından, görevden göreve değişen küçük ama önemli kazanımlar sağlayabildiği görüldü. Hatta bazı durumlarda DPO, rekabetçi SFT performansına ulaşabiliyor veya onu geçebiliyor. Bu durum, DPO'nun dil modellerini insan tercihleriyle daha iyi hizalamadaki potansiyelini bir kez daha kanıtlıyor. Ancak, DPO'nun her zaman mucizevi sonuçlar yaratmadığı, özellikle sınırlı veri setleri ve küçük modellerle çalışırken dikkatli bir optimizasyon gerektirdiği de vurgulandı.

Bu çalışma, yapay zeka geliştiricileri için önemli çıkarımlar sunuyor. Küçük dil modelleri üzerinde çalışırken SFT ve DPO'nun doğru kombinasyonunu ve uygulama sırasını bulmak, hem performans artışı hem de kaynak verimliliği açısından kritik önem taşıyor. Özellikle DPO'nun, mevcut SFT temelleri üzerine inşa edildiğinde ne kadar değerli olabileceği, ancak tek başına bir çözüm olmaktan ziyade, iyi tasarlanmış bir ince ayar stratejisinin parçası olarak düşünülmesi gerektiği anlaşılıyor. Bu tür araştırmalar, daha verimli ve yetenekli yapay zeka modelleri geliştirmemize ışık tutmaya devam edecek.

Orijinal Baslik

An Empirical Study of SFT-DPO Interaction and Parameterization in Small Language Models

Bu haberi paylas

ChatGPT'ye Büyük Telif Hakkı Davası: Britannica ve Merriam-Webster, OpenAI'a Karşı

Yapay zeka devi OpenAI, bu kez Büyük Ansiklopedi (Britannica) ve Merriam-Webster tarafından telif hakkı ihlali iddiasıyla mahkemeye verildi. Davacılar, ChatGPT'nin eğitiminde kendi içeriklerinin izinsiz kullanıldığını öne sürüyor.

36Kr2 saat once

ChatGPT'den Yeni Gelir Modeli: Ücretsiz Kullanıcılara Reklam Gösterimi Başlıyor

OpenAI, ChatGPT'nin ücretsiz sürümünü kullanan ABD'deki kullanıcılara reklam göstermeye başlayarak maliyetleri dengelemeyi hedefliyor. Bu strateji, yapay zeka hizmetlerinin ticarileşmesinde yeni bir dönemin habercisi olabilir.

ASO World2 saat once

Yerel Yönetimler İçin Yeni Risk Alanı: Yapay Zeka ve Dijital Dönüşüm

St Helens Belediyesi, yapay zeka ve dijital dönüşümün potansiyel risklerini resmi risk kayıtlarına ekleyerek yerel yönetimlerin teknolojiye adaptasyon süreçlerindeki zorluklara dikkat çekti. Bu adım, modern teknolojilerin getirdiği fırsatların yanı sıra, dikkatli yönetilmesi gereken yeni tehditleri de gözler önüne seriyor.

St Helens Star2 saat once

Google Haritalar Gemini Yapay Zekasıyla Akıllı Asistana Dönüşüyor: Navigasyon Deneyimi Yeniden Tanımlanıyor

Google Haritalar, Gemini yapay zekası entegrasyonuyla kullanıcıların konum arama ve navigasyon deneyimini kökten değiştiriyor. Artık sadece bir harita uygulaması olmaktan çıkıp, kişisel bir akıllı asistan gibi çalışacak.

The420.in2 saat once

Yapay Zekanın İkinci Dalgası Geliyor: Büyük Dil Modellerinden Yayılımcı Sistemlere Dönüşüm

ChatGPT ve Gemini gibi büyük dil modelleri yapay zeka devriminin ilk aşamasını başlattı. Şimdi ise, daha geniş ve yayılımcı yapay zeka sistemleri ikinci dalganın öncüsü olmaya hazırlanıyor.

매일경제2 saat once

Birleşik Krallık Yapay Zeka Ekosisteminde Çeşitliliğin Yükselişi: Wave ve Sinsecia'dan İlham Veren Örnekler

Birleşik Krallık'ın yapay zeka sahnesindeki iki yükselen yıldız, Wave ve Sinsecia, başarılarının ardındaki temel faktör olarak 'yetenek çeşitliliğini' vurguluyor. Bu, AI alanında kapsayıcı yaklaşımların önemini bir kez daha gözler önüne seriyor.

매일경제2 saat once