LLM & ChatbotAkademik MakaleIngilizce

Küçük Dil Modellerinde Yapay Zeka Ayarları: SFT ve DPO'nun Gizemli Dansı

arXiv20 Mart 2026 16:27

Yapay zeka dünyasında dil modelleri, son yılların en heyecan verici gelişmelerinden biri. Ancak bu modellerin, özellikle daha küçük ölçekli olanların, istenen performansı sergilemesi için doğru ayarlamalara ihtiyaç duyuluyor. Akademik bir çalışma, bu ayarlamalardan ikisi olan Süpervizyonlu İnce Ayar (SFT) ve Doğrudan Tercih Optimizasyonu (DPO) tekniklerinin küçük dil modelleri üzerindeki etkileşimini ve parametrelerini detaylı bir şekilde inceledi.

Araştırma, GPT-2 ölçeğindeki bir dil modelini ele alarak, SFT'nin tek başına kullanımı, DPO'nun tek başına kullanımı ve bu iki tekniğin aşamalı olarak birlikte uygulanmasının sonuçlarını karşılaştırdı. Ayrıca, modelin tüm parametrelerinin ayarlanması (Full Fine-Tuning - FFT) ile daha verimli bir yöntem olan LoRA (Low-Rank Adaptation) teknikleri de değerlendirmeye alındı. Çalışma, bu yöntemlerin özellikle cümle yeniden ifade tespiti ve Shakespeare sonesi yazımı gibi görevlerdeki performansını gözler önüne serdi.

Elde edilen bulgulara göre, DPO'nun, zaten güçlü bir SFT uygulamasının ardından, görevden göreve değişen küçük ama önemli kazanımlar sağlayabildiği görüldü. Hatta bazı durumlarda DPO, rekabetçi SFT performansına ulaşabiliyor veya onu geçebiliyor. Bu durum, DPO'nun dil modellerini insan tercihleriyle daha iyi hizalamadaki potansiyelini bir kez daha kanıtlıyor. Ancak, DPO'nun her zaman mucizevi sonuçlar yaratmadığı, özellikle sınırlı veri setleri ve küçük modellerle çalışırken dikkatli bir optimizasyon gerektirdiği de vurgulandı.

Bu çalışma, yapay zeka geliştiricileri için önemli çıkarımlar sunuyor. Küçük dil modelleri üzerinde çalışırken SFT ve DPO'nun doğru kombinasyonunu ve uygulama sırasını bulmak, hem performans artışı hem de kaynak verimliliği açısından kritik önem taşıyor. Özellikle DPO'nun, mevcut SFT temelleri üzerine inşa edildiğinde ne kadar değerli olabileceği, ancak tek başına bir çözüm olmaktan ziyade, iyi tasarlanmış bir ince ayar stratejisinin parçası olarak düşünülmesi gerektiği anlaşılıyor. Bu tür araştırmalar, daha verimli ve yetenekli yapay zeka modelleri geliştirmemize ışık tutmaya devam edecek.

Orijinal Baslik

An Empirical Study of SFT-DPO Interaction and Parameterization in Small Language Models

Bu haberi paylas

OpenAI'dan Tıp Dünyasına Özel Hamle: ChatGPT Sağlık Sektörüne Adım Atıyor

OpenAI, sağlık profesyonellerine yönelik özel bir ChatGPT sürümünü tanıttı. Bu yeni yapay zeka aracı, doktorlar, hemşireler ve eczacılar gibi sağlık çalışanlarının iş yükünü hafifletmeyi hedefliyor.

Presse-citron16 gun once

Yapay Zeka Futbol Dünyasını Karıştırıyor: ChatGPT'den Sahte Maç Afişleri!

OpenAI'ın ChatGPT Images platformu, ilk çıktığında Ghibli tarzı görsellerle büyük beğeni toplamıştı. Ancak şimdi yapay zeka, futbol maçları için gerçekçi görünen ancak tamamen uydurma afişler üreterek gündem oldu.

Numerama16 gun once

Gemini AI ile Sanal Vancouver Geziniz Gerçekçi Hale Geliyor: Fotoğraflarda Doğallığı Koruyan 6 Düzenleme

Google'ın yapay zeka modeli Gemini, sanal Vancouver seyahat fotoğraflarını gerçekçi kılmak için kullanılıyor. Bu yöntem, yapay zekanın görsel içerik üretiminde doğallığı koruma yeteneğini gözler önüne seriyor.

Qoo Media16 gun once

ChatGPT Cinayet Soruşturmasında: Yapay Zeka Suç Ortağı Olabilir mi?

Florida'da yaşanan bir silahlı saldırı öncesinde zanlının ChatGPT'ye danıştığının ortaya çıkması, yapay zekanın etik ve hukuki sorumlulukları üzerine ciddi tartışmaları başlattı. Yetkililer, bu olayı derinlemesine araştırıyor.

The Daily Aus16 gun once

ChatGPT'ye Gelen 'Workspace Agents': Ekipler Arası İş Birliğinde Yeni Dönem

OpenAI, ChatGPT'ye entegre ettiği 'Workspace Agents' özelliğiyle, yapay zeka destekli asistanların ekip çalışmalarında daha aktif rol almasını sağlıyor. Bu yenilik, dosyalar, kodlar ve bulut araçları gibi çeşitli platformlarda iş birliğini kolaylaştıracak.

Teknoblog16 gun once

Yapay Zeka Tedarik Zincirini Güvence Altına Alan Cloudsmith'e 72 Milyon Dolarlık Yatırım

Yapay zeka yazılım tedarik zincirinin güvenliğini sağlamayı hedefleyen Cloudsmith, Series C turunda 72 milyon dolarlık önemli bir yatırım aldı. Bu finansman, yapay zeka projelerinin güvenilirliğini ve bütünlüğünü artırma yolunda kritik bir adım olarak görülüyor.

TradingView16 gun once