LLM & ChatbotAkademik MakaleIngilizce

IndicSafe: Güney Asya'da Çok Dilli Büyük Dil Modeli Güvenliğini Değerlendirmek İçin Bir Kıyaslama Aracı

arXiv18 Mart 2026 16:54

Büyük dil modelleri (LLM'ler) çok dilli ortamlarda kullanıldıkça, kültürel olarak çeşitli, düşük kaynaklı dillerdeki güvenlik davranışları yeterince anlaşılamamıştır. 1,2 milyardan fazla insan tarafından konuşulan ancak büyük dil modeli eğitim verilerinde yeterince temsil edilmeyen 12 Hint dilinde büyük dil modeli güvenliğinin ilk sistematik değerlendirmesini sunuyoruz. Kast, din, cinsiyet, sağlık ve siyaset gibi konuları kapsayan 6.000 kültürel temelli istemden oluşan bir veri kümesi kullanarak, önde gelen 10 büyük dil modelini istemin çevrilmiş varyantları üzerinde değerlendiriyoruz. ...

Orijinal Baslik

IndicSafe: A Benchmark for Evaluating Multilingual LLM Safety in South Asia