Duzenleme & EtikAkademik MakaleIngilizce

V-Co: Ortak Gürültü Azaltma Yoluyla Görsel Temsil Hizalamasına Yakından Bir Bakış

arXiv17 Mart 2026 17:01

Piksel uzayı difüzyonu, önceden eğitilmiş otoenkoderler olmadan yüksek kaliteli üretim sağlayarak, latent difüzyona güçlü bir alternatif olarak yakın zamanda yeniden ortaya çıktı. Ancak, standart piksel uzayı difüzyon modelleri nispeten zayıf semantik denetim alır ve yüksek seviyeli görsel yapıyı yakalamak için açıkça tasarlanmamıştır. Son zamanlardaki temsil hizalama yöntemleri (örneğin, REPA), önceden eğitilmiş görsel özelliklerin difüzyon eğitimini önemli ölçüde iyileştirebileceğini öne sürmektedir ve görsel ortak gürültü azaltma, bir...

Orijinal Baslik

V-Co: A Closer Look at Visual Representation Alignment via Co-Denoising