Alan Farkı (Domain Gap)
Diğer adları: Domain Gap, Domain Shift, Alan Kayması, Dağılım Farkı
Kısa Tanım
Alan farkı, bir makine öğrenmesi modelinin eğitildiği kaynak alan (source domain) ile uygulandığı hedef alan (target domain) arasındaki veri dağılımı farklılığını ifade eder. Bu fark, modelin hedef alandaki genelleme performansını sistematik biçimde düşürür.
Teknik Mantık
Matematiksel olarak kaynak dağılımı Ps(X, Y) ile hedef dağılımı Pt(X, Y) arasındaki uzaklıkla ölçülür. Kovaryat kayması (covariate shift) durumunda Ps(X) ≠ Pt(X) iken P(Y|X) korunur; etiket kayması (label shift) ve kavram kayması (concept drift) gibi alt türleri de mevcuttur. Maximum Mean Discrepancy (MMD), A-distance ve Frechet Inception Distance (FID) gibi metrikler alan farkını nicelleştirir. Alan uyarlama (domain adaptation) yöntemleri bu farkı minimize etmeyi amaçlar; adversarial eğitim, moment eşleme ve self-training başlıca stratejilerdir.
Kullanım Bağlamı
Eğitim ve dağıtım (deployment) ortamları arasında sistematik farklar olduğunda kritik hale gelir. Transfer öğrenme, alan uyarlama ve alan genelleştirme (domain generalization) tekniklerinin motivasyon kaynağıdır.
Tarımsal Bağlam
Tarımda alan farkı, laboratuvar ortamında çekilen yaprak görüntüleri ile tarla koşullarındaki görüntüler, farklı mevsimler veya coğrafyalardaki uydu verileri, farklı sensör modelleri (drone kamerası vs. uydu sensörü) arasında belirgin biçimde ortaya çıkar. Bir bölgede eğitilmiş verim tahmin modelinin başka bir iklim kuşağında doğrudan kullanılması tipik bir alan farkı senaryosudur.
Sık Karıştırılan Nokta
Alan farkı yalnızca görsel farklılıklarla (aydınlatma, arka plan) sınırlı değildir. Öznitelik dağılımındaki istatistiksel kayma, sınıf oranlarındaki dengesizlik ve etiketleme kriterlerindeki tutarsızlık da alan farkının bileşenleridir. Bu nedenle yalnızca görsel veri artırma ile alan farkı kapatılamaz; dağılım düzeyinde uyarlama stratejileri gerekir.
Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği