Veri Artırma (Data Augmentation)

data-preprocessingtrainingimage-transformssynthetic-dataclass-imbalance

Veri artırma, mevcut örneklere dönüşümler uygulayarak eğitim veri setlerini yapay olarak genişletir; etiketi koruyarak görsel çeşitliliği artıran değiştirilmiş versiyonlar oluşturur. Tarımda, etiketli verinin kıt ve pahalı olduğu koşullarda artırma yalnızca bir performans artırıcı değildir -- yüz binlerce yerine yüzlerce görüntüyle derin öğrenmeyi uygulanabilir kılan bir hayatta kalma stratejisidir.

Artırmanın Tarım İçin Kritik Önemi

Tarımsal veri setleri, derin öğrenme standartlarına göre küçüktür. Etiketleme, alan uzmanları (bitki patologları, entomologlar) gerektirir ve tarla koşulları mevsimler, bölgeler ve hava durumuna göre büyük farklılıklar gösterir. 500 laboratuvar görüntüsüyle eğitilen bir hastalık sınıflandırıcısı, artırma ile modelin dağıtımda karşılaşacağı değişkenliği simüle etmezse tarlada başarısız olacaktır.

Artırmanın ele aldığı temel zorluklar: - Küçük etiketli veri setleri: Tarımsal görüntü veri setlerinin çoğu 1.000-10.000 görüntü içerir; derin ağların ihtiyaç duyduğunun çok altında. - Sınıf dengesizliği: Hastalıklı örnekler sağlıklı olanlardan daha nadir; belirli zararlı türleri yaygın değildir. Azınlık sınıflarının artırılması eğitimi dengelemeye yardımcı olur. - Alan farkı (Domain gap): Laboratuvarda toplanan görüntüler, aydınlatma, arka plan, açı ve örtüşme bakımından tarla görüntülerinden farklıdır. Artırma bu farkı kapatır.

Geometrik Dönüşümler

Yatay ve dikey çevirme (flipping), bilgi kaybı olmadan etkin veri seti boyutunu ikiye katlar; çünkü bitki yönelimi sınıflandırma için genellikle önemsizdir. En basit ve en evrensel olarak uygulanan artırma tekniğidir.

Rastgele döndürme (rotation) (0-360 derece), modele yön değişmezliği öğretir. Ürün ve yabancı ot yöneliminin rastgele olduğu yukarıdan aşağıya İHA görüntüleri için özellikle önemlidir.

Rastgele kırpma ve yeniden boyutlandırma, modeli farklı ölçeklerde ve kısmi görünürlükte nesneleri tanımaya zorlar; tarla fotoğrafçılığının değişkenliğini simüle eder.

Afin dönüşümler (kayma, öteleme, ölçekleme), farklı kamera açılarını ve mesafelerini taklit eden perspektif varyasyonları ortaya çıkarır.

Elastik deformasyonlar, yaprak şekli ve eğrilikdeki doğal biyolojik varyasyonu simüle ederek görüntüyü hafifçe büker.

Fotometrik Dönüşümler

Parlaklık ve kontrast ayarı, değişen aydınlatma koşullarını simüle eder -- bulutlu/güneşli, sabah/öğle, gölge/doğrudan ışık.

Renk bozulması (color jittering) (renk tonu, doygunluk, değer kaymaları), kameralar ve aydınlatma koşulları arasındaki beyaz dengesi varyasyonlarını hesaba katar. Eğitim verisinin bir kameradan geldiği ancak dağıtımın başka bir kamera kullandığı durumlarda kritiktir.

Gauss gürültüsü ve bulanıklaştırma, sensör gürültüsünü ve odaklama bozukluğunu simüle ederek modeli tarlada kusurlu görüntü yakalamaya karşı dayanıklı kılar.

Rastgele silme / Cutout, görüntünün dikdörtgen bölgelerini maskeleyerek modeli tek bir ayırt edici bölgeye değil birden fazla özelliğe güvenmeye zorlar. Bu, belirli yerel örüntülere aşırı uyumu azaltır.

İleri Artırma Teknikleri

Mixup, görüntü çiftlerini ve etiketlerini doğrusal olarak enterpolasyon yaparak yeni eğitim örnekleri oluşturur. Farklı hastalıklara sahip iki yaprak görüntüsü için Mixup, her iki hastalığı yansıtan yumuşak etiketli karışık bir görüntü üretir. Bu düzenlileştirme tekniği karar sınırını yumuşatır ve aşırı güvenli tahminleri azaltır.

CutMix, bir görüntünün dikdörtgen bir bölgesini başka bir görüntüden bir bölgeyle değiştirir ve etiketleri orantılı olarak birleştirir. CutMix, modeli tek bir ayırt edici alana odaklanmak yerine görüntünün tüm bölgelerine dikkat etmeye zorlar.

Mozaik artırma (Mosaic augmentation) (YOLOv4/v5/v8'de kullanılan), dört eğitim görüntüsünü tek bir kompozit görüntüde birleştirerek zengin bağlam sağlar ve Object Detection modelini çeşitli ölçekleri ve arka planları aynı anda ele almaya zorlar.

AutoAugment ve RandAugment, belirli bir veri seti için optimal artırma politikasını otomatik arama (veya rastgele örnekleme) ile bulur; manuel artırma stratejisi tasarımı ihtiyacını ortadan kaldırır.

Sentetik Veri Üretimi

Geometrik ve fotometrik dönüşümlerin ötesinde, sentetik veri üretimi tamamen yeni eğitim örnekleri oluşturur:

Generative Adversarial Networks, hastalıklı yaprakların, zararlı istilasına uğramış bitkilerin veya çeşitli tarla koşullarının foto-gerçekçi sentetik görüntülerini üretir. GAN'lar, tarlada toplanması zor olan nadir sınıfların üretilmesinde özellikle değerlidir.

Simülasyon motorları, kontrollü parametrelerle (bitki aralığı, büyüme evresi, aydınlatma, toprak tipi) sentetik tarımsal sahneler render eder. Bu parametreler üzerinde alan rastgeleleştirmesi, Object Detection ve Semantic Segmentation modelleri için çeşitli eğitim verileri üretir.

Kopyala-yapıştır artırma (Copy-paste augmentation), nesneleri (böcekler, hastalık lezyonları, meyveler) kaynak görüntülerden çıkarır ve hassas etiketlemelerle yeni arka planlara yapıştırarak gerçekçi kompozit sahneler oluşturur.

Farklı Görevler İçin Artırma

Görev	Temel Artırmalar
Görüntü sınıflandırma	Çevirme, döndürme, renk bozulması, Mixup, CutMix
Nesne tespiti	Mozaik, rastgele kırpma, ölçek varyasyonu, fotometrik dönüşümler
Anlamsal bölütleme	Aynı dönüşümler hem görüntüye hem de maskeye eş zamanlı uygulanır
Zaman serisi	Gauss gürültüsü, zaman bükme, pencere dilimleme, büyüklük ölçekleme

En İyi Uygulamalar

Artırma, gerçek dünya değişkenliğini simüle etmeli, gerçekçi olmayan bozulmalar ortaya çıkarmamalıdır. Aşırı agresif artırma (her zaman tutarlı yönelime sahip görüntülerde aşırı döndürmeler, doğal olmayan renk kaymaları) performansı düşürebilir. Artırma stratejisi, ablasyon çalışmalarıyla doğrulanmalıdır -- her dönüşümün etkisini ölçmek için sistematik olarak etkinleştirme ve devre dışı bırakma. Geleneksel artırmanın önceden eğitilmiş modellerden Transfer Learning ile birleştirilmesi, küçük tarımsal veri setlerinde en büyük faydayı sağlar.

Ingest Edilen Makalelerden Bulgular

Zou et al., 2024 — Tarla tarımı için derin öğrenme görüntü artırma yöntemi. Karmaşık tarla fotoğraflarında etiketleme iş yükünü azaltmak amacıyla sentetik görüntü tabanlı bir artırma yöntemi önerilmiştir. Temel bulgular:

Sentetik görüntüler üç bileşenden oluşturulmuştur: kültür bitkisi, yabancı ot ve toprak. Kültür bitkisi ve yabancı otlar, Excess Green (ExG) indeksi ve minimum hata eşik bölütlemesi ile otomatik olarak elde edilmiştir.
Yöntem üç farklı görevde test edilmiştir: ResNet ile sınıflandırmada doğruluk 0,99; YOLOv5 ile nesne tespitinde IoU 0,98; DeepLabV3 ile anlamsal bölütlemede IoU 0,96 elde edilmiştir.
Hafif bir aşırı uyum gözlemlenmesine rağmen, yöntem görüntü etiketleme iş yükünü önemli ölçüde azaltmıştır.
Tarla görüntülerinin kendine özgü özelliklerine (bitki-toprak kontrastı) dayalı bu yaklaşım, pahalı manuel etiketleme gereksinimine pratik bir alternatif sunmaktadır.

Ramadan et al., 2024 — Sınırlı veri seti ile buğday yaprak hastalığı sınıflandırmasının iyileştirilmesi: artırma stratejileri ve CNN modelleri değerlendirmesi. CycleGAN, SMOTE, SMOTETomek ve ADASYN dahil çeşitli artırma teknikleri karşılaştırılmıştır. Temel bulgular:

CycleGAN, tüm artırma teknikleri arasında en etkili yöntem olarak belirlenmiş; DenseNet121, ResNet50V2, DenseNet169, Xception, ResNet152V2 ve MobileNetV2 sınıflandırıcılarının performansını artırmıştır.
MobileNetV2 modeli, hem CycleGAN hem de ADASYN artırılmış veri setlerinde %100 doğruluk elde etmiştir.
Confusion matrix analizi, test veri seti üzerinde yalnızca 0 ile 3 arasında yanlış sınıflandırılmış görüntü olduğunu ortaya koymuştur.
ADASYN da sınıflandırma doğruluğunu önemli ölçüde iyileştirmiş; sınırlı veri setleri ve sınıf dengesizliği sorunlarının üstesinden gelmekte etkili olmuştur.
Sonuçlar, Generative Adversarial Networks tabanlı artırmanın (CycleGAN), geleneksel örnekleme tekniklerinden (SMOTE) daha güçlü performans artışı sağladığını göstermektedir.