Üretici Çekişmeli Ağlar (GAN'lar)

deep-learninggenerative-modelsdata-augmentationsynthetic-dataimage-generation

Üretici Çekişmeli Ağlar, rekabet halinde eğitilen iki sinir ağı aracılığıyla gerçekçi sentetik veri üretmeyi öğrenir: sahte örnekler üreten bir üretici (generator) ve gerçek ile sahte olanları ayırt etmeye çalışan bir ayırıcı (discriminator). Tarımda GAN'lar, alanın en kalıcı sorunlarından biri olan veri kıtlığını ele alarak hastalıklı bitkilerin, çeşitli tarla koşullarının ve yüksek çözünürlüklü uzaktan algılama verilerinin gerçekçi eğitim görüntülerini sentezler.

Mimari Temeller

GAN çerçevesi şunlardan oluşur:

Üretici (Generator - G): Rastgele gürültüyü girdi olarak alır ve sentetik veri üretir (örn. hastalıklı bir yaprak görüntüsü). Üretici, gizli uzaydan veri dağılımına bir eşleme öğrenir.
Ayırıcı (Discriminator - D): Hem gerçek hem de üretilmiş örnekleri alır ve girdinin gerçek olma olasılığını çıktılar. Otantik ile sentetik veriyi ayırt etmeyi öğrenir.

Eğitim bir minimax oyunu olarak ilerler: üretici gerçekçi örnekler üretmede gelişirken, ayırıcı sahteleri tespit etmede gelişir. Yakınsama noktasında üretici, gerçek veriden ayırt edilemez örnekler üretir.

Tarım İçin Önemli GAN Varyantları

StyleGAN / StyleGAN2: Görsel nitelikler üzerinde kontrol sağlayarak (stil karıştırma) yüksek kaliteli, yüksek çözünürlüklü görüntüler üretir. Tarımda StyleGAN, kontrol edilebilir hastalık şiddeti düzeylerine sahip sentetik yaprak görüntüleri üretmek için kullanılmış olup gerçek veri setlerinde nadir bulunan hastalık evreleri için eğitim verisi oluşturmayı mümkün kılar.

CycleGAN: Eşleştirilmiş örnekler gerektirmeden iki alan arasında eşleştirilmemiş görüntüden görüntüye çeviri gerçekleştirir. Tarımsal uygulamalar arasında sağlıklı yaprak görüntülerini hastalıklı versiyonlara dönüştürme, drone görüntülerini mevsimler arasında çevirme ve tek bir çekim koşulundan farklı hava/aydınlatma koşullarını simüle etme yer alır.

Pix2Pix: Eşleştirilmiş giriş-çıkış görüntü çiftleri gerektiren eşleştirilmiş görüntüden görüntüye çeviri gerçekleştirir. Bölütleme maskelerinden gerçekçi tarla görüntülerine dönüştürme, NIR görüntülerini sahte renkli kompozitlere çevirme ve anlamsal düzenlerden gerçekçi bitki görüntüleri üretme için kullanılır.

DCGAN (Derin Evrişimli GAN / Deep Convolutional GAN): Temel evrişimli GAN mimarisi olup basitliği ve kararlılığı nedeniyle tarımsal veri artırma deneylerinde sıklıkla başlangıç noktası olarak kullanılır.

WGAN / WGAN-GP: Daha kararlı eğitim için Jensen-Shannon uzaklığı yerine Wasserstein mesafesini kullanır. Gradyan cezası varyantı (WGAN-GP), mod çöküşü (mode collapse) riskinin yüksek olduğu küçük tarımsal veri setlerinde eğitim için tercih edilir.

Tarımsal Uygulamalar

Sentetik Hastalıklı Yaprak Üretimi: En yaygın tarımsal GAN uygulamasıdır. Bir veri seti bol miktarda sağlıklı görüntü içerip hastalıklı örnekler az olduğunda (sınıf dengesizliği), GAN'lar eğitim setini dengelemek için sentetik hastalıklı görüntüler üretir. Bu yaklaşım domates, elma, narenciye, buğday ve pirinçteki hastalıklar için gösterilmiştir.

Hava Durumu ve Aydınlatma Simülasyonu: CycleGAN, bir koşul seti altında (örn. açık gökyüzü, öğle aydınlatması) çekilen görüntüleri farklı koşulları (bulutlu, sabah/akşam, yağmurlu) simüle etmek için dönüştürür. Bu, değişken koşullarda çalışması gereken modeller için eğitim verisi çeşitliliğini etkili biçimde genişletir.

Uydu Görüntülerinde Süper Çözünürlük: GAN'lar düşük çözünürlüklü uydu görüntülerini (örn. 10m/piksel Sentinel-2) ölçeklendirerek daha yüksek çözünürlüklü çıktılar üretir; bu sayede ticari yüksek çözünürlüklü görüntülerin maliyeti olmadan daha ince taneli tarımsal analiz mümkün olur. SRGAN ve ESRGAN mimarileri yaygın olarak kullanılmaktadır.

Sentetik Tarla Sahne Üretimi: Object Detection ve Semantic Segmentation modellerinin eğitimi için tarla veri toplama işleminin pratik olmadığı veya pahalı olduğu durumlarda eksiksiz sentetik tarımsal sahneler (ürün sıraları, yabancı otlar, toprak) üretilmesi.

Fenotip Simülasyonu: Otomatik fenotipleme için gelişim evrelerine yayılmış sentetik bitki görüntülerinin üretilmesi; kontrollü koşullar altında tüm büyüme evrelerinin yakalanmasının zaman alıcı olduğu durumlarda kullanılır.

Zorluklar ve Sınırlılıklar

Eğitim Kararsızlığı: GAN'lar eğitilmesi zor olmasıyla bilinir; mod çöküşü (üreticinin sınırlı çeşitlilik üretmesi), kaybolan gradyanlar ve eğitim salınımı gibi sorunlardan muzdariptir. Küçük ve dengesiz tarımsal veri setleri bu sorunları daha da ağırlaştırır.

Kalite Doğrulama: Üretilen görüntülerin alt akış model performansını iyileştirecek kadar gerçekçi olup olmadığının değerlendirilmesi dikkatli bir inceleme gerektirir. FID (Frechet Inception Distance) puanları dağılım benzerliğini ölçer, ancak tarım uzmanları tarafından yapılan alana özgü doğrulama da önemlidir.

Artefaktlar ve Yanlılık: Üretilen görüntüler, insanlara görünmez ancak sınıflandırıcılar tarafından tespit edilebilir ince artefaktlar içerebilir ve potansiyel olarak yanlılıklar ortaya çıkarabilir. Büyük ölçüde GAN üretimi verilerle eğitilen modeller, gerçek tarımsal özellikler yerine bu artefaktlara güvenmeyi öğrenebilir.

GAN tabanlı artırma, geleneksel Data Augmentation teknikleriyle birlikte kullanıldığında en etkilidir. Geometrik dönüşümler, renk bozulması ve GAN üretimi örneklerin kombinasyonu, en sağlam eğitim verisi çeşitliliğini sağlar.

Ingest Edilen Makalelerden Bulgular

Wu et al., 2020 — Domates yaprak hastalığı tanımlama için DCGAN tabanlı veri artırma. 5 sınıf domates yaprak görüntüsü üzerinde DCGAN ile sentetik görüntüler üretilmiş ve GoogLeNet sınıflandırıcısına girdi olarak kullanılmıştır. Temel bulgular:

DCGAN ile artırılmış veri seti kullanılarak eğitilen model, top-1 ortalama tanıma doğruluğu olarak %94,33 elde etmiştir.
t-SNE görselleştirmesi ve Visual Turing Test ile DCGAN tarafından üretilen görüntülerin gerçek görüntülere yüksek derecede benzer olduğu doğrulanmıştır.
DCGAN'ın geleneksel artırma yöntemlerine (döndürme, çevirme, öteleme) kıyasla veri setinin çeşitliliğini artırarak modelin genelleme yeteneğini iyileştirdiği gösterilmiştir.
Veri toplama maliyetini azaltırken, büyük sinir ağlarının eğitimi için yeterli büyüklükte veri seti sağladığı belirlenmiştir.

Zeng et al., 2020 — Narenciye Huanglongbing (HLB) hastalık şiddeti tespiti için GAN tabanlı veri artırma. PlantVillage ve crowdAI'den elde edilen 5.406 narenciye yaprak görüntüsü kullanılmıştır. Temel bulgular:

6 farklı derin öğrenme modeli karşılaştırılmış; Inception_v3, 60 epoch ile %74,38 doğruluk ile en yüksek başarıyı göstermiştir.
DCGAN ile orijinal eğitim setinin 2 katına çıkarılmasıyla (14.056 görüntü) Inception_v3 doğruluğu %92,60'a yükselmiştir -- yaklaşık %20'lik dramatik bir iyileşme.
GAN tabanlı veri artırmanın özellikle hastalık şiddeti tespiti gibi ince taneli sınıflandırma görevlerinde model performansını önemli ölçüde artırdığı kanıtlanmıştır.