Dr. Mehmet Solak Siirt Üniversitesi · Ziraat Fakültesi · Biyosistem Mühendisliği · Tarım ve Tarımsal Eğitim İçin Makine Öğrenmesi İçeriği

Evrişimli Sinir Ağları (CNN'ler)

deep-learningcomputer-visionimage-classificationfeature-extraction

Evrişimli Sinir Ağları, tarımda görüntü tabanlı görevler için temel derin öğrenme mimarisidir. Ham piksel verilerinden hiyerarşik uzamsal özellikleri otomatik olarak öğrenme yetenekleri, bu ağları bitki hastalığı tespiti, yabancı ot tanıma, meyve sayımı ve arazi örtüsü sınıflandırması gibi uygulamalarda baskın yaklaşım haline getirmiştir.

Mimari Temeller

Bir CNN, görüntüleri artan soyutlama düzeylerinde özellikleri aşamalı olarak çıkaran katman dizisi üzerinden işler:

  • Evrişim katmanları (Convolutional layers): Öğrenilmiş filtreleri (çekirdekleri) girdi üzerinde uygulayarak kenarları, dokuları, şekilleri ve nihayetinde yaprak lezyonları veya böcek gövdeleri gibi karmaşık yapıları tespit eder.
  • Havuzlama katmanları (Pooling layers): (maksimum veya ortalama havuzlama) En belirgin özellikleri koruyarak uzamsal boyutları küçültür ve öteleme değişmezliği sağlar.
  • Tam bağlı katmanlar (Fully connected layers): Sonda yer alan bu katmanlar, çıkarılan özellik temsillerini çıktı sınıflarına veya regresyon değerlerine eşler.

Temel kavrayış, parametre paylaşımıdır: aynı filtre tüm görüntü üzerinde taranarak, tam bağlı ağlara kıyasla öğrenilebilir parametre sayısını büyük ölçüde azaltır ve modelin örüntüleri görüntüdeki konumlarından bağımsız olarak tespit etmesini sağlar.

Tarımda Kullanılan Başlıca CNN Varyantları

VGG-16/19, küçük (3x3) evrişim filtrelerinin derin katmanlar halinde istiflenme ilkesini ortaya koymuştur. Günümüzde hesaplama açısından ağır kabul edilse de VGG, basitliği sayesinde tarımsal çalışmalarda popüler bir özellik çıkarıcı omurga olmaya devam etmektedir.

ResNet (50, 101, 152), atlama bağlantıları (artık öğrenme / residual learning) aracılığıyla kaybolan gradyan problemini çözerek çok daha derin ağların eğitilmesini mümkün kılmıştır. ResNet, özellikle bitki hastalığı sınıflandırmasında tarımsal derin öğrenme araştırmalarında tartışmasız en yaygın kullanılan omurgadır.

InceptionV3, aynı katman içinde farklı çekirdek boyutlarında paralel evrişimler kullanarak çok ölçekli özellikleri eş zamanlı olarak yakalar. Bu özellik, ilgili belirtilerin (örneğin hastalık lekeleri) birden fazla ölçekte var olduğu tarımsal görüntüler için değerlidir.

EfficientNet, ağ derinliği, genişliği ve çözünürlüğünü dengelemek için bileşik ölçekleme uygulayarak çok daha az parametreyle en ileri düzey doğruluk elde eder. EfficientNet-B0'dan B7'ye kadar olan versiyonlar, tarımsal dağıtım için pratik bir doğruluk-verimlilik dengelemesi sunar.

MobileNet ve MobileNetV2, hesaplamayı en aza indirmek için derinlemesine ayrılabilir evrişimler (depthwise separable convolutions) kullanır ve bu da onları akıllı telefonlar, dronlar ve sahada kullanılan gömülü cihazlarda Edge Computing dağıtımı için ideal adaylar haline getirir.

Tarımsal Uygulamalar

Hastalık Tespiti: CNN'ler yaprak görüntülerini sağlıklı veya hastalıklı olarak sınıflandırır ve çoğu zaman birden fazla hastalık türünü ayırt eder. PlantVillage veri seti bu alana ivme kazandırmış ve CNN'lerin kontrollü görüntülerde %99'un üzerinde doğruluk elde edebildiğini göstermiştir -- ancak tarla koşullarındaki performans hâlâ açık bir araştırma sorusudur.

Yabancı Ot Tanıma: Fide aşamasında kültür bitkilerini yabancı otlardan ayırt etmek, hassas herbisit uygulamasını mümkün kılar. CNN'ler, traktörlere monte edilmiş kameralardan alınan yukarıdan aşağıya görüntüleri veya İHA'lardaki Object Detection hatlarını işler.

Ürün Sınıflandırma: CNN'ler tarafından sınıflandırılan uydu ve İHA görüntüleri, büyük ölçekli ürün tipi haritalamayı mümkün kılarak tarımsal sayım, sigorta ve sübvansiyon programlarını destekler.

Meyve Sayımı ve Kalite Derecelendirme: CNN'ler, Object Detection çerçeveleriyle birleştirildiğinde ağaçlardaki meyveleri verim tahmini için sayar ve hasat edilmiş ürünleri boyut, renk ve kusur varlığına göre sıralar.

Transfer Öğrenme Bağlantısı

CNN'leri sıfırdan eğitmek büyük etiketli veri setleri gerektirir -- tarımda nadiren bulunan bir lüks. Bu nedenle ImageNet üzerinde önceden eğitilmiş modellerden Transfer Learning standart uygulama haline gelmiştir. Önceden eğitilmiş bir ResNet veya EfficientNet, birkaç yüz ile birkaç bin tarımsal görüntü üzerinde ince ayar yapılarak veri gereksinimleri ve eğitim süresi önemli ölçüde azaltılırken güçlü performans korunur.

Sınırlılıklar

CNN'ler, eğitim koşullarından önemli ölçüde farklı görüntülerde (aydınlatma, arka plan, kamera açısı) zorlanır. Tarla değişkenliği boyunca genelleme yapabilmeleri için dikkatli Data Augmentation uygulaması gerekir. Yerel örüntüler yerine genel bağlam gerektiren görevlerde Transformer Architectures rekabetçi alternatifler olarak öne çıkmaktadır.

Ingest Edilen Makalelerden Bulgular

[Carpenter et al., 2006] — CellProfiler, hücre fenotiplerini tanımlamak ve nicelleştirmek için geliştirilen ilk ücretsiz, açık kaynaklı yüksek verimli görüntü analiz yazılımıdır. Yazılım, mikroskop görüntülerinden hücre başına yüzlerce ölçüm (yoğunluk, doku, lokalizasyon, şekil, boyut) otomatik olarak çıkarır. Modüler boru hattı mimarisi, kullanıcıların programlama bilgisi gerektirmeden görüntü analiz iş akışları oluşturmasını sağlar. Temel katkılar: (i) insan gözlemcilerin yalnızca birkaç özelliği puanlayabildiği yerde, otomatik görüntü sitometrisi eş zamanlı olarak çok sayıda hücresel özellik ölçer; (ii) nicel ölçümler, DNA boyama yoğunluğundaki iki katlık fark (G1 vs. G2 fazı) veya çekirdek boyutundaki %10'luk değişim gibi insan gözüyle algılanamayan farklılıkları tespit eder; (iii) tekil hücre düzeyinde ölçüm, tüm popülasyon ortalamasına dayalı yöntemlerden (Western blot, mRNA çip) çok daha güçlü gen kümeleme ve hastalık teşhisi sağlar. CellProfiler, tarımsal bağlamda bitki hücre fenotiplemesi ve yüksek verimli tarama deneyleri için temel görüntü analiz altyapısı oluşturmuştur. (5.420 atıf)

[Al Sahili & Awad, 2022] — AgriNet: Tarımsal uygulamalar için alana özgü önceden eğitilmiş CNN modelleri. 19 farklı coğrafi lokasyondan toplanan 160.000 görüntü ve 423 sınıftan oluşan AgriNet veri seti oluşturulmuştur. Beş ImageNet mimarisi (VGG16, VGG19, InceptionV3, InceptionResNetV2, Xception) bu veri seti üzerinde önceden eğitilerek tarıma özgü önceden eğitilmiş modeller üretilmiştir. Sonuçlar: AgriNet-VGG19 en yüksek sınıflandırma doğruluğunu (%94) ve F1 skorunu (%92) elde etmiştir. Tüm modeller 423 sınıfı minimum %87 doğrulukla sınıflandırmıştır. Harici veri setlerinde (Bangladeş zararlı veri seti, Keşmir bitki hastalıkları veri seti) AgriNet modelleri, ImageNet modellerinden daha güçlü sonuçlar raporlamıştır. Bu çalışma, tarıma özgü önceden eğitilmiş CNN omurgalarının bazı veri kümelerinde alan farkını azaltarak transfer öğrenme performansına katkı sağlayabileceğini düşündürmektedir.