Bitki Hastalığı Tespiti (Crop Disease Detection)

computer-visioncnntransfer-learningplant-pathologymobile-deployment

Bitki hastalığı tespiti, tarımda makine öğrenmesinin en geniş uygulama alanını temsil etmekte olup, diğer tüm tarımsal makine öğrenmesi konularından daha fazla yayımlanmış araştırmaya sahiptir. Temel problem oldukça doğrudandır: bir bitkinin (yaprak, gövde, meyve) görüntüsü verildiğinde, sağlıklı mı yoksa hastalıklı mı olduğunu sınıflandırmak ve hastalıklı ise spesifik patolojiyi tanımlamak.

Tarihsel Gelişim

Geleneksel bitki hastalığı tanımlama, ağırlıklı olarak eğitimli agronomlar veya bitki patologları tarafından yapılan manuel görsel incelemeye dayanıyordu. Bu yaklaşım öznellik, sınırlı ölçeklenebilirlik ve gecikmeli yanıt süreleri gibi sorunlar barındırıyordu. 2000'lerin başındaki ilk otomasyon dalgası, klasik görüntü işleme tekniklerini kullandı -- renk histogramları, doku özellikleri (GLCM, LBP) ve şekil tanımlayıcıları SVM veya k-NN sınıflandırıcılarına beslendi. Kontrollü ortamlarda işlevsel olsa da, bu el yapımı özellik hatları kırılgan ve alana özgüydü.

AlexNet'in 2012'deki başarısından sonra derin öğrenme yaklaşımları bu alanı önemli ölçüde etkiledi. 2016 itibarıyla evrişimli sinir ağları (Convolutional Neural Networks) daha baskın bir yaklaşım haline geldi ve klasik yöntemlerle derin yöntemler arasındaki fark daha görünür oldu.

CNN Tabanlı Yaklaşımlar ve Transfer Öğrenme (Transfer Learning)

Bitki hastalığı tespitindeki en etkili metodolojik tercih, Imagenet üzerinde önceden eğitilmiş modellerden Transfer Learning uygulanması olmuştur. VGG16, ResNet-50, InceptionV3, EfficientNet ve DenseNet gibi mimariler -- başlangıçta genel nesne tanıma için tasarlanmış -- bitki hastalığı veri setleri üzerinde ince ayarlanmaktadır. Transfer öğrenme, tarımsal görüntü veri setlerinin çoğunun nispeten küçük olması (binlerden on binlere kadar görüntü) nedeniyle vazgeçilmezdir; bu boyut, derin CNN'lerin sıfırdan eğitilmesi için gereken miktarın çok altındadır.

Temel mimariler ve rolleri: - ResNet-50/101: Yönetilebilir hesaplama maliyetiyle güçlü doğruluk sunan ana iş yükü modelleri - EfficientNet: Mükemmel doğruluk-parametre oranı, mobil dağıtım için oldukça uygun - Görü Dönüştürücüleri (Vision Transformers - ViT): Özellikle daha büyük veri setlerinde rekabetçi alternatifler olarak öne çıkmakta - MobileNet / ShuffleNet: Düşük gecikmeyle cihaz üzerinde çıkarım için tasarlanmış

PlantVillage Veri Seti ve Kıyaslamalar (Benchmarks)

Yaklaşık 54.000 görüntü içeren, 14 bitki türü ve 38 hastalık sınıfını kapsayan Plantvillage veri seti, fiili standart kıyaslama haline geldi. Modeller bu veri setinde rutin olarak %95-99 doğruluk elde etmektedir. Ancak PlantVillage görüntüleri kontrollü laboratuvar koşullarında (tek yapraklar, düz arka planlar) çekildiğinden, gerçek tarla koşullarıyla önemli bir alan farkı (domain gap) bulunmaktadır.

Gerçek Dünya Zorlukları

Laboratuvar kıyaslamaları ile tarla dağıtımı arasındaki uçurum temel zorluk olmaya devam etmektedir:

Laboratuvar ve tarla görüntüleri arasındaki fark: PlantVillage üzerinde eğitilmiş modeller, karmaşık arka planlar, birden fazla yaprak, değişken yönelimler ve farklı aydınlatma koşullarıyla çekilen tarla görüntülerinde çoğu zaman ciddi şekilde başarısız olmaktadır
Eş zamanlı birden fazla hastalık: Gerçek bitkilerde sıklıkla birlikte enfeksiyonlar görülür, ancak çoğu veri seti ve model tek etiketli sınıflandırma varsaymaktadır
Hastalık şiddeti derecelendirmesi: İkili sağlıklı/hastalıklı sınıflandırma yetersizdir; çiftçilerin tedavi kararları alabilmesi için şiddet puanlarına ihtiyacı vardır
Sınıf dengesizliği: Nadir hastalıklar az sayıda eğitim örneğine sahiptir ve bu durum en çok önem taşıyan koşullarda düşük geri çağırma (recall) oranlarına yol açar
Zamansal dinamikler: Hastalık belirtileri zamanla değişir; erken evre belirtiler incedir ve besin eksiklikleri veya abiyotik stresle kolayca karıştırılabilir

Mobil Dağıtım (Mobile Deployment)

Bitki hastalığı tespitinin pratik etkisi erişilebilirliğe bağlıdır. Sıkıştırılmış modeller (nicemleme, budama veya damıtma uygulanmış) kullanan akıllı telefon tabanlı uygulamalar, çiftçilerin tarlada hastalık teşhisi yapmasına olanak tanır. TensorFlow Lite ve ONNX Runtime gibi çerçeveler, internet bağlantısı olmadan cihaz üzerinde çıkarım yapılmasını sağlar. Dağıtılmış önemli sistemler arasında PlantVillage Nuru (Sahra altı Afrika'daki manyok hastalıklarını hedefleyen) ve çeşitli ulusal tarımsal yayım hizmeti araçları bulunmaktadır.

Tipik mobil çıkarım hedefleri: orta segment akıllı telefonlarda görüntü başına 200 ms'nin altında, model boyutu 20 MB'ın altında.

Son Teknoloji ve Doğruluk (State of the Art)

Düzenli veri setlerinde en iyi modeller %99'un üzerinde doğruluk aşmaktadır. Tarla görüntüleriyle daha gerçekçi kıyaslamalarda doğruluk %80-90'a düşmektedir ki bu, pratik performansı daha iyi temsil eder. Veri setleri iyileştikçe ve alan uyarlama (domain adaptation) teknikleri olgunlaştıkça bu fark daralmaktadır.

Gelecek Yönelimler

Erken tespit: Hyperspectral Imaging veya klorofil floresansı kullanılarak görünür belirtiler ortaya çıkmadan önce hastalığın belirlenmesi
Hiperspektral ve multispektral görüntüleme: İnsan gözüne görünmez hastalık izlerini yakalamak için RGB'nin ötesine geçilmesi
Çok modlu füzyon (Multi-modal fusion): Bağlama duyarlı teşhis için görsel verilerin hava durumu, toprak nemi ve geçmiş salgın örüntüleriyle birleştirilmesi
Federe öğrenme (Federated learning): Hassas görüntüleri merkezileştirmeden dağıtık çiftlik verisi üzerinde eğitim yapılması
Temel modeller (Foundation models): Büyük önceden eğitilmiş görü-dil modellerinin (CLIP, DINOv2) minimum etiketli veriyle tarımsal alanlara uyarlanması
Uzaktan algılama entegrasyonu: UAV ve uydu görüntüleri aracılığıyla bireysel bitki teşhisinden tarla düzeyinde hastalık haritalamaya ölçekleme

Bitki hastalığı tespiti, tarımda makine öğrenmesi benimsenmesinin giriş uygulaması olmaya devam etmekte olup, her yıl bitki hastalıklarına atfedilen tahmini %10-16'lık küresel ürün kayıplarını azaltma potansiyeli taşımaktadır.

Ingest Edilen Makalelerden Bulgular

Temel (Seminal) Calismalar

[Mohanty et al., 2016] — Bitki hastalığı tespitinde derin öğrenmenin uygulanabilirligini gosteren oncul çalışma. PlantVillage veri setindeki 54.306 görüntüde (14 bitki turu, 26 hastalık, 38 sınıf), AlexNet ve GoogLeNet mimarileri karsilastirildi. En iyi sonuç GoogLeNet + Transfer Learning + Renkli görüntü kombinasyonuyla elde edildi: %99,35 genel doğruluk ve 0,9934 ortalama F1 skoru (%80-%20 eğitim-test bölünmesi). Sifirdan eğitimde bile GoogLeNet %98,36'ya ulasti. Gri tonlamali görüntülerle en düşük performans %85,53 (AlexNet, sifirdan eğitim) oldu. Önemli bulgu: eğitim verisi yalnizca %20'ye dusuruldugunde bile transfer öğrenme ile %98,21 doğruluk korundu. Ancak gerçek dunya görüntüleri (cevrimici kaynaklardan toplanan) üzerindeki doğruluk %31-48 araligina dustugu rapor edildi; bu durum laboratuvardan tarlaya gecisteki ciddi alan farkini kanitladi. (4.288 atif)

[Islam et al., 2017] — Patates hastalığı tespitinde görüntü segmentasyonu ve cok sınıfli SVM yaklasimi. PlantVillage veri setinden 300 patates yapragi görüntüsu (gec yanikligi, erken yanikligi, saglikli) kullanildi. Lab* renk uzayinda segmentasyon yapilarak arka plan ve yesil bölgeler cikarildi, yalnizca hastalık belirtisi gosteren bölgeler izole edildi. GLCM doku özellikleri (kontrast, korelasyon, enerji, homojenlik) ve renk istatistikleri (ortalama, standart sapma, entropi, carpiklik, basiklik, RMS) olmak uzere 10 özellik cikarildi. Doğrusal cekirdekli cok sınıfli SVM ile %60-%40 eğitim-test bölünmesinde %95 doğruluk elde edildi; 5-katli çapraz doğrulamada %93,7. ROC egrisinin altindaki alan %96. Hiperspektral görüntüleme gerektiren yöntemlerle benzer doğruluk, ancak yalnizca RGB görüntüleriyle daha düşük maliyetle elde edildi. (546 atif)

Derleme Calismalari ve Genel Bulgular

[Li et al., 2021] — Derin öğrenmeyle bitki hastalığı tespiti ve sınıflandırmasi üzerine kapsamli derleme. Temel bulgular: (1) CNN tabanli yaklasimlar, SVM'ye kiyasla %1-8, RF'ye kiyasla %3-8 ve YSA'ya kiyasla %41'e kadar daha yüksek sınıflandırma doğruluğu sagladi. (2) PlantVillage veri setinin 54.309 görüntüsunun alanda en yaygin kullanilan karşılaştırma ölçütu oldugu dogrulandi. (3) GAN tabanli veri arttirma (özellikle CycleGAN ve LeafGAN) sınıflandırma doğruluğunu %5,2'ye kadar artirdi. (4) Laboratuvar veri setlerinde ortalama %10-15 daha yüksek performans gozlendi (örneğin InceptionV3 laboratuvarda ortalama %10-15 daha iyi). (5) Gorsellestirme teknikleri (CAM, Grad-CAM, isitma haritalari) modelin hastalıkli bölgelere odaklandigini doğrulamak için kritik oneme sahip. (6) Küçük örneklem problemine çözüm olarak az-örnekli öğrenme (few-shot learning) ve GAN tabanli veri sentezi onerilen yaklasimlar arasında. (896 atif)

[Kamilaris & Prenafeta-Boldu, 2018] — Tarımda derin öğrenme üzerine 40 araştırmayi kapsayan anket çalışmasi. Sınıflandırma içeren 24 çalışmadan 19'unda (%79) doğruluk %90'in üzerinde bulundu. CNN modelleri, SVM'ye kiyasla %1-8, RF'ye kiyasla %3-8 daha yüksek doğruluk gösterdi. En yüksek F1 skoru Mohanty et al. (2016) çalışmasinda 0,99 ile gozlendi. Ancak 40 çalışmadan yalnizca 8'i (%20) eğitim ve test için farkli veri setleri kullanmisti; bu durum sonuçların genellestirilebilirligine dair guven dusurucudur. RNN/LSTM modelleri, zamansal veri içeren tarım problemlerinde CNN'ye kiyasla %16'ya kadar daha iyi sınıflandırma doğruluğu sagladi. (4.247 atif)

Ürüne Ozel Calismalar

[Liu & Wang, 2020] — Domates hastalıklari ve zararlilari için geliştirilmiş YOLOv3 algoritmasi. Gerçek dogal ortamdan toplanan domates hastalıklari veri seti üzerinde çalışma yapildi. Görüntü piramidi tabanli cok ölçekli özellik tespiti, K-means kümeleme ile nesne kutusu boyut optimizasyonu ve cok ölçekli eğitim stratejisi uygulanarak YOLOv3 iyilestirildi. Sonuçlar: geliştirilmiş YOLOv3 %92,39 mAP doğruluk ve yalnizca 20,39 ms tespit suresi elde etti. Karşılaştırmali analiz: SSD %84,32 (25,69 ms), Faster R-CNN %90,67 (2.868,94 ms), orijinal YOLOv3 %88,31 (21,18 ms). Gelistirilmis model, küçük nesne tespitinde ve farkli çözünürlükteki görüntüler için diger uc algoritmadan üstün performans gösterdi. (496 atif)

[Selvaraj et al., 2019] — Muz hastalıklari ve zararlilari için yapay zeka destekli tespit sistemi. Afrika ve Guney Hindistan'daki sicak noktalardan toplanan 18.000+ uzman tarafından dogrulanmis muz görüntüsu ve 30.952 anotasyon kullanildi. 18 farkli sınıf (hastalık x bitki parçası) için 6 farkli model gelistirildi. Transfer öğrenme ile yeniden egitilen uc CNN mimarisi karsilastirildi: ResNet50 ve InceptionV2, MobileNetV1'den tutarli olarak daha iyi performans gösterdi. Bitki parçasına gore sonuçlar: yalanci gövde (pseudostem) modeli en yüksek doğruluklari elde etti (mAP: %99,99 ResNet50, %99,94 InceptionV2); yaprak modeli en düşük performansi gösterdi (mAP: %70,17-70,39) -- bunun nedeni genis acili tarla görüntüleri ve arka plan gurultusu. Muz yapragi morfolojisinin karmaşıkligi ve sari sigatoka/siyah sigatoka hastalıklari arasındaki görsel benzerlik en büyük zorluk olarak rapor edildi. Model, su anda Benin, Kongo, Uganda, Kolombiya ve Hindistan'da mobil uygulama olarak test edilmektedir. (417 atif)

Erken Tespit ve Klasik Yöntemler

[Al-Hiary et al., 2011] — Bitki hastalıklarının hızlı ve doğru otomatik tespiti ve sınıflandırması için yazılım çözümü. Ürdün Al-Ghor bölgesinden toplanan yaprak görüntüleri üzerinde 5 hastalık (erken yanık, pamuksu küf, kül rengi küf, geç yanık, ince beyazlık) test edildi. Dört aşamalı işlem: (1) K-means kümeleme ile görüntü segmentasyonu, (2) yeşil piksellerin Otsu eşik yöntemiyle maskelenmesi ve sınır piksellerinin temizlenmesi, (3) HSI renk uzayına dönüşüm sonrası SGDM matrişleri ile H ve S bileşenlerinden 10 doku özelliği (kontrast, korelasyon, enerji, homojenlik, entropi vb.) çıkarılması, (4) ileri beslemeli geri yayılım yapay sinir ağı ile sınıflandırma. En iyi model (M1, yalnızca H ve S bileşenleri) ortalama %94,67 doğruluk elde ederken, önceki yaklaşıma göre (M1 için %92,7) iyileşme sağlandı. HSI renk uzayında yoğunluk (I) bileşeninin çıkarılması, aydınlatma değişkenliğinin etkisini ortadan kaldırarak performansı artırdı. Hesaplama süresinde önceki yaklaşıma göre ortalama %19 hızlanma kaydedildi (438 sn'den 381 sn'ye). 2007 yılında yalnızca Georgia eyaletinde bitki hastalığı kayıplarının yaklaşık 539,74 milyon USD olduğu raporlanmıştır (346,49 milyon USD hasar + 185,06 milyon USD kontrol maliyeti). Çalışma, derin öğrenme öncesi dönemde klasik görüntü işleme + YSA yaklaşımının etkinliğini gösteren öncü çalışmalar arasındadır. (632 atif)

ML ve DL ile Bitki Hastalığı Sınıflandırma ve Tespit Derlemesi

[Balafas et al., 2023] — Hassas tarımda bitki hastalığı tespiti ve sınıflandırması için makine öğrenmesi ve derin öğrenme tekniklerinin kapsamlı derlemesi. Çalışmalar iki ana kategoride sınıflandırılmıştır: (1) görüntü sınıflandırma ve (2) nesne tespiti. BM Gıda ve Tarım Örgütü (FAO) tahminlerine göre, bitki hastalıkları tek başına küresel ekonomiye yıllık yaklaşık 220 milyar USD maliyete neden olmaktadır. PlantDoc veri seti üzerinde yapılan kapsamlı deneysel değerlendirmede 18 son teknoloji sınıflandırma algoritması ve 5 nesne tespiti algoritması karşılaştırılmıştır. Nesne tespitinde YOLOv5 en yüksek doğruluğu elde etmiştir. Sınıflandırma görevinde ResNet50 ve MobileNetv2 doğruluk-eğitim süresi dengesi açısından en optimal modeller olarak belirlenmiştir. Derleme, İHA tabanlı uzaktan algılama ile hastalık tespitinin artan önemini vurgulamış; hiperspektral görüntüleme (380-1020 nm) ile domates hastalıklarında MLP algoritmasının %97-99 doğruluk sağladığını raporlamıştır. SVM, DT, RF gibi klasik ML yöntemleri ile CNN karşılaştırmasında, CNN yöntemlerinin çay yaprağı hastalıklarında ortalama %90 doğruluğa ulaştığı gösterilmiştir. (127 atıf)

Pestisit Kaynaklı Hastalık Riski ve Ekonomik Boyut

[Aktar et al., 2009] — Pestisitlerin bitki hastalığı yönetimindeki rolünü ve yan etkilerini kapsayan derleme. Fungisitler hastalık kontrolünde kritik öneme sahip olup küresel pestisit kullanımının %21'ini oluşturmaktadır. Ancak pestisitlerin toprak mikrobiyal topluluğu üzerindeki olumsuz etkileri, dolaylı olarak bitki hastalığı direncini zayıflatabilmektedir: glifosat mikoriza mantarlarına toksik etki göstermekte, 2,4-D topraktaki azot bağlayıcı bakteri aktivitesini azaltmakta ve böylece bitkilerin doğal savunma mekanizmaları zayıflamaktadır. AB izleme verilerine göre marul, biber ve ıspanak en yüksek MRL aşım oranlarına sahip ürünler olup (sırasıyla %7.3 ve %19'a kadar), bu durum hastalık yönetiminde kimyasal bağımlılığın risklerini göstermektedir. (3.453 atıf)