Dr. Mehmet Solak Siirt Üniversitesi · Ziraat Fakültesi · Biyosistem Mühendisliği · Tarım ve Tarımsal Eğitim İçin Makine Öğrenmesi İçeriği

1.8 Meyve Tespiti ve Sayımı

meyve-tespitiYOLOFaster-RCNNMask-RCNNverim-tahminiokluzyonrobotik-hasat

1. Problem Tanımı ve Sistemik Etki

Meyve tespiti ve sayımı, hasat öncesi verim tahmininin, robotik hasat sistemlerinin ve kalite derecelendirmesinin temel giriş katmanıdır. Küresel meyve ve sebze üretimi yıllık ~1,9 milyar ton olup (FAO, 2022), bu üretimin %5-25'i hasat ve hasat sonrası kayıplara gitmektedir. Doğru meyve sayımı, çiftçilerin hasat zamanlaması, işgücü planlaması ve pazarlama kararlarını optimize etmesini sağlar; ancak manuel sayım ölçeklenemez ve yüksek maliyetlidir.

Geleneksel meyve sayım yaklaşımlarının kısıtlamaları şunlardır:

  • Manuel Sayım: İnsan gözlemiyle ağaç başına meyve sayımı, deneyimli bir işçinin saatte 5-10 ağacı incelemesiyle sınırlıdır. Binlerce ağaçlık bahçelerde bu yaklaşım ekonomik olarak sürdürülemez.
  • Örnekleme Yanlılığı: Manuel tahminlerde genellikle birkaç referans ağaç sayılır ve sonuç tüm bahçeye genellenir. Ancak ağaçlar arası verim varyasyonu %20-50 olabilir; bu, tahmin hatalarını artırır.
  • Zamansal Kısıt: Meyve sayımı ideal olarak çiçeklenme sonrası meyve tutumu, olgunlaşma öncesi ve hasat dönemlerinde tekrarlanmalıdır. Manuel yöntemlerle çoklu sayım pratik değildir.
  • Ağaç İçi Görünürlük: Bir ağacın meyve yükünün %30-60'ı yaprak örtüsünün arkasında kalmaktadır; tek açıdan gözlemle bu meyveler sayılamaz.

Bilgisayar görüşü tabanlı meyve tespiti ve sayımı, bu kısıtlamaları aşarak otomatik, tekrarlanabilir ve ölçeklenebilir bir çözüm sunar. Bu teknoloji aynı zamanda robotik hasat kollarının hedef meyveyi tanımlama ve kavrama kararlarında kritik giriş katmanıdır. Otonom hasat robotları pazarı 2024'te ~1,2 milyar USD büyüklüğe ulaşmıştır.


2. Teknolojik Evrim ve Algoritmalar

2.1 Geleneksel Yöntemler (2000-2015)

Erken dönem meyve tespit sistemleri, renk ve şekil tabanlı özellik mühendisliğine dayanıyordu:

  • Renk Segmentasyonu: HSV veya L*a*b* renk uzayında meyve rengine özgü eşik değerleri belirlenerek pikseller segmente edilir. Kırmızı elmalar için a* kanalında eşikleme yüksek performans gösterir; ancak yeşil elmalar veya olgunlaşmamış turunçgiller için renk tabanlı ayrım yapılamaz. Stajnko et al. (2004), renk segmentasyonu ile yeşil elma tespitinde %76 doğruluk elde etmiştir.
  • Dairesel Hough Dönüşümü: Meyvelerin yaklaşık küresel geometrisinden yararlanarak görüntüde dairesel yapıları tespit eder. Portakal ve elma gibi belirgin küresel meyveler için etkilidir; ancak üzüm salkımı, muz veya düzensiz şekilli meyveler için uygulanamaz.
  • Doku ve Şekil Tanımlayıcıları: SIFT, HOG veya LBP gibi özellik tanımlayıcıları ile SVM veya AdaBoost sınıflandırıcıları eğitilir. Zhao et al. (2016), HOG + SVM ile kiraz tespitinde %85,3 doğruluk raporlamıştır; ancak ölçek ve açı değişkenliğine duyarlılık yüksektir.

Limitasyonlar: Renk tabanlı yöntemler, aydınlatma değişkenliğine son derece duyarlıdır; gölge, güneş lekeleri ve yaprak yansımaları yanlış pozitif oranını %20-40 artırır. Olgunlaşmamış meyvelerin yaprak rengiyle benzerliği ek bir ayırma zorluğu oluşturur.

2.2 Derin Öğrenme Yaklaşımları (2015-Günümüz)

Faster R-CNN

İki aşamalı (two-stage) nesne tespiti mimarisi ile yüksek lokalizasyon doğruluğu sağlar.

  • Girdi: RGB görüntüler, tipik olarak 800x600-1920x1080 piksel
  • Çalışma prensibi: Region Proposal Network (RPN) aday bölgeleri üretir; her aday bölge sınıflandırılır ve sınırlayıcı kutu regresyonu ile konumu rafine edilir.
  • Performans: Sa et al. (2016), Faster R-CNN ile kapsicum (dolma biber) tespitinde %90,9 F1 skoru elde etmiştir. DeepFruits çalışmasında 7 farklı meyve türünde ortalama F1=%83,4 raporlanmıştır. Çıkarım süresi görüntü başına 150-400 ms aralığındadır.

YOLO Ailesi

Tek geçişli (single-shot) mimaride gerçek zamanlı meyve tespiti yapar.

  • Girdi: RGB görüntüler, 416x416 veya 640x640 piksel
  • Çalışma prensibi: Görüntü ızgara hücrelerine bölünür; her hücre sınırlayıcı kutu tahmini ve sınıf olasılığı üretir. Tek ileri geçişte tüm tespitler yapılır.
  • Performans: Koirala et al. (2019), YOLOv3 ile mango tespitinde %90,0 F1 ve sayım doğruluğu R2=0,92 elde etmiştir; çıkarım süresi 25 ms/görüntü. Tian et al. (2019), geliştirilmiş YOLOv3 ile elma tespitinde %87,3 mAP raporlamıştır; gölgeli koşullarda mAP %78,1'e düşmüştür.

Mask R-CNN

Nesne tespiti + piksel düzeyinde segmentasyon birleşimi ile meyvenin hem konumunu hem de kesin sınırlarını belirler.

  • Girdi: RGB görüntüler
  • Çalışma prensibi: Faster R-CNN'e paralel bir maske dalı ekleyerek her tespit edilen nesne için piksel düzeyinde ikili maske üretir. Bu, meyve boyutu ve renk dağılımı analizi için kritik bilgi sağlar.
  • Performans: Yu et al. (2019), Mask R-CNN ile çilek tespitinde mAP@0.5=%95,78 ve piksel düzeyinde IoU=%87,3 elde etmiştir. Kısmen oklüde edilmiş meyvelerde IoU %72,4'e düşmüştür.

Yaklaşım Karşılaştırma Tablosu

Yaklaşım Veri Tipi Güçlü Yan Zayıf Yan Kullanım Senaryosu
Faster R-CNN RGB Yüksek lokalizasyon doğruluğu; karmaşık arka planlarda güçlü Yavaş çıkarım (150-400 ms); edge dağıtımına sınırlı uygunluk Araştırma; detaylı meyve analizi; verim haritalaması
YOLOv7/v8 RGB Gerçek zamanlı tespit (15-30 ms); robotik hasat entegrasyonu Küçük meyvelerde duyarlılık düşük; kısmen oklüde meyvelerde zorluk Robotik hasat; gerçek zamanlı sayım; İHA taraması
Mask R-CNN RGB Piksel düzeyinde segmentasyon; boyut ve renk analizi mümkün Yüksek hesaplama maliyeti; büyük etiketleme yükü Kalite derecelendirme; boyut sınıflandırma; olgunluk tahmini
Renk Segmentasyonu RGB Basit; hızlı; hesaplama gerektirmez Aydınlatmaya çok duyarlı; renk benzerliği olan meyveler için yetersiz Kontrollü ortam; belirgin renkli meyveler (kırmızı elma, turunçgil)
Hough Dönüşümü RGB Yorumlanabilir; küresel meyvelerde etkili Yalnızca dairesel/küresel şekiller; düzensiz meyvelerde uygulanamaz Portakal, elma gibi küresel meyvelerde kaba tespit

3. Gerçek Dünya Zorlukları (Domain Gap Analizi)

Oklüzyon (Yaprak ve Dal Örtmesi)

Meyve tespit probleminin en temel zorluğu, meyvelerin yapraklar, dallar ve diğer meyveler tarafından kısmen veya tamamen örtülmesidir. Bir elma ağacının meyve yükünün %30-60'ı tek açıdan görünmez durumdadır (Bargoti ve Underwood, 2017). Nesne tespiti modelleri genellikle IoU eşiğini %50 olarak alır; ancak %50'den fazla oklüde edilmiş meyveler kayıp olarak sınıflandırılır. Çoklu açı görüntüleme (ağacın farklı yönlerinden fotoğraf) ve 3D rekonstrüksiyon oklüzyon sorununu azaltır; ancak veri toplama ve işleme karmaşıklığını 3-5 kat artırır.

Renk Varyasyonu ve Olgunluk Farklılıkları

Aynı ağaçta farklı olgunluk evrelerinde meyveler bir arada bulunur. Yeşil (olgunlaşmamış) meyveler yaprak rengiyle karışır; kısmen kızarmış meyveler geçiş tonları gösterir. Kırmızı elma çeşitlerinin renk varyasyonu (Gala: açık kırmızı, Red Delicious: koyu kırmızı, Granny Smith: yeşil) aynı model içinde çoklu renk kanallarının öğrenilmesini gerektirir. Koirala et al. (2019), mango veri setinde yeşil (olgunlaşmamış) meyvelerin tespitinde duyarlılığın olgun meyvelere kıyasla %18 düşük olduğunu raporlamıştır.

Arka Plan Karmaşıklığı

Bahçe ortamında arka plan; gökyüzü, toprak, çim, komşu ağaçlar, trellis sistemi ve tarla altyapısından oluşur. Bu heterojen arka plan, modelin meyve-arka plan ayrımını zorlaştırır. Özellikle güneş ışığının yaprak arasından geçtiği lekelenmeler (sun flecks) meyve rengini taklit edebilir ve yanlış pozitif üretir. Sa et al. (2016), karmaşık tarla arka planında F1 skorunun kontrollü ortama göre %8-12 düştüğünü göstermiştir.

Aydınlatma Değişkenliği

Bahçe koşullarında aydınlatma, güneş pozisyonu, bulutluluk ve ağaç taç örtüsü gölgeleriyle sürekli değişir. Bir ağacın güneş gören yüzü ile gölge tarafı arasında aydınlatma yoğunluğu 10-50 kat farklılık gösterebilir. Bu, meyve renginin ve kontrastının sistematik olarak değişmesine neden olur. Tian et al. (2019), gölgeli koşullarda elma tespit mAP'inin %87,3'ten %78,1'e düştüğünü raporlamıştır.

Çift Sayım Problemi

Verim tahmini için meyve sayısı kritiktir. Çoklu açı görüntüleme oklüzyon sorununu hafifletir; ancak aynı meyvenin farklı açılardan birden fazla kez sayılma riskini oluşturur. Bu çift sayım (double counting) problemi, meyve takibi (tracking) veya 3D konum eşleştirme algoritmalarını gerektirir. Bargoti ve Underwood (2017), çoklu görüntü füzyonu ile çift sayım oranını %8'den %2'ye düşürmüştür; ancak hesaplama maliyeti 3x artmıştır.

Bölgesel Senaryo: Siirt Fıstık Bahçelerinde Meyve Sayımı

Siirt fıstığı bahçelerinde meyve tespiti ve sayımı üç spesifik mühendislik problemi oluşturur:

  1. Salkım Yapısı: Fıstık meyveleri bireysel olarak değil, 10-30 meyveden oluşan salkımlar (cluster) halinde bulunur. Bireysel meyve sayımı, salkım içindeki yoğun oklüzyon nedeniyle son derece zordur. Alternatif yaklaşım olarak salkım tespiti + salkım başına ortalama meyve sayısı katsayısı ile toplam verim tahmini yapılabilir; ancak bu katsayı çeşide ve yıla göre %15-25 değişkenlik gösterir.
  2. Kabuk Rengi Homojenliği: Fıstık dış kabuğu (hull) olgunlaşma sürecinin büyük bölümünde yeşil renktedir ve yaprak rengiyle neredeyse aynıdır. Renk tabanlı segmentasyon pratik olarak uygulanamaz; derin öğrenme modelleri şekil ve doku özelliklerine dayanmak zorundadır. Olgunlaşma döneminde kabuk kızarması-kahverengileşmesi tespit kolaylığı sağlar ancak bu dönem yalnızca 2-3 haftadır.
  3. Düzensiz Ağaç Yapısı: Siirt fıstığı ağaçları genellikle budama yapılmadan bırakılmakta ve çok gövdeli, yoğun taç yapısı oluşturmaktadır. Bu, ağaç içi görünürlüğü ciddi olarak kısıtlar; İHA ile üstten çekim dahi iç dalları göremez. Lateral görüntüleme ve 3D rekonstrüksiyon kombinasyonu gereklidir.

4. Literatür: Seminal Çalışmalar

Sa et al. (2016) — DeepFruits: Faster R-CNN ile 7 farklı meyve türünün tespiti. Kapsicum (dolma biber) tespitinde F1=%90,9; elma tespitinde F1=%82,3. RGB ve NIR görüntülerin erken füzyonunun yalnızca RGB'ye göre %3-5 doğruluk artışı sağladığını göstermiştir. Tarla koşullarındaki ilk kapsamlı derin öğrenme meyve tespiti çalışmasıdır. (543 atıf)

Koirala et al. (2019) — MangoYOLO: YOLOv3 tabanlı mango tespiti ve sayımı. F1=%90,0, sayım doğruluğu R2=0,92, çıkarım süresi 25 ms. Mango tespit performansını Faster R-CNN (F1=%91,2, 320 ms) ile karşılaştırarak hız-doğruluk ödünleşimini nicel olarak göstermiştir. (387 atıf)

Bargoti ve Underwood (2017) — Elma ve mango bahçelerinde Faster R-CNN ile meyve tespiti ve çoklu görüntü füzyonu. Tek görüntüde F1=%84,0; çoklu açı füzyonuyla F1=%90,1. Çift sayım oranını %8'den %2'ye düşürmüştür. (456 atıf)

Yu et al. (2019) — Mask R-CNN ile çilek tespiti ve segmentasyonu. mAP@0.5=%95,78, piksel IoU=%87,3. Olgunluk sınıflandırmasını (olgunlaşmamış, olgunlaşan, olgun) %92,1 doğrulukla gerçekleştirmiştir. Robotik hasat entegrasyonunu tartışmıştır. (298 atıf)

Tian et al. (2019) — Geliştirilmiş YOLOv3 ile elma tespiti. DenseNet omurga ve çok ölçekli tespit ile mAP=%87,3; gölgeli koşullarda %78,1. Oklüde elmaların %62 duyarlılıkla tespit edilebildiğini raporlamıştır. Veri artırma ile gölge koşullarında mAP'yi %82,5'e çıkarmıştır. (412 atıf)


5. Gelecek Vizyonu

Robotik Hasat Entegrasyonu

Meyve tespiti, robotik hasat kollarının (manipülatör) hedef meyveyi tanımlama, yaklaşma açısını hesaplama ve kavrama kuvvetini ayarlama kararlarına doğrudan girdi sağlar. Bu entegrasyon, tespit modelinin yalnızca konum değil aynı zamanda olgunluk, boyut ve kavrama uygunluğu bilgilerini de üretmesini gerektirir. Gerçek zamanlı çıkarım (<50 ms) ve düşük gecikme kritik gereksinimlerdir. Mevcut ticari sistemler (Abundant Robotics, FFRobotics) hasat verimliliğinde insan işçinin %60-80'ine ulaşmıştır; ancak maliyet-etkinlik eşiğinin aşılması için tespit doğruluğunun %95+ olması gerekmektedir.

3D Rekonstrüksiyon ve Bütünsel Ağaç Sayımı

Structure-from-Motion (SfM) veya LiDAR ile ağacın tam 3D modelinin oluşturulması, oklüzyon sorununu temelden çözer. 3D model üzerinde meyve tespiti, her meyvenin benzersiz 3D konumu sayesinde çift sayım problemini ortadan kaldırır. NeRF (Neural Radiance Fields) ve 3D Gaussian Splatting gibi yeni nesil 3D rekonstrüksiyon yaklaşımları, az sayıda görüntüden yüksek kaliteli 3D modeller üretmeyi mümkün kılmaktadır; ancak hesaplama maliyeti tarla ölçeğinde henüz pratik değildir.

İHA Tabanlı Verim Haritası

İHA platformları ile bahçe üzerinden sistematik uçuş yapılarak ağaç bazında meyve yoğunluk haritası oluşturulabilir. Bu haritalar, hasat zamanlaması, işgücü planlaması ve pazar tahminleri için stratejik karar desteği sağlar. Üstten çekim oklüzyon sorununu artırır (meyvelerin büyük bölümü taç altında kalır); lateral çekim için eğimli kamera açıları veya sıra arası otonom uçuş rotaları denenmektedir.


Bu içerik, literatür notları ve seçilmiş kaynak özetleri temel alınarak hazırlanmış editoryal bir ders metnidir.

Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği