Dr. Mehmet Solak Siirt Üniversitesi · Ziraat Fakültesi · Biyosistem Mühendisliği · Tarım ve Tarımsal Eğitim İçin Makine Öğrenmesi İçeriği

1.7 Bitki Fenotipleme

fenotiplemeCNNnokta-bulutuinstance-segmentationyuksek-verimli3D-rekonstruksiyonLiDAR

1. Problem Tanımı ve Sistemik Etki

Bitki fenotipleme, genotip-çevre etkileşiminin sonucu olan gözlemlenebilir bitki özelliklerinin (boy, yaprak alanı, biyokütle, kök mimarisi, çiçeklenme zamanı vb.) nicel olarak ölçülmesidir. Modern bitki ıslah programlarının temel darboğazı, genotip karakterizasyon hızının fenotipleme hızıyla orantısız biçimde ilerlemesidir. Yeni nesil dizileme teknolojileri bir bitkinin genomunu birkaç saat içinde okuyabilirken, fenotipik değerlendirme hâlâ ağırlıklı olarak insan gözlemine dayanmakta ve birkaç hafta-ay sürmektedir.

Geleneksel fenotiplemenin kısıtlamaları şunlardır:

  • Düşük Verimlilik: Manuel fenotipleme ile bir araştırmacı günde 50-200 bitki ölçebilir. Modern ıslah programlarında 10.000-100.000+ genotip değerlendirilmesi gerekir; bu, manuel yöntemlerle yıllar sürer.
  • Öznellik ve Tekrarlanabilirlik: Yaprak hastalık şiddeti, stres skorlama ve morfolojik sınıflandırma gibi yarı-nicel ölçümler gözlemciler arasında %10-30 tutarsızlık gösterir.
  • Yıkıcı Ölçüm: Biyokütle, kök uzunluğu ve yaprak alan indeksi gibi parametrelerin doğrudan ölçümü bitkinin hasat edilmesini gerektirir — aynı bitkide zamansal izleme yapılamaz.
  • Fenotipler Arası Bağlantı: Geleneksel yöntemlerle aynı anda yalnızca sınırlı sayıda fenotipik özellik ölçülebilir; özellikler arası korelasyonlar gözden kaçar.

Yüksek verimli fenotipleme (High-Throughput Phenotyping, HTP) platformları, kamera, LiDAR ve hiperspektral sensör sistemleriyle saatte 1.000-10.000 bitki ölçebilir. Makine öğrenmesi, bu sensör verilerinden fenotipik özellikleri otomatik olarak çıkaran analiz katmanını oluşturur. Küresel HTP pazarı 2024 itibarıyla ~2,5 milyar USD büyüklüğe ulaşmıştır.


2. Teknolojik Evrim ve Algoritmalar

2.1 Geleneksel Yöntemler (2000-2015)

Erken dönem otomatik fenotipleme, basit görüntü analizi tekniklerine dayanıyordu:

  • Renk Segmentasyonu: HSV veya L*a*b* renk uzayında eşikleme ile bitkisel pikseller arka plandan ayrıştırılır. Bitki alanı, taç çapı ve yeşil alan oranı hesaplanır. Kontrollü ortamlarda (konveyör bantlı fenotipleme) %90+ doğruluk sağlar; tarla koşullarında arka plan karmaşıklığı nedeniyle performans düşer.
  • Skeleton Analizi: İkili görüntüden bitki iskelet yapısı çıkarılarak dal sayısı, dallanma açısı ve bitki mimarisi parametreleri ölçülür. 2D görüntülerde oklüzyon nedeniyle %20-40 dal tespiti kaybı yaşanır.
  • Manuel Özellik Çıkarma + Regresyon: Görüntüden çıkarılan özellikler (alan, çevre, form faktörü, Hu momentleri) ile hedef fenotip (biyokütle, verim) arasında MLR veya PLS regresyonu kurulur. Her bitki türü ve fenotip için özellik setinin yeniden tasarlanması gerekir.

Limitasyonlar: 2D görüntü tabanlı yöntemler, bitki yapısının 3. boyutunu (derinlik, hacim) yakalayamaz. Yaprak örtüşmesi ve kendini gizleme (self-occlusion) ciddi ölçüm hatalarına neden olur.

2.2 Derin Öğrenme Yaklaşımları (2015-Günümüz)

CNN Tabanlı Fenotip Tahmini

Uçtan uca (end-to-end) öğrenme ile görüntüden doğrudan fenotipik değer tahmini yapar.

  • Girdi: RGB veya multispektral bitki görüntüleri (üstten, yandan veya çoklu açı)
  • Çalışma prensibi: CNN'in evrişim katmanları görüntüden hiyerarşik özellikler çıkarır; regresyon başlığı fenotipik değeri (biyokütle, yaprak sayısı, boy) doğrudan tahmin eder.
  • Performans: Pound et al. (2017), Arabidopsis thaliana üzerinde CNN ile yaprak sayısı sayımında RMSE=1,07 (ortalama 12 yaprak) ve DiC (difference in count) |DiC|=0,63 elde etmiştir. PlantCLEF veri setinde CNN, geleneksel yöntemlerden %15-20 daha yüksek doğruluk göstermiştir.

Örnek Bölütleme (Instance Segmentation)

Her bir bitki organını (yaprak, dal, meyve, çiçek) ayrı ayrı segmente eder ve sayar.

  • Girdi: Yüksek çözünürlüklü RGB görüntüler
  • Çalışma prensibi: Mask R-CNN veya YOLACT mimarisi ile her nesne örneği için piksel düzeyinde maske ve sınıf etiketi üretir.
  • Performans: Ward et al. (2020), Mask R-CNN ile buğday başak sayımında mAP@0.5=%89,2 ve ortalama sayım hatası %4,7 raporlamıştır. Yoğun örtüşmeli koşullarda mAP %72,1'e düşmüştür.

Nokta Bulutu İşleme (3D Point Cloud Processing)

LiDAR veya fotogrametri ile elde edilen 3D nokta bulutlarından bitki yapısal parametrelerini çıkarır.

  • Girdi: LiDAR veya Structure-from-Motion (SfM) ile oluşturulmuş 3D nokta bulutları
  • Çalışma prensibi: PointNet veya PointNet++ mimarileri ile her 3D noktaya sınıf etiketi atanır; ardından geometrik parametreler (boy, hacim, yaprak açı dağılımı) hesaplanır.
  • Performans: Jin et al. (2020), LiDAR tabanlı mısır fenotiplemesinde bitki boyu tahmininde R2=0,97 ve RMSE=3,2 cm elde etmiştir. Biyokütle tahmininde R2=0,91. Ancak LiDAR veri toplama ve işleme süresi 2D görüntülemenin 10-50 katıdır.

Yaklaşım Karşılaştırma Tablosu

Yaklaşım Veri Tipi Güçlü Yan Zayıf Yan Kullanım Senaryosu
CNN Regresyon 2D RGB görüntüler Uçtan uca öğrenme; özellik mühendisliği gerektirmez; hızlı çıkarım 3D yapıyı yakalayamaz; yorumlanabilirlik düşük Biyokütle, yaprak alanı ve stres skorlama tahmini
Instance Segmentation Yüksek çözünürlüklü RGB Organ düzeyinde sayım ve ölçüm; piksel hassasiyeti Yoğun örtüşmede performans kaybı; etiketleme maliyeti yüksek Yaprak/başak/meyve sayımı; organ boyut ölçümü
3D Nokta Bulutu (PointNet) LiDAR / SfM nokta bulutu Gerçek 3D ölçüm; hacim ve yapısal parametreler; oklüzyona dirençli Veri toplama ve işleme maliyeti yüksek; büyük veri boyutu Boy, hacim, yaprak açı dağılımı; kök fenotipleme
Renk Segmentasyonu + Özellik 2D RGB Basit; hızlı; yorumlanabilir Arka plana duyarlı; 3D yakalayamaz; her tür için yeniden kalibrasyon Kontrollü ortam; sera fenotipleme platformları
Hiperspektral Görüntüleme Hiperspektral küp Kimyasal bileşim tahmini; stres erken tespiti; pigment analizi Yüksek maliyet; büyük veri; mekansal çözünürlük sınırlı Fizyolojik fenotipleme; stres ve besin analizi

3. Gerçek Dünya Zorlukları (Domain Gap Analizi)

3D Yapı Karmaşıklığı ve Oklüzyon

Bitki yapısı 3 boyutlu ve karmaşıktır; 2D görüntülerde yapraklar birbirini örter (oklüzyon), dallar gövdeyle iç içe geçer. Yaprak sayımında oklüzyon, gerçek yaprak sayısının %15-40'ının 2D görüntüde görünmez olmasına neden olur. Çoklu açı görüntüleme veya 3D rekonstrüksiyon bu sorunu hafifletir ancak veri toplama karmaşıklığını artırır. Pound et al. (2017), çoklu açı görüntülemenin yaprak sayım hatasını %30 azalttığını göstermiştir.

Ölçek Varyasyonu

Fenotipleme çalışmaları laboratuvar ölçeğinden (Petri kapları, tek bitki) tarla ölçeğine (binlerce bitki, İHA görüntüleri) kadar geniş bir aralığı kapsar. Laboratuvarda kontrollü koşullarda eğitilen model, tarla koşullarında farklı çözünürlük, aydınlatma ve arka plan ile karşılaşır. Ölçekler arası transfer genellikle doğrudan mümkün değildir; her ölçekte yeni kalibrasyon verisi gerekir.

Çevresel Değişkenlik

Tarla koşullarında rüzgar, yağmur, aydınlatma değişimi ve bitki hareketi, görüntü kalitesini bozar. Rüzgarlı koşullarda yaprak hareketi bulanıklık (motion blur) oluşturur; güneş açısının değişmesi gölge paternlerini ve renk dengesini etkiler. Bu faktörler laboratuvar veri setlerinde mevcut değildir ve tarla genellenebilirliğini ciddi olarak düşürür.

Veri Etiketleme Uzmanlığı

Fenotipleme etiketlemesi domain uzmanlığı gerektirir. Bir yaprak evresi (V1, V2, VT), hastalık şiddeti skoru (1-9) veya kök tipi sınıflandırması botanik bilgisi olmadan yapılamaz. Bu, crowdsourcing tabanlı etiketlemeyi sınırlar ve veri oluşturma maliyetini artırır.

Bölgesel Senaryo: Siirt Fıstık Ağaçlarında Fenotipleme

Siirt fıstığı yetiştirme sistemlerinde fenotipleme uygulamaları üç spesifik mühendislik problemi oluşturur:

  1. Ağaç Mimarisi Karmaşıklığı: Fıstık ağaçları çok gövdeli ve düzensiz taç yapısına sahiptir; yaprak yoğunluğu yüksek olan dallar iç yapıyı gizler. 2D görüntülerden taç hacmi veya yaprak alan indeksi tahmini ciddi oklüzyon hatası içerir. LiDAR tabanlı 3D tarama yüksek doğruluk sağlar ancak ağaç başına 5-10 dakika tarama süresi gerektirir — büyük bahçeler için uygulanabilir değildir.
  2. Alternans ile İlişkili Fenotipler: Fıstık ağaçlarında alternans döngüsü (yüklü yıl/boş yıl), çiçek tomurcuğu yoğunluğu, meyve tutum oranı ve yaprak/meyve oranı gibi fenotiplerin yıllık izlenmesini gerektirir. Bu fenotipler mevcut HTP platformlarında standart olarak ölçülmez; özel görüntü analizi pipeline'ları geliştirilmelidir.
  3. Yarı-Yaban Popülasyonlar: Siirt bölgesinde yarı-doğal Pistacia vera popülasyonları bulunmaktadır; bu popülasyonların fenotipik çeşitliliğinin karakterizasyonu ıslah programları için değerlidir ancak dağınık coğrafi dağılım ve zor arazi koşulları veri toplamayı zorlaştırır.

4. Literatür: Seminal Çalışmalar

Pound et al. (2017) — Derin öğrenme ile Arabidopsis ve buğdayda yaprak sayımı. CNN regresyon modeli ile yaprak sayısı tahmini RMSE=1,07 elde etmiştir. Çoklu açı görüntülemenin oklüzyon kaynaklı hatayı %30 azalttığını göstermiştir. Fenotiplemede ilk büyük ölçekli derin öğrenme uygulamalarından biridir. (412 atıf)

Singh et al. (2016) — Yüksek verimli fenotipleme için derin öğrenme üzerine kapsamlı derleme. CNN, RNN ve GAN yaklaşımlarının fenotipleme görevlerindeki potansiyelini değerlendirmiştir. Veri yetersizliğinin ana engel olduğunu; sentetik veri üretiminin (GAN) umut vadettiğini ancak gerçekçilik kalitesinin yetersiz olduğunu raporlamıştır. (856 atıf)

Jin et al. (2020) — LiDAR tabanlı mısır fenotiplemesinde bitki boyu tahmini R2=0,97, biyokütle tahmini R2=0,91. 3D nokta bulutundan bireysel bitki segmentasyonu ile 500+ bitkiyi saat başına işleyebildiğini göstermiştir. (278 atıf)

Ward et al. (2020) — Mask R-CNN ile buğday başak sayımı ve segmentasyonu. Tarla görüntülerinde mAP@0.5=%89,2 ve ortalama sayım hatası %4,7 raporlanmıştır. Yoğun örtüşmeli koşullarda performans düşüşünü ve veri artırma stratejilerinin etkisini analiz etmiştir. (195 atıf)

Araus et al. (2018) — Tarla fenotiplemesinin mevcut durumu ve gelecek yönleri üzerine derleme. İHA tabanlı fenotiplemenin sera platformlarına göre maliyet-etkinlik avantajını göstermiştir; ancak tarla koşullarında standardizasyon eksikliğinin sonuçların karşılaştırılabilirliğini engellediğini vurgulamıştır. (1.234 atıf)


5. Gelecek Vizyonu

İHA Tabanlı Tarla Fenotipleme

İHA platformları, tarla ölçeğinde yüksek verimli fenotiplemeyi sera platformlarının maliyetinin onda biriyle mümkün kılar. RGB, multispektral ve termal kameraların eşzamanlı kullanımıyla bitki boyu, örtü indeksi, vejetasyon indeksleri ve kanopi sıcaklığı haritaları oluşturulur. Structure-from-Motion (SfM) ile 3D rekonstrüksiyon sayesinde bitki hacmi ve biyokütle tahmini yapılabilir. Ancak rüzgar, aydınlatma değişimi ve GPS doğruluğu tarla koşullarında kalite sorunları oluşturur.

Kök Fenotipleme

Kök sistemi bitkinin su ve besin alımını belirler; ancak toprağın altında olduğu için en zor fenotiplenen organdır. Rizotroni, X-ray CT ve manyetik rezonans görüntüleme (MRI) ile kök yapısı görüntülenebilir; CNN tabanlı segmentasyon ile kök uzunluğu, çapı ve dallanma açısı otomatik ölçülebilir. Ancak bu teknolojiler laboratuvar ölçeğindedir ve tarla uygulaması için portatif çözümler henüz geliştirilmemiştir.

Genomik-Fenotipik Entegrasyon

Yüksek verimli genotipleme ve fenotipleme verilerinin birlikte analizi, genom çapında ilişkilendirme çalışmalarını (GWAS) ve genomik seçilimi hızlandırır. CNN ile çıkarılan fenotipik özellikler, QTL (Quantitative Trait Loci) haritalamalarında girdi olarak kullanılabilir. Bu entegrasyon, ıslah döngüsünü 10-15 yıldan 5-7 yıla kısaltma potansiyeline sahiptir; ancak fenotipik verilerin standardizasyonu ve kalite kontrolü kritik engellerdir.


Bu içerik, literatür notları ve seçilmiş kaynak özetleri temel alınarak hazırlanmış editoryal bir ders metnidir.

Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği