Dr. Mehmet Solak Siirt Üniversitesi · Ziraat Fakültesi · Biyosistem Mühendisliği · Tarım ve Tarımsal Eğitim İçin Makine Öğrenmesi İçeriği

1.2 Ürün Verimi Tahmini

verim-tahminiLSTMrandom-forestXGBoostuydu-verisiNDVIzaman-serisiiklim

1. Problem Tanımı ve Sistemik Etki

Küresel mısır üretimi yılda yaklaşık 750 milyon metrik tonu aşmakta olup, 94 gelişmekte olan ülkede 4,5 milyardan fazla insanın gıda kalorilerinin en az %30'unu karşılamaktadır (Shiferaw et al., 2011). Ray et al. (2015), iklim değişkenliğinin tek başına küresel mısır, pirinç, buğday ve soya fasulyesi verim varyansının %32-39'unu açıkladığını göstermiştir. İklim kaynaklı yıllık mısır üretim dalgalanması yaklaşık 22 milyon ton — birçok Latin Amerika ve Afrika ülkesinin toplam mısır üretimine eşdeğerdir.

Bu büyüklükte bir belirsizlik, üç kritik sisteme doğrudan etki eder:

  • Gıda arzı planlaması: Hasattan aylar önce ne kadar ürün alınacağının bilinmemesi, stok yönetimini ve ithalat kararlarını zorlaştırır. Gelişmekte olan ülkelerde mısır ithalatının bugünkü talebin %7'sinden 2050'de %24'e yükseleceği öngörülmektedir (Shiferaw et al., 2011).
  • Fiyat oynaklığı: Verim belirsizliği, emtia piyasalarında spekülatif hareketlere zemin hazırlar. 2007-2008 gıda krizi, verim tahminlerindeki sapmaların küresel fiyat şoklarına nasıl dönüşebildiğinin somut örneğidir.
  • Sigorta ve politika: Tarımsal sigorta primleri, devlet sübvansiyonları ve gıda yardımı dağıtımı doğrudan verim tahminlerine bağlıdır. Tahmin hatası, kaynakların yanlış tahsis edilmesi anlamına gelir.

Mühendislik problemi olarak verim tahmini, çok kaynaklı (uydu, meteoroloji, toprak, yönetim), çok ölçekli (tarla → ilçe → ulusal) ve zamansal bağımlılık içeren bir regresyon problemidir.


2. Teknolojik Evrim ve Algoritmalar

2.1 Geleneksel Yöntemler

Alan örnekleme (field sampling): Hasat öncesi tarladan rastgele alınan örneklerle verim tahmini. İşgücü yoğun, ölçeklenemez ve istatistiksel temsil gücü sınırlıdır.

Agro-meteorolojik indeks modelleri: Büyüme derece günleri (GDD), Palmer Kuraklık İndeksi (PDSI) gibi iklim indekslerinin verimle doğrusal ilişkilendirilmesi. Yalnızca 1-2 çevresel değişkeni yansıtır; toprak, çeşit ve yönetim etkileşimlerini yakalayamaz. Doğrusal varsayım, eşik etkilerini modelleyemez: 30°C üzerinde geçirilen her derece-gün optimal koşullarda verimi %1, kuraklık koşullarında %1,7 oranında düşürmektedir (Shiferaw et al., 2011).

Proses tabanlı bitki simülasyon modelleri (APSIM, DSSAT): Bitki fizyolojisi, toprak-su dinamikleri ve atmosfer etkileşimlerini mekanistik olarak simüle eder. Kalibrasyonu pahalıdır, parametre belirsizliği yüksektir; ancak gözlenemeyen değişkenleri (toprak altı su dinamikleri) simüle edebilme kapasitesi benzersizdir.

2.2 Makine Öğrenmesi ve Derin Öğrenme Yaklaşımları

Random Forest (RF)

  • Girdi: Yapılandırılmış tablo — uydu indeksleri (NDVI, EVI), meteorolojik değişkenler (sıcaklık, yağış, GDD), toprak özellikleri (organik karbon, tekstür)
  • Çalışma prensibi: Bootstrap örnekleme ile paralel karar ağaçları; tahminleri ortalamayla birleştirir. Doğal özellik önem sıralaması sağlar.
  • Eğitim: Gözetimli öğrenme; ilçe düzeyinde geçmiş verim kayıtları hedef değişken.
  • Performans: Jeong et al. (2016) — küresel buğday =0,96, RMSE=%11,9; ABD mısır R²=0,76, RMSE=%16,7. MLR'ye kıyasla RMSE oranı %6-14 vs %14-49.

XGBoost / LightGBM

  • Girdi: RF ile aynı yapılandırılmış veri.
  • Çalışma prensibi: Sıralı ağaç oluşturma; her yeni ağaç öncekinin hatasını düzeltir.
  • Performans: Ennaji et al. (2024) — mısır verimi XGBoost R²=0,87, RMSE=0,41 ton/ha. Shahhosseini et al. (2021) — APSIM hibrit LightGBM RMSE=883 kg/ha.

LSTM / GRU (Zaman Serisi Modelleme)

  • Girdi: Büyüme mevsimi boyunca sıralı gözlemler (haftalık uydu indeksleri, günlük meteoroloji).
  • Çalışma prensibi: Kapı mekanizmaları ile uzun vadeli zamansal bağımlılıkları öğrenir. Mevsimin hangi aşamalarının verime en duyarlı olduğunu implisit olarak kodlar.
  • Performans: Khaki et al. (2020) — CNN-RNN mısır RMSE=15,74-17,64 bushel/acre (korelasyon %85-88). RF (25-29) ve DFNN'den (21-27) belirgin üstünlük.

CNN-LSTM Hibrit

  • Girdi: Uydu görüntü yamaları (uzamsal) + zaman serisi (zamansal).
  • Çalışma prensibi: CNN uzamsal özellikleri çıkarır; LSTM zamansal ilerlemeyi modeller. Spatio-temporal füzyon sağlar.
  • Kritik bulgu: Khaki et al. (2020) — güneş radyasyonu en hassas değişken; kritik dönem mısır ipeklenme zamanı (30. hafta).

Proses + ML Hibrit

  • Girdi: APSIM simülasyon çıktıları + standart ML girdileri.
  • Performans: Shahhosseini et al. (2021) — APSIM değişkenlerinin eklenmesi RMSE'yi %7-20 düşürmüştür. Toprak nemi değişkenleri en etkili faktörler.
  • Kritik çıkarım: Salt hava verisiyle çalışan ML modelleri, toprak-su dinamiklerini yakalamada yetersizdir.

Yaklaşım Karşılaştırma Tablosu

Model Veri Tipi Güçlü Yan Zayıf Yan Kullanım Senaryosu
Random Forest Tablo (indeks + hava + toprak) Yorumlanabilir; özellik önem sıralaması; dayanıklı Zamansal bağımlılığı doğrudan modelleyemez İlçe-ulusal ölçek regresyon
XGBoost / LightGBM Tablo RF'den %2-5 düşük RMSE Hiperparametre duyarlılığı yüksek Optimizasyon bütçesi varsa RF yerine
LSTM / GRU Zaman serisi Fenolojik ilerlemeyi yakalar Eğitim verisi gereksinimi yüksek; yorumlanabilirlik düşük Mevsim içi erken uyarı
CNN-LSTM Görüntü yaması + zaman serisi Spatio-temporal füzyon; en yüksek tahmin gücü Hesaplama maliyeti yüksek Tarla düzeyi yüksek çözünürlük
Proses+ML Hibrit ML girdileri + APSIM çıktıları Gözlenemeyen değişkenleri entegre eder; RMSE %7-20 iyileşme Proses model kalibrasyonu pahalı Toprak-su etkileşimi kritik bölgeler

3. Gerçek Dünya Zorlukları (Domain Gap Analizi)

Uydu Verisi Çözünürlük Problemi

MODIS (250-500 m) ilçe ölçeğinde yeterlidir ancak tarla düzeyinde yetersizdir — tek bir piksel birden fazla tarlayı kapsayabilir. Sentinel-2 (10 m) bu sorunu kısmen çözer; ancak veri arşivi 2015'e kadar uzanır ve uzun vadeli trend analizi için Landsat (30 m, 1984+) ile harmonize edilmesi gerekir. Çözünürlük artışı hesaplama maliyetini büyüklük sırası artırır.

Bulut Örtüsü ve Veri Kaybı

Optik sensörler bulut altını göremez. Tropik ve muson iklimlerinde büyüme mevsiminin kritik dönemlerinde bulutsuz görüntü elde etmek güçtür. Sentinel-2'nin 5 günlük yeniden ziyaret süresi bile ardışık haftalarca boşluk bırakabilir. SAR (Sentinel-1) bulutu delebilir ancak farklı fiziksel bilgi taşır; optik-SAR füzyon modelleri ayrı eğitim gerektirir.

Veri Senkronizasyonu

Uydu (5-16 gün), meteoroloji (saatlik/günlük), toprak analizi (yıllık veya seyrek) — farklı zamansal çözünürlükler. Temporal alignment hatası, sahte korelasyon öğrenme riskini artırır. Shahhosseini et al. (2020), 18-24. hafta (1 Mayıs - 1 Haziran) hava değişkenlerinin en önemli girdiler olduğunu göstermiştir — doğru zamansal pencere seçimi model performansını doğrudan belirler.

Toprak Heterojenliği

Aynı tarla içinde bile toprak tekstürü, drenaj ve besin düzeyleri değişir. İlçe düzeyinde eğitilmiş modeller tarla içi varyasyonu yakalayamaz. Shahhosseini et al. (2021), toprak nemiyle ilgili APSIM değişkenlerinin bu veri düzeninde en yüksek katkıyı sağladığını raporlamıştır; bu da toprak-su etkileşiminin modele dahil edilmesinin önemli olabileceğini düşündürür.

Model Genelleme Problemi

Ray et al. (2015), ABD Ortabatısı'nın üst/doğu bölgelerinde verimin sıcaklık tarafından, batı/orta bölgelerinde yağış tarafından domine edildiğini göstermiştir. Bu mekansal heterojenlik, tek bir küresel modelin yetersiz kalacağını ve bölgeye özgü kalibrasyon gerektirdiğini ortaya koyar. Zamanda da benzer problem geçerlidir: normal yıllarda eğitilmiş modeller, aşırı hava olaylarında (kuraklık, sel) dramatik performans kaybı gösterir.

Bölgesel Senaryo: Siirt Fıstığı

Alternatif taşıma (biennial bearing): Fıstık ağaçları fizyolojik olarak "var yılı" ve "yok yılı" döngüsüne sahiptir. Yüksek verim sonrası besin rezervleri tükenir; ertesi yıl verim düşer. Bu ikili döngü, standart zaman serisi modellerinin varsaydığı ardışık yıl korelasyonunu bozar. Model, 2 yıllık gecikmeli özellikleri veya bu biyolojik döngüyü açıkça kodlayan bir mimariyi içermelidir.

Mikroklima etkisi: Siirt'in dağlık topoğrafyası kısa mesafelerde 2-3°C sıcaklık farkı ve belirgin nem gradyanı oluşturur. Güneye bakan yamaç ile kuzeye bakan komşu bahçe arasındaki iklim farkı, MODIS pikselinin içinde kaybolur. Drone tabanlı termal ve multispektral görüntüleme bu ölçekte yararlı olabilir; ancak maliyet ve operasyonel erişim de hesaba katılmalıdır.


4. Literatür: Seminal Çalışmalar

Jeong et al. (2016) — Random Forest ile küresel ve bölgesel verim tahmini. Buğday R²=0,96, RMSE=%11,9; ABD mısır R²=0,76, RMSE=%16,7. RF'nin MLR'ye tüm senaryolarda üstünlüğü. Azot gübre oranı küresel buğdayda, teknolojik trend ABD mısırında en belirleyici değişken.

Khaki et al. (2020) — CNN-RNN hibrit, ABD Mısır Kuşağı 13 eyalet, 1980-2018. Mısır RMSE=15,74-17,64 bushel/acre (korelasyon %85-88); tüm alternatiflerden üstün. Güneş radyasyonu en hassas değişken, kritik dönem 30. hafta.

Shahhosseini et al. (2021) — APSIM + ML hibrit. APSIM değişkenlerinin eklenmesi RMSE'yi %7-20 düşürmüş. Toprak nemi değişkenleri en etkili. Salt hava verisiyle çalışan ML modellerinin yetersizliğini kanıtlayan çalışma.

Ray et al. (2015) — İklim değişkenliği küresel verim varyansının %32-39'unu açıklıyor. ABD Ortabatısı'nda %42. İklim kaynaklı yıllık mısır dalgalanması ~22 milyon ton. Bölgesel model kalibrasyonunun gerekliliğini gösteren referans. (1.904 atıf)

Shahhosseini et al. (2020) — ML topluluk modelleri ile mısır tahmini. Optimize edilmiş topluluk RRMSE=%9,5. 1 Haziran itibariyle %9,2 RRMSE ile mevsim içi erken tahmin yapılabilirliği gösterilmiş.


5. Gelecek Vizyonu

Edge AI ile Mevsim İçi Gerçek Zamanlı Tahmin

Tarla kenarındaki IoT düğümlerinde (toprak nemi sensörü + mikro hava istasyonu + sıkıştırılmış model) gerçek zamanlı güncellenen verim tahminleri. Latency kısıtı ve ARM Cortex-M düzeyinde hesaplama bütçesi göz önüne alındığında, LSTM yerine kuantalanmış gradient boosting veya TinyML uyumlu mimariler gerekecektir.

Uydu + Drone Veri Füzyonu

Sentinel-2 (10 m, 5 gün) makro temporal coverage sağlarken, multispektral/termal drone (cm çözünürlük, talebe bağlı) tarla içi heterojenliği yakalar. İki akışın füzyonu uzamsal ve zamansal çözünürlük optimumunu sağlayabilir. Standardize ön işleme pipeline'ları (atmosferik düzeltme, geometrik hizalama, radyometrik kalibrasyon) henüz olgunlaşmamıştır.

Hiperspektral Verinin Rolü

100+ dar bant (380-2500 nm) ile bitkinin biyokimyasal durumu (klorofil, azot, su stresi) doğrudan ölçülebilir. Bu bilgi, verim tahmin modellerinin açıklayıcı gücünü artırır — özellikle erken dönemde besin eksikliği ve su stresinin nicelleştirilmesinde. Boyutsallık problemi (curse of dimensionality) PCA veya bant seçimi ile yönetilmelidir.

Digital Twin Tarım Sistemleri

Shahhosseini et al. (2021)'in APSIM+ML yaklaşımının genişletilmiş hali: tarlayı sensör verileriyle sürekli güncellenen mekanistik simülasyonla temsil eden dijital ikiz. Gerçek zamanlı senaryo analizi (kuraklık etkisi, gübre dozu optimizasyonu) ve risk yönetimi (sigorta fiyatlandırması) için kapalı döngü karar destek aracına dönüşme potansiyeli.


6. Zoom Etkileşim Sorusu

Shahhosseini et al. (2021), APSIM bitki modeli çıktılarının ML girdilerine eklenmesinin RMSE'yi %7-20 düşürdüğünü gösterdi. Ancak APSIM kalibrasyonu uzmanlık ve yerel veri gerektirir. Elinizde Siirt'in 10 ilçesine ait 20 yıllık buğday verim istatistikleri, Sentinel-2 NDVI zaman serileri ve meteorolojik veriler var — ancak APSIM mevcut değil. Salt ML modeli mi kurarsınız, yoksa APSIM'i kalibre edip hibrit yaklaşıma mı geçersiniz? Her iki kararın zaman, maliyet, doğruluk ve genellenebilirlik tradeoff'larını tartışın.


Bu içerik, literatür notları ve seçilmiş kaynak özetleri temel alınarak hazırlanmış editoryal bir ders metnidir.

Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği