Ürün Verimi Tahmini (Crop Yield Prediction)

yield-estimationsatellite-imagerytime-serieslstmrandom-forestndvi

Ürün verimi tahmini -- belirli bir alandan hasat edilecek tarımsal ürün miktarının tahmin edilmesi -- tarımda makine öğrenmesinin ekonomik açıdan en önemli uygulamalarından biridir. Doğru verim tahminleri; gıda güvenliği planlaması, emtia piyasaları, sigorta fiyatlandırması, çiftlik yönetimi kararları ve devlet politikalarını bireysel tarlalardan tüm ülkelere uzanan ölçeklerde bilgilendirmektedir.

Veri Kaynakları

Verim tahmin modelleri doğası gereği çok modludur ve çeşitli veri akışlarından yararlanır:

Uydu görüntüleri: Geniş ölçekli tahmin için birincil veri kaynağı. Temel spektral indeksler arasında Ndvi (Normalize Edilmiş Fark Bitki Örtüsü İndeksi), EVI (Geliştirilmiş Bitki Örtüsü İndeksi) ve LAI (Yaprak Alan İndeksi) yer alır; bunlar Sentinel-2, Landsat ve Modis gibi platformlardan elde edilir. Bu indeksler kanopi yeşilliği, biyokütle birikimi ve fotosentetik aktivite için vekil değişkenler olarak hizmet eder.
Hava durumu ve iklim verileri: Sıcaklık (minimum, maksimum, ortalama), yağış, güneş radyasyonu, nem ve büyüme derece günleri (GDD). Hem geçmiş kayıtlar hem de mevsimsel tahminler kullanılır.
Toprak özellikleri: Organik karbon içeriği, tekstür (kum/silt/kil oranları), pH, su tutma kapasitesi ve besin element düzeyleri. Genellikle dijital toprak haritaları veya yerinde ölçümlerden elde edilir.
Yönetim uygulamaları: Ekim tarihi, bitki çeşidi, gübre uygulama oranları, sulama programları ve toprak işleme uygulamaları. Bu verinin geniş ölçekte elde edilmesi genellikle en zor olanıdır.
Geçmiş verim kayıtları: Önceki yıllara ait ilçe düzeyinde veya çiftlik düzeyinde verim istatistikleri, temel eğitim hedefleri sağlar.

Modelleme Yaklaşımları

Klasik ve Topluluk Yöntemleri (Ensemble Methods)

Doğrusal ve ridge regresyon: Temel yaklaşımlar; özellikler iyi tasarlandığında şaşırtıcı derecede rekabetçi
Rastgele Orman (Random Forest): Verim tahmini için en yaygın kullanılan makine öğrenmesi yöntemi; karma özellik türlerini işleme, doğal özellik önem sıralaması ve aşırı öğrenmeye karşı dayanıklılığı nedeniyle tercih edilir
Gradyan Artırmalı Ağaçlar (Gradient Boosted Trees - XGBoost, LightGBM): Yapılandırılmış tablo verilerde, özellikle dikkatli hiperparametre ayarıyla, Rastgele Orman'dan sıklıkla daha iyi performans gösterir

Derin Öğrenme Yöntemleri (Deep Learning)

LSTM (Uzun Kısa Süreli Bellek): Bitki büyümesinin zamansal doğasına doğal olarak uygundur. LSTM'ler bir büyüme mevsimi boyunca uydu gözlemleri veya hava durumu verisi dizilerini işleyerek, hangi büyüme aşamalarının çevresel koşullara en duyarlı olduğunu öğrenir.
1D-CNN: Zaman serisi özellikleri üzerinde zamansal evrişimler; genellikle LSTM'lerden daha hızlı eğitilir ve karşılaştırılabilir doğruluk sunar.
CNN-LSTM melezleri: CNN'ler uydu görüntü yamalarından uzamsal özellikler çıkarır; LSTM'ler zamansal ilerlemeyi modeller. Bu mimari hem uzamsal örüntüleri (tarla düzeyinde değişkenlik) hem de zamansal dinamikleri (fenolojik gelişim) yakalar.
Dönüştürücü tabanlı modeller (Transformer-based models): Büyüme mevsimi zaman serilerine uygulanan dikkat mekanizmaları, modelin nihai verim için hangi zaman adımlarının en önemli olduğunu öğrenmesini sağlar.

Ölçek Değerlendirmeleri

Verim tahmini, her biri farklı zorluklar barındıran çok farklı uzamsal ölçeklerde gerçekleştirilir:

Ölçek	Tipik çözünürlük	Birincil veri	Kullanım alanı
Tarla düzeyi	10-30 m piksel	Yüksek çözünürlüklü uydu, İHA, toprak sensörleri	Hassas tarım, değişken oranlı uygulama
İlçe/bölge	Toplulaştırılmış istatistikler	MODIS, hava istasyonları	Sigorta, yerel planlama
Ulusal/kıtasal	Kaba ızgaralar	MODIS, ERA5 reanalizi	Gıda güvenliği, emtia piyasaları

İlçe düzeyinde iyi performans gösteren modeller tarla düzeyine doğrudan aktarılamayabilir. Tarlalar içindeki uzamsal heterojenlik (toprak değişkenliği, drenaj örüntüleri, mikroiklimler) daha ince çözünürlüklü girdiler ve farklı modelleme stratejileri gerektirmektedir.

Zamansal Modelleme Zorlukları

Verim, tek bir anlık görüntüyle değil, tüm büyüme mevsimi seyriyle belirlenir. Temel zamansal zorluklar şunlardır:

Fenolojik değişkenlik: Ekim tarihleri ve büyüme aşamaları yıllar ve bölgeler arasında kaymaktadır
Tahmin öncülük süresi ile doğruluk arasındaki ödünleşim: Erken mevsim tahminleri en değerli ancak en az doğru olanlardır; geç mevsim tahminleri doğru ancak daha az eyleme dönüştürülebilirdir
Yıllar arası değişkenlik: Aşırı hava olayları (kuraklık, sel, sıcak dalgaları) normal yıllarda eğitilmiş modellere meydan okuyan dağılım kaymaları oluşturur
Veri füzyonu zamanlaması: Uydu yeniden ziyaret aralıkları, hava tahmini ufukları ve toprak örnekleme programları düzgün bir şekilde hizalanmamaktadır

Doğruluk Metrikleri ve Performans

Standart değerlendirme metrikleri arasında RMSE (Kök Ortalama Kare Hata), MAE (Ortalama Mutlak Hata) ve R-kare (belirleme katsayısı) yer alır. ABD ilçe düzeyinde mısır verim tahmininde tipik performans:

R-kare: Mevsim içi tahminlerde 0.70-0.85 (hasattan 2-3 ay önce)
RMSE: Ürün ve bölgeye bağlı olarak 0.5-1.0 ton/hektar
Erken mevsim tahminleri (ekimden mevsim ortasına): R-kare 0.40-0.60'a düşer

Ürüne Özgü ve Genel Modeller

Kalıcı bir tasarım sorusu, her ürün için ayrı bir model mi yoksa birleşik çok ürünlü bir model mi oluşturulacağıdır. Ürüne özgü modeller kendine has fenolojik örüntüleri ve stres tepkilerini yakalar ancak ayrı eğitim verisi ve bakım gerektirir. Genel modeller, paylaşılan çevresel tepki örüntülerinden ve ürünler arası transfer öğrenmeden yararlanır, ancak herhangi bir tek ürün için doğruluktan ödün verebilir. Bitki türüne koşullu mimariler üzerine son çalışmalar, her iki avantajı birleştirmeye çalışmaktadır.

Bağlantılar

Verim tahmini, iklim etki modellemesi, uzaktan algılama boru hatları ve sulama optimizasyonu ile sıkı bir şekilde entegre olur. Ayrıca tarım ekonomisi ve politikayla da bağlantılıdır; doğru tahminler doğrudan sübvansiyon tahsisi, ticaret kararları ve gıda yardımı dağıtımını etkiler.

Ingest Edilen Makalelerden Bulgular

Rastgele Orman ile Küresel ve Bölgesel Verim Tahmini

[Jeong et al., 2016] — Rastgele Orman (RF) regresyonu, buğday, dane mısır, patates ve silajlık mısır verim tahmininde küresel ve bölgesel ölçeklerde değerlendirilmiştir. RF, tüm test vakalarında çoklu doğrusal regresyona (MLR) kıyasla belirgin biçimde üstün performans göstermiştir. Küresel buğday veriminde RF modeli R-kare (EF) = 0.96 ve RMSE = 0.32 ton/ha (%11.9) elde ederken, MLR RMSE = 1.32 ton/ha (%49.2) ile sınırlı kalmıştır. ABD ilçe düzeyinde 30 yıllık dane mısır tahmininde RF RMSE = 1.13 ton/ha (%16.7), EF = 0.76 değerlerine ulaşmıştır. NESR bölgesinde patates veriminde RMSE = 2.77 ton/ha (%13.9), silajlık mısırda RMSE = 1.90 ton/ha (%5.8) raporlanmıştır. Tüm test vakalarında RF'nin RMSE değeri ortalama verime oranla %6-14 arasında seyrederken, MLR'de bu oran %14-49 arasında kalmıştır. Değişken önem analizi, azot gübre oranının (NFERT) küresel buğday veriminde en etkili değişken olduğunu, ABD mısır veriminde ise yıl (teknolojik ilerleme trendi) faktörünün en belirleyici olduğunu ortaya koymuştur.

CNN-RNN Çerçevesi ile Verim Tahmini

[Khaki et al., 2020] — ABD Mısır Kuşağı'ndaki 13 eyalette 1980-2018 yılları arasında ilçe düzeyinde mısır ve soya fasulyesi verim tahmini için CNN-RNN hibrit derin öğrenme çerçevesi önerilmiştir. Model; hava durumu CNN'i (W-CNN), toprak CNN'i (S-CNN) ve LSTM hücreli RNN bileşenlerinden oluşmaktadır. CNN-RNN modeli, 2016-2018 doğrulama yıllarında mısır için RMSE = 15.74-17.64 bushel/acre (korelasyon katsayısı %85-88), soya fasulyesi için RMSE ~ %8 elde etmiştir. RF modelinin mısır doğrulama RMSE'si 25-29 bushel/acre, DFNN'nin ise 21-27 bushel/acre ile sınırlı kalması, CNN-RNN'nin tüm yöntemlerden belirgin biçimde üstün olduğunu göstermiştir. Geri yayılım tabanlı özellik seçimi analizi, güneş radyasyonunun mısır verimi için en hassas hava değişkeni olduğunu ve kritik dönemin mısır ipeklenme zamanına (30. hafta) denk geldiğini ortaya koymuştur. Modelin en önemli %50 özelliklerle eğitilmesi durumunda bile tahmin doğruluğunun önemli ölçüde düşmediği gösterilmiştir.

Bitki Modeli + Makine Öğrenmesi Hibrit Yaklaşımı

[Shahhosseini et al., 2021] — ABD Mısır Kuşağı'nda (Illinois, Indiana, Iowa) 1984-2018 dönemi için APSIM bitki simülasyon modeli çıktılarının makine öğrenmesi girdisi olarak kullanılmasının mısır verim tahminini iyileştirip iyileştirmediği araştırılmıştır. Beş ML modeli (doğrusal regresyon, LASSO, LightGBM, RF, XGBoost) ve altı topluluk modeli test edilmiştir. APSIM değişkenlerinin ML girdilerine eklenmesi, RMSE'yi %7-20 oranında düşürmüştür; en iyi durumda RMSE'deki iyileşme %27'ye ulaşmıştır. 2018 test yılında LightGBM hibrit modeli RMSE = 883 kg/ha (RRMSE %7.2, R-kare = 0.562) ile en düşük bireysel model hatasını verirken, optimize edilmiş ağırlıklı topluluk modeli RMSE = 909 kg/ha (RRMSE %7.4, R-kare = 0.536) elde etmiştir. Kısmi APSIM değişken analizi, toprak nemi ile ilgili APSIM değişkenlerinin (özellikle ortalama kuraklık stresi ve ortalama su tablası derinliği) ML tahminleri üzerinde en etkili faktörler olduğunu göstermiştir. Bu bulgu, yalnızca hava durumu verisiyle çalışan ML modellerinin yetersiz kaldığını ve hidrolojik girdilerin kritik önem taşıdığını ortaya koymaktadır.

Makine Öğrenmesi ile İklim Değişikliği Etki Değerlendirmesi

[Makale 5 (W2891765392)] — Bu dosya geçerli bir PDF formatında olmadığı için okunamadı (bozuk dosya).

Küresel Mısır Gıda Güvenliği: Geçmiş Başarılar ve Gelecek Zorluklar

Makine Öğrenmesi Topluluk Modelleri ile Mısır Verim Tahmini

[Shahhosseini et al., 2020] — ABD Mısır Kuşağı'ndaki üç eyalette (Illinois, Indiana, Iowa) 2000-2018 dönemi için ilçe düzeyinde mısır verim tahminine yönelik makine öğrenmesi topluluk (ensemble) modeli çerçevesi geliştirilmiştir. Çeşitli temel öğreniciler (LASSO, RF, XGBoost, LightGBM, kNN) ve topluluk stratejileri (ortalama topluluk, optimize edilmiş ağırlıklı topluluk, yığınlı LASSO, yığınlı RF, yığınlı XGBoost) sistematik biçimde karşılaştırılmıştır. En hassas modeller optimize edilmiş ağırlıklı topluluk ve ortalama topluluk olup RRMSE %9.5 değerine ulaşmıştır. Yığınlı LASSO en düşük sapmalı tahminleri yapmış (MBE = 53 kg/ha), diğer topluluk modelleri de sapma açısından bireysel modelleri geçmiştir. Kısmi mevsim içi bilgiyle 1 Haziran itibariyle %9.2 RRMSE ile makul tahminler yapılabilmektedir. Özellik önem analizi, 18-24. hafta (1 Mayıs - 1 Haziran) hava durumu özelliklerinin en önemli girdi değişkenleri olduğunu göstermiştir. Model ilçe düzeyinin yanı sıra tarım bölgesi ve eyalet düzeyinde de bireysel modellerden ve referans topluluklardan daha iyi performans sergilemiştir. (232 atıf)

İklim Değişkenliği ve Verim Tahmin Belirsizliği

[Ray et al., 2015] — Yaklaşık 13.500 siyasi birimde yapılan küresel analiz, iklim değişkenliğinin mısır, pirinç, buğday ve soya fasulyesi verim değişkenliğinin %32-39'unu açıkladığını göstermiştir. ABD Ortabatı mısır kuşağında bu oran %42'ye, Japonya'da pirinç için %79'a çıkmaktadır. İklim kaynaklı yıllık mısır üretim dalgalanması yaklaşık 22 milyon ton olup, birçok Latin Amerika ve Afrika ülkesinin toplam mısır üretimine eşdeğerdir. Verim tahmin modelleri için kritik çıkarım: ABD Ortabatı'nın üst ve doğu bölgelerinde aşırı sıcaklık değişkenliği, batı ve orta bölgelerinde ise aşırı yağış değişkenliği verim dalgalanmasını belirleyen ana faktördür. Bu mekansal heterojenlik, bölgeye özgü tahmin modellerinin gerekliliğini vurgulamaktadır. (1.904 atıf)

[Shiferaw et al., 2011] — Pirinç ve buğday ile birlikte mısırın 94 gelişmekte olan ülkede 4.5 milyardan fazla insana gıda kalorilerinin en az %30'unu sağladığını raporlayan kapsamlı bir derleme. Küresel mısır alanı 2008-2010 ortalamasıyla yaklaşık 150 milyon hektar olup, yıllık üretim 750 milyon metrik tonu aşmıştır; bu, buğday ve pirinç üretiminin çok üzerindedir. Afrika ve Mezoamerika'da mısır tek başına gıda kalorilerinin %20'sinden fazlasını karşılamaktadır. Lesotho, Malavi ve Zambiya'da kişi başı yıllık mısır tüketimi 100 kg'ı aşmakta ve toplam kalorinin %50'sinden fazlasını oluşturmaktadır. CIMMYT verilerine dayanan analizlere göre (Lobell et al., 2011), 30 derecenin üzerinde geçirilen her derece-gün optimal koşullarda nihai verimi %1, kuraklık koşullarında ise %1.7 oranında düşürmektedir. Gelişmekte olan ülkelerde mısır ithalatının bugünkü talebin %7'sinden 2050'de %24'e yükseleceği ve bunun yaklaşık 30 milyar USD tutarında olacağı öngörülmektedir. 2003-2008 döneminde mısır üretimi Asya'da yıllık %6.0, Latin Amerika'da %5.0 ve Sahra altı Afrika'da %2.3 oranında artmıştır. Küresel düzeyde mısır talebinin %63'ü hayvan yemi olarak kullanılırken, Sahra altı Afrika'da (Güney Afrika hariç) üretimin üçte ikisinden fazlası gıda olarak tüketilmektedir. Hayvan yemi olarak mısır talebi yılda %6 büyümekte olup, özellikle Asya'da (Çin, Hindistan) et ve süt ürünleri talebinin artışıyla ivme kazanmıştır. Son 40 yılda mısır üretimi, ıslah edilmiş çeşitler ile artan gübre, su ve pestisit girdileri sayesinde iki katına çıkmıştır; ancak iklim değişikliği nedeniyle tropik bölgelerde verim düşüşlerinin yaşanacağı öngörülmektedir.