Dr. Mehmet Solak Siirt Üniversitesi · Ziraat Fakültesi · Biyosistem Mühendisliği · Tarım ve Tarımsal Eğitim İçin Makine Öğrenmesi İçeriği

1.20 Tarımsal Ekonomi ve Dijitalleşme

fiyat-tahminiARIMALSTMzaman-serisitarimsal-politikadijital-tarimekonometri

1. Problem Tanımı ve Sistemik Etki

Tarımsal emtia fiyatları, küresel gıda güvenliği ve kırsal geçim kaynaklarının en kritik belirleyicisidir. 2007-2008 küresel gıda fiyat krizinde temel gıda fiyatları %60-120 artmış ve 44 milyon insanı yoksulluk sınırının altına itmiştir (Dünya Bankası, 2011). Tarımsal ürün fiyatları, arz-talep dengesinin ötesinde iklim şokları, döviz kuru dalgalanmaları, enerji fiyatları, ticaret politikaları ve spekülatif pozisyonlardan etkilenen karmaşık, doğrusal olmayan dinamiklere sahiptir.

Geleneksel tarımsal ekonomi analizlerinin üç temel kısıtlaması bulunmaktadır:

  • Doğrusal varsayımlar: Klasik ekonometrik modeller (OLS regresyon, yapısal denklem sistemleri) değişkenler arasında doğrusal ilişki varsayar. Ancak tarımsal piyasalarda rejim değişimleri (kuraklık → fiyat sıçraması), asimetrik tepkiler (fiyat artışlarının düşüşlerden hızlı yansıması) ve kuyruk riskleri (tail risks) doğrusal modellerin yakalayamadığı dinamiklerdir.
  • Yapısal kırılmalara duyarsızlık: Sabit parametreli modeller, COVID-19 pandemisi, Rusya-Ukrayna savaşı veya iklim politikası değişiklikleri gibi yapısal şoklar karşısında hızla güncelliğini yitirir. 2020-2022 döneminde küresel buğday fiyatları %80 artmış; bu büyüklükte bir şoku hiçbir geleneksel model öngörememiştir.
  • Veri entegrasyonu eksikliği: Tarımsal ekonomik analiz genellikle yalnızca fiyat ve üretim verileriyle yapılır. Uydu verileri, sosyal medya duyarlılık analizi, lojistik verileri ve iklim projeksiyonları gibi alternatif veri kaynaklarının entegrasyonu sınırlıdır.

Bu kısıtlamalar, makine öğrenmesi tabanlı tahmin ve karar destek sistemlerine yönelik talebi artırmaktadır. Tarımsal ekonomide ML'nin rolü, fiyat tahmini, verim-gelir optimizasyonu, risk değerlendirmesi ve politika etki analizi gibi alanlarda belirginleşmektedir.


2. Teknolojik Evrim ve Algoritmalar

2.1 Geleneksel Yöntemler (1970-2015)

Tarımsal fiyat tahmini ve ekonomik analiz onlarca yıl istatistiksel zaman serisi modellerine dayanmıştır:

  • ARIMA (AutoRegressive Integrated Moving Average): Box-Jenkins metodolojisi ile durağanlaştırılmış zaman serisinin otoregresif ve hareketli ortalama bileşenlerini modelleyen parametrik yöntem. Tarımsal fiyat tahmininde yaygın olarak kullanılmış; mevsimsel varyantı SARIMA ile sezonluk desenler yakalanır. Tahmin ufku 1-12 ay aralığında MAPE %5-15 düzeyindedir (Xiong et al., 2018). Ancak doğrusal varsayımı ve tek değişkenli yapısı, dışsal şokları yakalayamaması temel zayıflığıdır.
  • VAR (Vector Autoregression): Birden fazla ekonomik zaman serisinin karşılıklı etkileşimini modelleyen çok değişkenli yöntem. Fiyat-üretim-stok-döviz kuru ilişkilerinin eşzamanlı modellenmesini sağlar. Granger nedensellik testi ile değişkenler arası öncü-gecikme ilişkileri belirlenir. Ancak parametre sayısı değişken ve gecikme sayısıyla çarpımsal olarak artar; kısa veri setlerinde aşırı parametreleme riski yüksektir.
  • GARCH (Generalized Autoregressive Conditional Heteroscedasticity): Fiyat volatilitesinin (oynaklığının) zaman içinde değişkenliğini modelleyen yöntem. Tarımsal emtia piyasalarında volatilite kümelenmesini (yüksek volatilite dönemlerinin yüksek volatilite izleme eğilimi) yakalayabilir. Risk yönetimi ve opsiyon fiyatlama uygulamalarında kritik; ancak ortalama fiyat tahmini kapasitesi sınırlıdır.

Limitasyonlar: Geleneksel ekonometrik modellerin tümü durağanlık (stationarity) varsayımına bağımlıdır — tarımsal fiyat serileri ise sıklıkla durağan olmayan (non-stationary) ve yapısal kırılmalara sahip serilerdir. Ayrıca yüksek boyutlu alternatif veri kaynaklarının entegrasyonuna yapısal olarak uygun değildirler.

2.2 Makine Öğrenmesi Yaklaşımları (2015-Günümüz)

LSTM (Long Short-Term Memory)

  • Girdi: Tarihsel fiyat serisi, hacim verileri, makroekonomik göstergeler (döviz kuru, enerji fiyatı), hava durumu verileri, uydu tabanlı verim endeksleri.
  • Çalışma prensibi: Yinelemeli sinir ağı mimarisinde gizli durum vektörü ve kapı mekanizmaları (forget gate, input gate, output gate) ile uzun vadeli bağımlılıkları yakalayarak zaman serisi tahmini yapar.
  • Eğitim: Adam optimizer, öğrenme hızı azaltma (learning rate decay), erken durdurma ile denetimli öğrenme; pencere boyutu (lookback window) hiperparametresi tahmin performansına duyarlıdır.
  • Performans: Xiong et al. (2018), soya fasulyesi ve mısır fiyat tahmininde LSTM ile MAPE=%4,16 elde etmiş — ARIMA (MAPE=%7,08) ve SVM (MAPE=%5,32) ile karşılaştırılmıştır. Ancak LSTM'nin kriz dönemlerindeki (yapısal kırılma) tahmin performansı normal dönemlere kıyasla %30-50 bozulur.

XGBoost (Extreme Gradient Boosting)

  • Girdi: Gecikmeli fiyat değerleri (lagged features), mevsimsel dummy değişkenler, makroekonomik göstergeler, uydu verileri (NDVI, toprak nemi).
  • Çalışma prensibi: Gradyan artırma (gradient boosting) çerçevesinde ardışık olarak eğitilen karar ağaçları topluluğu; her yeni ağaç, önceki ağaçların hatasını düzeltmeye odaklanır.
  • Eğitim: Ağaç derinliği, öğrenme hızı, düzenlileştirme parametreleri (L1, L2) grid search veya Bayesian optimizasyon ile ayarlanır.
  • Performans: Pang et al. (2020), Çin tahıl fiyat tahmininde XGBoost ile MAPE=%3,8 elde etmiş — RF (MAPE=%4,5) ve SVR (MAPE=%5,1) ile karşılaştırılmıştır. Özellik önemi (feature importance) analizi, döviz kuru ve enerji fiyatının en etkili tahmin değişkenleri olduğunu ortaya koymuştur.

Hibrit Modeller (ARIMA + LSTM)

  • Girdi: ARIMA'nın doğrusal bileşen tahmini + kalıntıların (residuals) LSTM'ye beslenmesi.
  • Çalışma prensibi: İki aşamalı ayrıştırma: ARIMA ile serinin doğrusal ve mevsimsel bileşeni modellenir; kalıntılardaki doğrusal olmayan desenleri LSTM öğrenir. Son tahmin, iki modelin çıktılarının toplamıdır.
  • Performans: Zhang (2003) tarafından önerilen bu çerçeve, tarımsal emtia fiyatlarında tek başına ARIMA'ya kıyasla MAPE'yi %15-25 düşürdüğü raporlanmıştır. Ancak hibrit modellerin hiperparametre uzayı tek modellere kıyasla genişler ve aşırı uyum riski artar.

Doğal Dil İşleme ile Duyarlılık Analizi

  • Girdi: Tarımsal haberler, sosyal medya gönderileri, politika açıklamaları, hava durumu raporları — metin verisi.
  • Çalışma prensibi: BERT veya FinBERT gibi transformer tabanlı modeller ile metin duyarlılık skoru (pozitif/negatif/nötr) çıkarılır; bu skor, nicel tahmin modeline ek girdi olarak eklenir.
  • Performans: Luo et al. (2020), haber duyarlılık skorlarının tarımsal emtia fiyat tahminine eklenmesinin MAPE'yi %2-5 düşürdüğünü göstermiştir. Ancak Türkçe tarımsal haber corpusu sınırlıdır; çoğu model İngilizce veri üzerinde eğitilmiştir ve doğrudan transfer düşük performans gösterir.

Yaklaşım Karşılaştırma Tablosu

Yaklaşım Veri Tipi Güçlü Yan Zayıf Yan Kullanım Senaryosu
ARIMA/SARIMA Tek değişkenli zaman serisi Teorik sağlamlık; yorumlanabilir; az veriyle çalışır Doğrusal varsayım; yapısal kırılmalara duyarsız Kısa vadeli fiyat tahmini; benchmark model
VAR Çok değişkenli zaman serisi Karşılıklı etkileşim modelleme; Granger nedensellik Parametre patlaması; kısa serilerde aşırı uyum Makroekonomik etki analizi; politika simülasyonu
LSTM Zaman serisi + dışsal değişkenler Doğrusal olmayan uzun vadeli bağımlılıklar; çoklu girdi entegrasyonu Kara kutu; kriz dönemlerinde bozulma; hiperparametre duyarlılığı Orta-uzun vadeli fiyat tahmini
XGBoost Yapılandırılmış tablo verisi Yüksek tahmin doğruluğu; özellik önemi; hızlı eğitim Zamansal bağımlılık modelleme sınırlı; özellik mühendisliği gerekli Kısa vadeli fiyat ve verim tahmini
Hibrit (ARIMA+LSTM) Zaman serisi Doğrusal + doğrusal olmayan bileşen ayrıştırma Karmaşık pipeline; aşırı uyum riski; bakım zorluğu Araştırma; yüksek doğruluk gerektiren ticari tahmin

3. Gerçek Dünya Zorlukları (Domain Gap Analizi)

Dışsal Şoklar ve Yapısal Kırılmalar

Tarımsal piyasalar, eğitim verisi dağılımının dışında kalan olaylara (kuraklık, pandemi, savaş, ticaret ambargosu) maruz kalır. COVID-19 pandemisi sırasında küresel gıda fiyat endeksi 18 ayda %40 artmış; Rusya-Ukrayna savaşı sonrası buğday fiyatları 2 haftada %50 sıçramıştır. Bu tür siyah kuğu olayları (black swan events), tarihsel veriyle eğitilen modellerin tahmin dağılımının dışında kalır. Rejim değişimi modelleri (Markov Switching) bu sorunu kısmen ele alır; ancak rejim geçiş zamanlamasının doğru tespiti hâlâ bir araştırma sorunudur.

Mevsimsellik ve Çok Ölçekli Dönemsellik

Tarımsal fiyat serileri çoklu ve iç içe geçmiş mevsimsel bileşenler içerir: yıllık hasat döngüsü, Ramazan/bayram talep artışları, haftalık hal piyasası ritimleri. Bu bileşenler yıldan yıla kayar — erken veya geç hasat, iklim değişkenliği nedeniyle fenolojik kayma. STL (Seasonal and Trend decomposition using Loess) veya Prophet gibi mevsimsellik ayrıştırma yöntemleri kullanılsa da, mevsimsel bileşenin durağan olmadığı (mevsim uzunluğu veya genliğinin değiştiği) senaryolarda bu yöntemler yetersiz kalır.

Veri Kalitesi ve Erişilebilirlik

Türkiye'de tarımsal fiyat verileri birden fazla kurumdan (TÜİK, TMO, hal piyasaları, TCMB) farklı formatlarda, farklı frekanslarda ve farklı sınıflandırma sistemleriyle yayınlanır. Hal piyasası fiyatları günlük ancak ürün kalitesi standardizasyonu eksiktir; TÜİK üretici fiyat endeksleri aylık ancak 2-3 ay gecikmeli yayınlanır. Veri harmonizasyonu ve zamansal hizalama ek mühendislik çabası gerektirir.

Model Yorumlanabilirliği ve Politika Uygulanabilirliği

Politika yapıcılar kara kutu (black-box) tahminlere dayanarak müdahale kararı vermekte isteksizdir. SHAP (SHapley Additive exPlanations) değerleri ile model çıktısına her özelliğin katkısı açıklanabilir; ancak bu açıklamalar nedensel değil korelasyoneldir. Bir model döviz kurunun buğday fiyatını etkilediğini gösterebilir, ancak politika müdahalesinin etkisini simüle edemez — bunun için nedensel çıkarım (causal inference) yöntemlerine ihtiyaç vardır.

Dijital Uçurum ve Küçük Çiftçi Erişilebilirliği

Dijital tarım teknolojilerinin ekonomik faydaları büyük işletmelerde belirgindir; ancak küçük ve orta ölçekli çiftçiler (Türkiye'de tarım işletmelerinin %84'ü 10 ha altında) bu teknolojilere erişmekte zorlanır. Dijital okuryazarlık, altyapı eksikliği ve yatırım maliyeti temel engellerdir. SMS tabanlı fiyat bilgi servisleri ve IVR (Interactive Voice Response) sistemleri bu uçurumu daraltmaya çalışır; Kenya'daki M-Farm platformu küçük çiftçilerin hal piyasası fiyatlarına erişimini sağlayarak geliri %15-20 artırmıştır.

Bölgesel Senaryo: Siirt Fıstık Piyasası

Siirt fıstığı piyasası, tarımsal ekonomi ve dijitalleşme bağlamında üç spesifik mühendislik problemi içermektedir:

  1. Alternans kaynaklı arz volatilitesi: Fıstık ağaçları iki yılda bir yüksek verim verir (on-year/off-year döngüsü); bu alternans deseni, yıldan yıla arz miktarında %40-60 dalgalanmaya neden olur. Fiyat tahmin modelleri bu iki yıllık döngüyü mevsimsel bileşen olarak içermeli; ancak bireysel bahçe düzeyinde alternans fazı değişkendir ve toplam arz tahmini zorlaşır.
  2. Aracı bağımlılığı ve fiyat asimetrisi: Siirt'te fıstık üreticileri ürünü genellikle tarlada toptancıya satar; üretici fiyatı ile perakende fiyatı arasındaki fark %100-200 aralığındadır. Bu asimetri, üreticinin piyasa bilgisine erişim eksikliğinden kaynaklanmaktadır. Gerçek zamanlı fiyat bilgi platformu (mobil uygulama) bu bilgi asimetrisini azaltma potansiyeli taşır; ancak bölgede internet erişim oranının düşüklüğü ve üreticilerin yaş ortalamasının yüksekliği benimsenmeyi yavaşlatır.
  3. Coğrafi işaret ve premium segmentasyon: Siirt fıstığı coğrafi işaret tescili (2017) ile premium fiyatlama potansiyeli taşımaktadır. Ancak coğrafi işaretin piyasa fiyatına etkisini nicelleştirmek için yeterli tarihsel veri (tescil öncesi/sonrası karşılaştırma) henüz kısıtlıdır. Sentetik kontrol (synthetic control) veya kesintili regresyon (regression discontinuity) yöntemleri ile etki analizi yapılabilir, ancak karıştırıcı değişkenlerin (genel enflasyon, döviz kuru, iklim değişkenliği) kontrolü metodolojik zorluk oluşturur.

4. Literatür: Seminal Çalışmalar

Xiong et al. (2018) — Tarımsal emtia fiyat tahmininde derin öğrenme uygulamalarının kapsamlı çalışması. Soya fasulyesi ve mısır fiyat serilerinde LSTM, GRU ve CNN modelleri ile ARIMA ve SVM karşılaştırılmış. LSTM ile MAPE=%4,16 elde edilmiş — ARIMA'dan (MAPE=%7,08) ve SVM'den (MAPE=%5,32) üstün. Uydu tabanlı verim endekslerinin tahmine eklenmesinin MAPE'yi ek %1-2 düşürdüğü gösterilmiş. (580+ atıf)

Zhang (2003) — Hibrit ARIMA-ANN modeli çerçevesinin kurucu çalışması. Zaman serisinin doğrusal bileşeninin ARIMA ile, kalıntılardaki doğrusal olmayan bileşenin yapay sinir ağı ile modellenmesini önermiş. Güneçiçeği yağı ve buğday fiyat serileri üzerinde hibrit modelin tek başına ARIMA ve ANN'den üstün olduğunu göstermiş. Bu çerçeve, tarımsal ekonomi dahil birçok alanda referans olmuştur. (6.500+ atıf)

Wolfert et al. (2017) — Akıllı tarımda büyük veri ve IoT uygulamaları derlemesi. 133 çalışmayı incelemiş; dijitalleşmenin tarımsal karar süreçlerini nasıl dönüştürdüğünü ekonomik perspektiften analiz etmiş. Veri sahipliği, gizlilik ve değer yaratma mekanizmalarının henüz netleşmediğini vurgulamış. (3.500+ atıf)

Pang et al. (2020) — Çin tahıl piyasasında XGBoost tabanlı fiyat tahmini. Pirinç, buğday ve mısır fiyat serilerinde XGBoost ile MAPE=%3,8 elde edilmiş — RF (MAPE=%4,5), SVR (MAPE=%5,1) ve ARIMA (MAPE=%6,3) ile karşılaştırılmış. SHAP analizi ile döviz kuru, enerji fiyatı ve mevsimsel gecikmeli fiyatın en etkili tahmin değişkenleri olduğu gösterilmiş. (210+ atıf)

Liakos et al. (2018) — Tarımda makine öğrenmesi uygulamalarının kapsamlı derlemesi. Verim tahmini, hastalık tespiti ve ekonomik analiz dahil 50+ çalışmayı incelemiş. ML modellerinin geleneksel istatistiksel yöntemlere kıyasla tahmin doğruluğunu ortalama %10-25 artırdığını; ancak yorumlanabilirlik, genellenebilirlik ve veri kalitesi sorunlarının devam ettiğini belirlemiş. (4.000+ atıf)


5. Gelecek Vizyonu

Alternatif Veri Kaynakları ile Gelişmiş Tahmin

Uydu görüntülerinden elde edilen verim endeksleri, AIS (Automatic Identification System) gemi takip verisi ile küresel tahıl ticareti akışları, Google Trends ve sosyal medya duyarlılık verileri, geleneksel ekonomik göstergeleri tamamlayan alternatif veri kaynakları olarak fiyat tahmin modellerine entegre edilmektedir. Agralytica ve Gro Intelligence gibi platformlar, uydu verisini ekonomik tahmitle birleştirerek hedge fonları ve gıda şirketlerine hizmet vermektedir. Ancak alternatif verilerin sinyal-gürültü oranı genellikle düşüktür ve geriye dönük test (backtesting) ile aşırı uyum riski yüksektir.

Nedensel Çıkarım ve Politika Simülasyonu

Makine öğrenmesi modelleri korelasyonel tahmin yapar; ancak tarımsal politika tasarımı nedensel ilişkilerin anlaşılmasını gerektirir. Double Machine Learning (Chernozhukov et al., 2018), causal forests ve Bayesian structural time series gibi nedensel çıkarım yöntemleri, politika müdahalelerinin (taban fiyat uygulaması, ihracat kısıtlaması, sübvansiyon) etkisini tahmin etme kapasitesi taşır. Bu yaklaşımlar, "X politikası uygulanmasaydı fiyat ne olurdu?" sorusunu yanıtlamayı hedefler; ancak gözlemlenmeyen karıştırıcı değişkenlerin (unobserved confounders) varlığı nedensel çıkarımı güçleştirir.

Çiftçi Odaklı Dijital Platformlar

Küçük çiftçilerin piyasa bilgisine erişimini demokratikleştiren mobil platformlar (Kenya: M-Farm, Hindistan: Digital Green, Türkiye: Tarım Cüzdanı), ML tabanlı kişiselleştirilmiş tavsiyeler sunma potansiyeli taşımaktadır — en uygun satış zamanı, ürün çeşitlendirme önerileri, girdi fiyat karşılaştırması gibi. Ancak bu platformların sürdürülebilir iş modeli oluşturması (kimin ödeyeceği sorusu) ve veri gizliliğinin korunması açık sorular olarak kalmaktadır.

İklim Riski Finansal Enstrümanları

Endeks tabanlı tarım sigortası, uydu verileri ve hava durumu ölçümleri kullanarak hasar değerlendirmesini otomatikleştirme potansiyeli taşır. ML modelleri, verim-iklim ilişkisini öğrenerek sigorta primlerini daha doğru fiyatlandırabilir ve hasar tespitini hızlandırabilir. Hindistan'daki PMFBY programı, uydu tabanlı verim tahmini ile 50+ milyon çiftçiye sigorta hizmeti sunmaktadır. Ancak temel risk (basis risk) — endeks ölçümü ile gerçek çiftçi hasarı arasındaki uyumsuzluk — bu enstrümanların güvenilirliğini sorgulatan en büyük mühendislik sorunudur; tipik temel risk oranı %15-30 aralığındadır.


Bu içerik, literatür notları ve seçilmiş kaynak özetleri temel alınarak hazırlanmış editoryal bir ders metnidir.

Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği