Ders 9: LSTM ve Zaman Serisi Tahmini

derslstmgrurnnzaman-serisiverim-tahminitarım

9.1 Giriş: Tarımda Zamansal Bağımlılık

Tarımsal sistemler doğası gereği zamansal yapıdadır. Bugünkü toprak nemi, dünün yağışının sonuçudur. Bu haftaki bitki büyümesi, geçen haftaki sıcaklık ve sulama kararlarının yansımalıdır. Sezon sonu verim, tüm büyüme dönemindeki hava koşulları, gübre uygulamaları ve hastalık baskılarının birikimsel etkisidir. Bu tür "geçmişten geleceğe akan" veriler, zaman serileri olarak adlandırılır ve özel modelleme teknikleri gerektirir.

Geleneksel makine öğrenimi modelleri (Random Forest, SVM gibi) her veri noktasını bağımsız olarak değerlendirir; yani "dünkü yağış" bilgisini "bugünkü verim tahmini" ile ilişkilendiremez. Tekrarlayan sinir ağları (RNN) ve özellikle LSTM (Long Short-Term Memory), tam da bu zamansal bağımlılığı modellemek için tasarlanmıştır.

Shahhosseini ve arkadaşları (2020), ABD Mısır Kuşağında (Illinois, Indiana, Iowa) mısır verim tahmininde zaman serisi yapısını korumak için özel olarak "blocked sequential procedure" kullanmış ve geleneksel k-fold cross-validation'ın zaman serisi verilerinde yanıltıcı sonuçlar ürettiğini göstermiştir. Çalışmanın temel bulgularından biri, 18-24. haftalar (Mayıs başı - Haziran başı) arasındaki hava durumu verilerinin verim tahmini için en belirleyici giriş özellikleri olduğunun tespit edilmesidir.

9.2 RNN: Tekrarlayan Sinir Ağları

9.2.1 Neden RNN Gerekli?

Standart bir sinir ağı (MLP), her girişi bağımsız işler. Ancak tarımsal zaman serilerinde sıra önemlidir:

Hafta 1: 50mm yağış
Hafta 2: 10mm yağış
Hafta 3: 0mm yağış

Bu sıra "azalan yağış trendi" gösterir ve kuraklık riski işaret eder. Aynı verileri karıştırırsak (0, 50, 10mm) farklı bir anlam taşır. RNN, bu sıralamadaki bilgiyi koruyan bir "hafıza" mekanizmasına sahiptir.

9.2.2 RNN'in Çalışma Prensibi

RNN'de her zaman adımında:

Mevcut giriş (xt) alınır -- örneğin bu haftanın yağış verisi.
Önceki adımın gizli durumu (ht-1) alınır -- geçen haftanın "hafızası".
Her ikisi birleştirilip yeni gizli durum (ht) hesaplanır:

$$h_t = tanh(W_{xh} \cdot x_t + W_{hh} \cdot h_{t-1} + b_h)$$

Tarımsal benzetme: Bir çiftçinin her hafta tarla durumunu değerlendirmesi gibi; sadece bu haftanın verisine değil, geçen haftaki gözlemlerinin birikimsel bilgisine de dayanarak karar verir.

9.2.3 RNN'in Zayıflığı: Kaybolan Gradyan

RNN'in temel problemi, uzun zaman dizilerinde geçmiş bilginin kaybolmasıdır. Örneğin, Mart ayındaki toprak işleme kararının Eylül ayındaki hasat verimi üzerindeki etkisi, RNN tarafından yakalanamayabilir. Bunun nedeni, geri yayılım sırasında gradyanların her adımda küçülmesi (vanishing gradient) veya patlayarak büyümesi (exploding gradient) dir.

Tarımsal sonuç: Basit bir RNN, büyüme sezonunun başlangıcındaki (ekim dönemi) kararların sezon sonundaki (hasat) etkisini modelleyemez. Bu eksiklik LSTM'in geliştirilmesine yol açmıştır.

9.3 LSTM: Uzun Kısa Süreli Bellek

9.3.1 LSTM'in Temel Fikri

LSTM (Long Short-Term Memory), 1997'de Hochreiter ve Schmidhuber tarafından önerilmiştir. Temel yeniliği: Bilgiyi seçici olarak saklayabilen, güncelleyebilen veya silebilen kapı mekanizmaları (gates) içermesidir.

LSTM, üç kapı ve bir hücre durumu (cell state) içerir:

9.3.2 Unutma Kapısı (Forget Gate)

$$f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$$

İşleyiş: 0 ile 1 arasında bir değer üretir. 0 = "tamamen unut", 1 = "tamamen hatırla".

Tarımsal Örnek: Sezonun başında tarla sulandı ve toprak nemi yüksekti. Aradan 4 hafta geçti ve hiç yağış olmadı. Unutma kapısı, eski nem bilgisinin artık geçersiz olduğuna karar verir (ft yaklaşık 0) ve bu bilgiyi siler. Ancak aynı dönemde uygulanan gübredeki azot miktarı, bitki gelişimini hâlâ etkiliyor olabilir; bu bilgi korunur (ft yaklaşık 1).

9.3.3 Giriş Kapısı (Input Gate)

$$i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$$ $$\tilde{C}t = tanh(W_C \cdot [h, x_t] + b_C)$$

İşleyiş: Yeni gelen bilgiden ne kadarının hücre durumuna eklenmesi gerektiğine karar verir.

Tarımsal Örnek: Bu hafta şiddetli bir dolu yağışı oldu. Giriş kapısı, bu kritik olayın hafızaya kaydedilmesine karar verir (it yaklaşık 1). Aynı hafta rutin bir sıcaklık değişimi oldu; bu önemli değil, kaydetme (it yaklaşık 0).

9.3.4 Hücre Durumu Güncellemesi

$$C_t = f_t \odot C_{t-1} + i_t \odot \tilde{C}_t$$

Bu formül LSTM'in kalbidir. Eski hafıza (Ct-1) unutma kapısıyla filtrelenir, yeni bilgi giriş kapısıyla eklenir. Sonuç, güncellenmiş uzun süreli hafızadır.

Tarımsal Yorum: Hücre durumu, tüm büyüme sezonu boyunca biriken bilgidir -- ekim zamanındaki toprak durumu, yağış birikimi, gübre uygulamaları, hastalık baskıları. Bu bilgi, sezon boyunca seçici olarak güncellenir.

9.3.5 Çıkış Kapısı (Output Gate)

$$o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$$ $$h_t = o_t \odot tanh(C_t)$$

İşleyiş: Hücre durumunun ne kadarının çıkış olarak kullanılacağına karar verir.

Tarımsal Örnek: Sezon ortasında verim tahmini yapılırken, toplandaki tüm bilgi gerekli değil; sadece şu anki büyüme aşamasıyla ilgili bilgi çıkışa yansıtılır. Örneğin çiçeklenme döneminde ekim zamanı bilgisi doğrudan gerekli olmayabilir, ama toprak besin durumu bilgisi kritiktir.

9.3.6 LSTM Kapıları Özet Tablosu

Kapı	Formül	İşlevi	Tarımsal Karşılığı
Unutma (Forget)	ft = sigma(...)	Eski bilgiyi sil/koru	Eski nem verisi artık geçersiz mi?
Giriş (Input)	it = sigma(...)	Yeni bilgiyi ekle	Dolu yağışı önemli bir olay mı?
Çıkış (Output)	ot = sigma(...)	Çıkışa ne aktarılsın?	Hangi bilgi şimdi tahmin için gerekli?
Hücre Durumu	Ct = ftCt-1 + itCt	Uzun süreli hafıza	Sezon boyunca biriken bilgi

9.4 GRU: Basitleştirilmiş LSTM

9.4.1 GRU Yapısı

GRU (Gated Recurrent Unit), Cho ve arkadaşları tarafından 2014'te önerilmiştir. LSTM'in basitleştirilmiş versiyonudur: Üç kapı yerine iki kapı kullanır ve ayrı bir hücre durumu yoktur.

Sıfırlama Kapısı (Reset Gate): $$r_t = \sigma(W_r \cdot [h_{t-1}, x_t])$$

Güncelleme Kapısı (Update Gate): $$z_t = \sigma(W_z \cdot [h_{t-1}, x_t])$$

Gizli Durum Güncellemesi: $$h_t = (1 - z_t) \odot h_{t-1} + z_t \odot \tilde{h}_t$$

Güncelleme kapısı, LSTM'deki unutma ve giriş kapılarının birleşik versiyonudur. "Ne kadarını unut, ne kadarını ekle" kararını tek bir kapı ile verir.

9.4.2 LSTM vs GRU Karşılaştırması

Özellik	LSTM	GRU
Kapı Sayısı	3 (forget, input, output)	2 (reset, update)
Hücre Durumu	Ayrı Ct var	Gizli durumla birleşik
Parametre Sayısı	Daha fazla	Daha az (~%25 az)
Eğitim Süresi	Daha uzun	Daha kısa
Uzun Diziler	Genellikle daha başarılı	Kısa-orta dizilerde rekabetçi
Tarımsal Tercih	Çok sezonlu veri	Tek sezon içi tahmin

El-Kenawy ve arkadaşları (2025), patates verim tahmininde hem LSTM hem GRU kullanmış ve sonuçları karşılaştırmıştır:

Model	MSE	RMSE	MAE	R2
LSTM	0.03190	0.17862	0.13718	0.47843
GRU	0.01858	0.13631	0.10441	0.60958

GRU, bu çalışmada LSTM'den belirgin şekilde daha iyi performans göstermiştir. Bu durum, veri seti boyutu ve dizinin uzunluğu ile ilişkili olabilir -- daha kısa dizilerde GRU'nun basitliği avantaj sağlar.

9.5 Tarımsal Zaman Serisi Uygulamaları

9.5.1 Verim Tahmini

Elavarasan ve Vincent (2020), verim tahmininde Deep Recurrent Q-Network (DRQN) modelini önermiştir. Bu model, RNN katmanlarını Q-Learning takviyeli öğrenme ile birleştirmektedir. Çalışmada:

Giriş parametreleri: Çevre değişkenleri (sıcaklık, nem, yağış), toprak özellikleri (pH, N, P, K, organik karbon), yeraltı su parametreleri (seviye, kalite)
Yöntem: RNN tabanlı DQN -- önce RNN ön-eğitim yapılır, sonra Q-Learning ile politika optimizasyonu gerçekleştirilir.
Doğrulama: 5 katlı ileri zincirleme çapraz doğrulama (forward chaining CV). Bu yaklaşım, kronolojik sırayı koruyarak gelecek verinin eğitimde kullanılmasını engeller.

Tarımsal veri setlerinde kronolojik sıralamanın korunması kritiktir. Rastgele k-fold bölme, gelecekteki hava verilerinin geçmişe sızmasına neden olur (data leakage), bu da aşırı iyimser sonuçlar üretir.

9.5.2 Mısır Verim Tahmini (Shahhosseini et al., 2020)

Shahhosseini ve arkadaşları, ABD'nin üç büyük mısır üretici eyaletinde (Illinois, Indiana, Iowa) kapsamlı bir verim tahmin çalışması gerçekleştirmiştir:

Veri Kaynakları: - Toprak parametreleri: 5 km çözünürlük - Hava verileri: 1 km çözünürlük (haftalık ortalama sıcaklık, toplam yağış vb.) - Verim kayıtları: İlçe (county) bazında

Özellik Mühendisliği: - 597 özellikten 3 aşamalı seçim (korelasyon, varyans, doğrusal bağımlılık) ile 72 özelliğe indirgeme - Verim trendi (yield_trend): Her konum için doğrusal regresyon ile yıllık trend hesaplama - Eyalet ortalama verimi (yield_avg): Bölgesel normalizasyon

Walk-Forward Cross-Validation: Zaman serisi verileri için k-fold cross-validation yerine walk-forward prosedür kullanılmıştır. Her katlama: 8 yıl eğitim + 1 yıl doğrulama, ve zaman ileriye doğru kayar. Bu, gerçek tahmin senaryosunu simüle eder.

Ensemble Modelleri ve Sonuçlar:

Model	RRMSE (%)	MBE (kg/ha)
Optimized Weighted Ensemble	9.5	-
Average Ensemble	9.5	-
Stacked LASSO	-	53 (en az bias)
Random Forest (tek)	~11	-
XGBoost (tek)	~10.5	-

Kritik Bulgu: Hava durumu verilerinin 18-24. haftalar (Mayıs-Haziran) arasındaki değerlerinin en önemli giriş özellikleri olduğu tespit edilmiştir. Bu dönem, mısırın vejetatif büyümesinin en kritik aşamasına denk gelir.

9.5.3 Mevsimsel Tahmin Zorluğu

Tarımsal LSTM modellerinin karşılaştığı özel zorluklar:

Zorluk	Açıklama	Çözüm Yaklaşımı
Mevsimsellik	Veri yılda bir kez tekrarlanır	Çok yıllık veri biriktirme, dönem bazlı modelleme
Uzun diziler	6+ aylık büyüme dönemi	LSTM'in uzun süre hafıza avantajı
Dış etkenler	Don, dolu, hastalık salgınları	Olay tabanlı özellikler ekleme
Bölgesel farklılıklar	Her tarla farklı toprak yapısı	Konum bazlı normalizasyon (yield_trend)
Veri kalitesi	Sensör arızaları, eksik ölçümler	İnterpolasyon ve robust normalizasyon

9.6 LSTM ile Verim Tahmini: Adım Adım

9.6.1 Veri Hazırlama

Zaman penceresi oluşturma: Son 12 haftanın hava verilerini giriş, 13. haftanın verim göstergelerini çıkış olarak tanımla.
Normalizasyon: Min-Max veya Z-score ölçekleme. Sıcaklık (0-40 C) ve yağış (0-200 mm) farklı ölçeklerde; normalizasyon olmadan büyük değerli özellikler baskın olur.
Dizi formatı: (örnekler, zaman_adımları, özellikler) şeklinde 3 boyutlu tensor. Örneğin (500 tarla, 12 hafta, 8 özellik).

9.6.2 Model Mimarisi

Giriş: (batch, 12, 8) -- 12 hafta, 8 özellik
    |
LSTM Katmanı (64 birim, return_sequences=True)
    |
Dropout (0.3) -- aşırı uyumu önle
    |
LSTM Katmanı (32 birim)
    |
Dense (16, aktivasyon=ReLU)
    |
Dense (1) -- verim tahmini (ton/ha)

9.6.3 Eğitim Stratejisi

Kayıp fonksiyonu: MSE (verim tahmini regresyon problemi)
Optimizer: Adam (uyarlanabilir öğrenme oranı)
Erken durdurma: Doğrulama kaybı 10 epoch boyunca iyileşmezse dur
Cross-validation: Walk-forward (kronolojik sıralama korunur)

9.7 İleri Konular

9.7.1 Bidirectional LSTM

Çift yönlü LSTM, zaman serisini hem ileriye hem geriye işler. Tarımda pek yaygın değildir (gelecek verisine erişmek gerçek senaryoda mümkün değildir), ancak geçmiş verilerin analizi için kullanılabilir.

9.7.2 Attention Mekanizması

Attention, LSTM'in "hangi zaman adımının daha önemli olduğuna" odaklanmasını sağlar. Tarımsal örnek: Çiçeklenme dönemindeki sıcaklık, verim için diğer haftalara kıyasla çok daha kritiktir. Attention mekanizması bu döneme otomatik olarak daha fazla ağırlık verir.

9.7.3 Transformer Modelleri

Son yıllarda Transformer tabanlı modeller (zaman serileri için Temporal Fusion Transformer, Informer vb.) LSTM'e alternatif olarak ortaya çıkmıştır. Avantajları: paralel işlem, uzun mesafe bağımlılıkları yakalama. Dezavantajı: daha fazla veri ve hesaplama gerektirmesi.

9.8 Özet ve Karşılaştırma

Özellik	Standart RNN	LSTM	GRU
Hafıza	Kısa süreli	Uzun ve kısa süreli	Orta-uzun süreli
Kapı Sayısı	0	3	2
Gradyan Problemi	Ciddi	Büyük ölçüde çözüldü	Büyük ölçüde çözüldü
Parametre	En az	En fazla	Orta
Tarımsal Tercih	Basit görevler	Çok sezonlu tahmin	Kısa diziler, hızlı eğitim
Performans (Patates)	-	MSE=0.032, R2=0.48	MSE=0.019, R2=0.61

Temel Çıkarımlar: 1. Tarımsal veriler doğası gereği zaman serileridir; kronolojik sıralamaya saygı göstermek genellikle gerekir. 2. LSTM, uzun büyüme sezonlarındaki bilgiyi koruyabilen en etkili yapı taşlarından biridir. 3. GRU, LSTM'e daha basit bir alternatiftir ve bazı durumlarda daha iyi performans gösterebilir. 4. Walk-forward cross-validation, tarımsal tahmin modellerinde standart doğrulama yöntemi olmalıdır. 5. Özellik mühendisliği (verim trendi, mevsimsel indeksler) model performansını önemli ölçüde iyileştirir.

Sonraki Ders: 10 Nesne Tespiti Yolo -- Tarlada meyve, yabancı ot ve zararlıları gerçek zamanlı olarak tespit etme: YOLO ailesi.