Ders 9: LSTM ve Zaman Serisi Tahmini
9.1 Giriş: Tarımda Zamansal Bağımlılık
Tarımsal sistemler doğası gereği zamansal yapıdadır. Bugünkü toprak nemi, dünün yağışının sonuçudur. Bu haftaki bitki büyümesi, geçen haftaki sıcaklık ve sulama kararlarının yansımalıdır. Sezon sonu verim, tüm büyüme dönemindeki hava koşulları, gübre uygulamaları ve hastalık baskılarının birikimsel etkisidir. Bu tür "geçmişten geleceğe akan" veriler, zaman serileri olarak adlandırılır ve özel modelleme teknikleri gerektirir.
Geleneksel makine öğrenimi modelleri (Random Forest, SVM gibi) her veri noktasını bağımsız olarak değerlendirir; yani "dünkü yağış" bilgisini "bugünkü verim tahmini" ile ilişkilendiremez. Tekrarlayan sinir ağları (RNN) ve özellikle LSTM (Long Short-Term Memory), tam da bu zamansal bağımlılığı modellemek için tasarlanmıştır.
Shahhosseini ve arkadaşları (2020), ABD Mısır Kuşağında (Illinois, Indiana, Iowa) mısır verim tahmininde zaman serisi yapısını korumak için özel olarak "blocked sequential procedure" kullanmış ve geleneksel k-fold cross-validation'ın zaman serisi verilerinde yanıltıcı sonuçlar ürettiğini göstermiştir. Çalışmanın temel bulgularından biri, 18-24. haftalar (Mayıs başı - Haziran başı) arasındaki hava durumu verilerinin verim tahmini için en belirleyici giriş özellikleri olduğunun tespit edilmesidir.
9.2 RNN: Tekrarlayan Sinir Ağları
9.2.1 Neden RNN Gerekli?
Standart bir sinir ağı (MLP), her girişi bağımsız işler. Ancak tarımsal zaman serilerinde sıra önemlidir:
- Hafta 1: 50mm yağış
- Hafta 2: 10mm yağış
- Hafta 3: 0mm yağış
Bu sıra "azalan yağış trendi" gösterir ve kuraklık riski işaret eder. Aynı verileri karıştırırsak (0, 50, 10mm) farklı bir anlam taşır. RNN, bu sıralamadaki bilgiyi koruyan bir "hafıza" mekanizmasına sahiptir.
9.2.2 RNN'in Çalışma Prensibi
RNN'de her zaman adımında:
- Mevcut giriş (xt) alınır -- örneğin bu haftanın yağış verisi.
- Önceki adımın gizli durumu (ht-1) alınır -- geçen haftanın "hafızası".
- Her ikisi birleştirilip yeni gizli durum (ht) hesaplanır:
$$h_t = tanh(W_{xh} \cdot x_t + W_{hh} \cdot h_{t-1} + b_h)$$
Tarımsal benzetme: Bir çiftçinin her hafta tarla durumunu değerlendirmesi gibi; sadece bu haftanın verisine değil, geçen haftaki gözlemlerinin birikimsel bilgisine de dayanarak karar verir.
9.2.3 RNN'in Zayıflığı: Kaybolan Gradyan
RNN'in temel problemi, uzun zaman dizilerinde geçmiş bilginin kaybolmasıdır. Örneğin, Mart ayındaki toprak işleme kararının Eylül ayındaki hasat verimi üzerindeki etkisi, RNN tarafından yakalanamayabilir. Bunun nedeni, geri yayılım sırasında gradyanların her adımda küçülmesi (vanishing gradient) veya patlayarak büyümesi (exploding gradient) dir.
Tarımsal sonuç: Basit bir RNN, büyüme sezonunun başlangıcındaki (ekim dönemi) kararların sezon sonundaki (hasat) etkisini modelleyemez. Bu eksiklik LSTM'in geliştirilmesine yol açmıştır.
9.3 LSTM: Uzun Kısa Süreli Bellek
9.3.1 LSTM'in Temel Fikri
LSTM (Long Short-Term Memory), 1997'de Hochreiter ve Schmidhuber tarafından önerilmiştir. Temel yeniliği: Bilgiyi seçici olarak saklayabilen, güncelleyebilen veya silebilen kapı mekanizmaları (gates) içermesidir.
LSTM, üç kapı ve bir hücre durumu (cell state) içerir:
9.3.2 Unutma Kapısı (Forget Gate)
$$f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$$
İşleyiş: 0 ile 1 arasında bir değer üretir. 0 = "tamamen unut", 1 = "tamamen hatırla".
Tarımsal Örnek: Sezonun başında tarla sulandı ve toprak nemi yüksekti. Aradan 4 hafta geçti ve hiç yağış olmadı. Unutma kapısı, eski nem bilgisinin artık geçersiz olduğuna karar verir (ft yaklaşık 0) ve bu bilgiyi siler. Ancak aynı dönemde uygulanan gübredeki azot miktarı, bitki gelişimini hâlâ etkiliyor olabilir; bu bilgi korunur (ft yaklaşık 1).
9.3.3 Giriş Kapısı (Input Gate)
$$i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$$ $$\tilde{C}t = tanh(W_C \cdot [h, x_t] + b_C)$$
İşleyiş: Yeni gelen bilgiden ne kadarının hücre durumuna eklenmesi gerektiğine karar verir.
Tarımsal Örnek: Bu hafta şiddetli bir dolu yağışı oldu. Giriş kapısı, bu kritik olayın hafızaya kaydedilmesine karar verir (it yaklaşık 1). Aynı hafta rutin bir sıcaklık değişimi oldu; bu önemli değil, kaydetme (it yaklaşık 0).
9.3.4 Hücre Durumu Güncellemesi
$$C_t = f_t \odot C_{t-1} + i_t \odot \tilde{C}_t$$
Bu formül LSTM'in kalbidir. Eski hafıza (Ct-1) unutma kapısıyla filtrelenir, yeni bilgi giriş kapısıyla eklenir. Sonuç, güncellenmiş uzun süreli hafızadır.
Tarımsal Yorum: Hücre durumu, tüm büyüme sezonu boyunca biriken bilgidir -- ekim zamanındaki toprak durumu, yağış birikimi, gübre uygulamaları, hastalık baskıları. Bu bilgi, sezon boyunca seçici olarak güncellenir.
9.3.5 Çıkış Kapısı (Output Gate)
$$o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$$ $$h_t = o_t \odot tanh(C_t)$$
İşleyiş: Hücre durumunun ne kadarının çıkış olarak kullanılacağına karar verir.
Tarımsal Örnek: Sezon ortasında verim tahmini yapılırken, toplandaki tüm bilgi gerekli değil; sadece şu anki büyüme aşamasıyla ilgili bilgi çıkışa yansıtılır. Örneğin çiçeklenme döneminde ekim zamanı bilgisi doğrudan gerekli olmayabilir, ama toprak besin durumu bilgisi kritiktir.
9.3.6 LSTM Kapıları Özet Tablosu
| Kapı | Formül | İşlevi | Tarımsal Karşılığı |
|---|---|---|---|
| Unutma (Forget) | ft = sigma(...) | Eski bilgiyi sil/koru | Eski nem verisi artık geçersiz mi? |
| Giriş (Input) | it = sigma(...) | Yeni bilgiyi ekle | Dolu yağışı önemli bir olay mı? |
| Çıkış (Output) | ot = sigma(...) | Çıkışa ne aktarılsın? | Hangi bilgi şimdi tahmin için gerekli? |
| Hücre Durumu | Ct = ftCt-1 + itCt | Uzun süreli hafıza | Sezon boyunca biriken bilgi |
9.4 GRU: Basitleştirilmiş LSTM
9.4.1 GRU Yapısı
GRU (Gated Recurrent Unit), Cho ve arkadaşları tarafından 2014'te önerilmiştir. LSTM'in basitleştirilmiş versiyonudur: Üç kapı yerine iki kapı kullanır ve ayrı bir hücre durumu yoktur.
Sıfırlama Kapısı (Reset Gate): $$r_t = \sigma(W_r \cdot [h_{t-1}, x_t])$$
Güncelleme Kapısı (Update Gate): $$z_t = \sigma(W_z \cdot [h_{t-1}, x_t])$$
Gizli Durum Güncellemesi: $$h_t = (1 - z_t) \odot h_{t-1} + z_t \odot \tilde{h}_t$$
Güncelleme kapısı, LSTM'deki unutma ve giriş kapılarının birleşik versiyonudur. "Ne kadarını unut, ne kadarını ekle" kararını tek bir kapı ile verir.
9.4.2 LSTM vs GRU Karşılaştırması
| Özellik | LSTM | GRU |
|---|---|---|
| Kapı Sayısı | 3 (forget, input, output) | 2 (reset, update) |
| Hücre Durumu | Ayrı Ct var | Gizli durumla birleşik |
| Parametre Sayısı | Daha fazla | Daha az (~%25 az) |
| Eğitim Süresi | Daha uzun | Daha kısa |
| Uzun Diziler | Genellikle daha başarılı | Kısa-orta dizilerde rekabetçi |
| Tarımsal Tercih | Çok sezonlu veri | Tek sezon içi tahmin |
El-Kenawy ve arkadaşları (2025), patates verim tahmininde hem LSTM hem GRU kullanmış ve sonuçları karşılaştırmıştır:
| Model | MSE | RMSE | MAE | R2 |
|---|---|---|---|---|
| LSTM | 0.03190 | 0.17862 | 0.13718 | 0.47843 |
| GRU | 0.01858 | 0.13631 | 0.10441 | 0.60958 |
GRU, bu çalışmada LSTM'den belirgin şekilde daha iyi performans göstermiştir. Bu durum, veri seti boyutu ve dizinin uzunluğu ile ilişkili olabilir -- daha kısa dizilerde GRU'nun basitliği avantaj sağlar.
9.5 Tarımsal Zaman Serisi Uygulamaları
9.5.1 Verim Tahmini
Elavarasan ve Vincent (2020), verim tahmininde Deep Recurrent Q-Network (DRQN) modelini önermiştir. Bu model, RNN katmanlarını Q-Learning takviyeli öğrenme ile birleştirmektedir. Çalışmada:
- Giriş parametreleri: Çevre değişkenleri (sıcaklık, nem, yağış), toprak özellikleri (pH, N, P, K, organik karbon), yeraltı su parametreleri (seviye, kalite)
- Yöntem: RNN tabanlı DQN -- önce RNN ön-eğitim yapılır, sonra Q-Learning ile politika optimizasyonu gerçekleştirilir.
- Doğrulama: 5 katlı ileri zincirleme çapraz doğrulama (forward chaining CV). Bu yaklaşım, kronolojik sırayı koruyarak gelecek verinin eğitimde kullanılmasını engeller.
Tarımsal veri setlerinde kronolojik sıralamanın korunması kritiktir. Rastgele k-fold bölme, gelecekteki hava verilerinin geçmişe sızmasına neden olur (data leakage), bu da aşırı iyimser sonuçlar üretir.
9.5.2 Mısır Verim Tahmini (Shahhosseini et al., 2020)
Shahhosseini ve arkadaşları, ABD'nin üç büyük mısır üretici eyaletinde (Illinois, Indiana, Iowa) kapsamlı bir verim tahmin çalışması gerçekleştirmiştir:
Veri Kaynakları: - Toprak parametreleri: 5 km çözünürlük - Hava verileri: 1 km çözünürlük (haftalık ortalama sıcaklık, toplam yağış vb.) - Verim kayıtları: İlçe (county) bazında
Özellik Mühendisliği: - 597 özellikten 3 aşamalı seçim (korelasyon, varyans, doğrusal bağımlılık) ile 72 özelliğe indirgeme - Verim trendi (yield_trend): Her konum için doğrusal regresyon ile yıllık trend hesaplama - Eyalet ortalama verimi (yield_avg): Bölgesel normalizasyon
Walk-Forward Cross-Validation: Zaman serisi verileri için k-fold cross-validation yerine walk-forward prosedür kullanılmıştır. Her katlama: 8 yıl eğitim + 1 yıl doğrulama, ve zaman ileriye doğru kayar. Bu, gerçek tahmin senaryosunu simüle eder.
Ensemble Modelleri ve Sonuçlar:
| Model | RRMSE (%) | MBE (kg/ha) |
|---|---|---|
| Optimized Weighted Ensemble | 9.5 | - |
| Average Ensemble | 9.5 | - |
| Stacked LASSO | - | 53 (en az bias) |
| Random Forest (tek) | ~11 | - |
| XGBoost (tek) | ~10.5 | - |
Kritik Bulgu: Hava durumu verilerinin 18-24. haftalar (Mayıs-Haziran) arasındaki değerlerinin en önemli giriş özellikleri olduğu tespit edilmiştir. Bu dönem, mısırın vejetatif büyümesinin en kritik aşamasına denk gelir.
9.5.3 Mevsimsel Tahmin Zorluğu
Tarımsal LSTM modellerinin karşılaştığı özel zorluklar:
| Zorluk | Açıklama | Çözüm Yaklaşımı |
|---|---|---|
| Mevsimsellik | Veri yılda bir kez tekrarlanır | Çok yıllık veri biriktirme, dönem bazlı modelleme |
| Uzun diziler | 6+ aylık büyüme dönemi | LSTM'in uzun süre hafıza avantajı |
| Dış etkenler | Don, dolu, hastalık salgınları | Olay tabanlı özellikler ekleme |
| Bölgesel farklılıklar | Her tarla farklı toprak yapısı | Konum bazlı normalizasyon (yield_trend) |
| Veri kalitesi | Sensör arızaları, eksik ölçümler | İnterpolasyon ve robust normalizasyon |
9.6 LSTM ile Verim Tahmini: Adım Adım
9.6.1 Veri Hazırlama
- Zaman penceresi oluşturma: Son 12 haftanın hava verilerini giriş, 13. haftanın verim göstergelerini çıkış olarak tanımla.
- Normalizasyon: Min-Max veya Z-score ölçekleme. Sıcaklık (0-40 C) ve yağış (0-200 mm) farklı ölçeklerde; normalizasyon olmadan büyük değerli özellikler baskın olur.
- Dizi formatı: (örnekler, zaman_adımları, özellikler) şeklinde 3 boyutlu tensor. Örneğin (500 tarla, 12 hafta, 8 özellik).
9.6.2 Model Mimarisi
Giriş: (batch, 12, 8) -- 12 hafta, 8 özellik
|
LSTM Katmanı (64 birim, return_sequences=True)
|
Dropout (0.3) -- aşırı uyumu önle
|
LSTM Katmanı (32 birim)
|
Dense (16, aktivasyon=ReLU)
|
Dense (1) -- verim tahmini (ton/ha)
9.6.3 Eğitim Stratejisi
- Kayıp fonksiyonu: MSE (verim tahmini regresyon problemi)
- Optimizer: Adam (uyarlanabilir öğrenme oranı)
- Erken durdurma: Doğrulama kaybı 10 epoch boyunca iyileşmezse dur
- Cross-validation: Walk-forward (kronolojik sıralama korunur)
9.7 İleri Konular
9.7.1 Bidirectional LSTM
Çift yönlü LSTM, zaman serisini hem ileriye hem geriye işler. Tarımda pek yaygın değildir (gelecek verisine erişmek gerçek senaryoda mümkün değildir), ancak geçmiş verilerin analizi için kullanılabilir.
9.7.2 Attention Mekanizması
Attention, LSTM'in "hangi zaman adımının daha önemli olduğuna" odaklanmasını sağlar. Tarımsal örnek: Çiçeklenme dönemindeki sıcaklık, verim için diğer haftalara kıyasla çok daha kritiktir. Attention mekanizması bu döneme otomatik olarak daha fazla ağırlık verir.
9.7.3 Transformer Modelleri
Son yıllarda Transformer tabanlı modeller (zaman serileri için Temporal Fusion Transformer, Informer vb.) LSTM'e alternatif olarak ortaya çıkmıştır. Avantajları: paralel işlem, uzun mesafe bağımlılıkları yakalama. Dezavantajı: daha fazla veri ve hesaplama gerektirmesi.
9.8 Özet ve Karşılaştırma
| Özellik | Standart RNN | LSTM | GRU |
|---|---|---|---|
| Hafıza | Kısa süreli | Uzun ve kısa süreli | Orta-uzun süreli |
| Kapı Sayısı | 0 | 3 | 2 |
| Gradyan Problemi | Ciddi | Büyük ölçüde çözüldü | Büyük ölçüde çözüldü |
| Parametre | En az | En fazla | Orta |
| Tarımsal Tercih | Basit görevler | Çok sezonlu tahmin | Kısa diziler, hızlı eğitim |
| Performans (Patates) | - | MSE=0.032, R2=0.48 | MSE=0.019, R2=0.61 |
Temel Çıkarımlar: 1. Tarımsal veriler doğası gereği zaman serileridir; kronolojik sıralamaya saygı göstermek genellikle gerekir. 2. LSTM, uzun büyüme sezonlarındaki bilgiyi koruyabilen en etkili yapı taşlarından biridir. 3. GRU, LSTM'e daha basit bir alternatiftir ve bazı durumlarda daha iyi performans gösterebilir. 4. Walk-forward cross-validation, tarımsal tahmin modellerinde standart doğrulama yöntemi olmalıdır. 5. Özellik mühendisliği (verim trendi, mevsimsel indeksler) model performansını önemli ölçüde iyileştirir.
Sonraki Ders: 10 Nesne Tespiti Yolo -- Tarlada meyve, yabancı ot ve zararlıları gerçek zamanlı olarak tespit etme: YOLO ailesi.