Ders 2: Makine Öğrenmesinin Üç Paradigması

dersgözetimli-öğrenmegözetimsiz-öğrenmepekiştirmeli-öğrenmesınıflandırmaregresyon

2.1 Giriş: Makine Nasıl "Öğrenir"?

Bir ziraat mühendisi, yıllar içerisinde binlerce yaprak inceleyerek hastalık belirtilerini tanımaya başlar. Yeni bir hasta yaprağı gördüğünde geçmiş deneyimlerini kullanarak teşhis koyar. Makine öğrenmesi de benzer bir mantıkla çalışır: veriden örüntü çıkarır ve bu örüntüleri yeni verilere uygular. Ancak makinenin "öğrenme" biçimi, eldeki verinin yapısına ve amaca göre üç farklı paradigma izler.

Bu üç paradigma -- gözetimli, gözetimsiz ve pekiştirmeli öğrenme -- makine öğrenmesinin temel taşlarıdır. Her birinin tarımda farklı ve önemli uygulamaları vardır.

2.2 Gözetimli Öğrenme (Supervised Learning)

Tanım ve Tarımsal Mantık

Gözetimli öğrenmede modele hem girdi (özellikler) hem de doğru cevap (etiket) birlikte verilir. Model, girdi ile çıktı arasındaki ilişkiyi öğrenir ve yeni, daha önce görmediği verilerde tahmin yapabilir hale gelir.

Bunu tarımsal bir örnekle düşünelim: Bir ziraat mühendisi, 10.000 yaprak fotoğrafının her birine "sağlıklı", "erken yanıklık", "geç yanıklık" veya "külleme" etiketi koymuştur. Model, bu etiketli veri setinden eğitilir: her yaprağın piksel değerleri (girdi) ile hastalık etiketi (çıktı) arasındaki ilişkiyi öğrenir. Eğitim tamamlandığında, daha önce hiç görmediği yeni bir yaprak fotoğrafını sınıflandırabilir.

Gözetimli öğrenme, tarımsal makine öğrenmesinin en yaygın paradigmasıdır çünkü tarımda çoğu problem "bilinen bir cevabı tahmin etme" şeklinde formüle edilebilir: verimi tahmin et, hastalığı teşhis et, toprak tipini sınıflandır.

Sınıflandırma ve Regresyon: İki Temel Görev

Gözetimli öğrenme iki ana göreve ayrılır:

Sınıflandırma: Çıktı bir sınıf etiketidir (kesikli). Örnekler: - Yaprak hasta mı, sağlıklı mı? (ikili sınıflandırma) - Hastalık türü nedir: pas, yanıklık, külleme, virüs? (çok sınıflı sınıflandırma) - Uydu pikselinde hangi ürün var: buğday, mısır, pamuk, ayçiçeği? (ürün haritalama)

Regresyon: Çıktı sürekli bir sayıdır. Örnekler: - Bu tarlanın verimi kaç ton/hektar olacak? - Toprağın organik karbon içeriği yüzde kaç? - Önümüzdeki hafta bitki su stresi indeksi ne olacak?

Bu iki görev arasındaki seçim, probleme bağlı olarak yapılır. "Hasta mı değil mi?" sorusu sınıflandırmadır; "hastalık şiddeti 0-100 arasında kaç?" sorusu regresyondur. Bazı problemler her iki şekilde de formüle edilebilir: verim "düşük/orta/yüksek" olarak sınıflandırılabilir (sınıflandırma) veya "7.2 ton/ha" olarak tahmin edilebilir (regresyon).

Özellik	Sınıflandırma	Regresyon
Çıktı tipi	Kategori (sınıf etiketi)	Sürekli sayı
Tarımsal örnek	Hasta/sağlıklı	Verim: 4.8 ton/ha
Tipik metrik	Doğruluk, F1 skoru	RMSE, R-kare
Örnek algoritmalar	Random Forest, SVM, CNN	RF regresyon, XGBoost, LSTM
Kayıp fonksiyonu	Çapraz entropi	Ortalama kare hata (MSE)

Sınıflandırmada Kayıp Fonksiyonu -- Basit Açıklama

Model, tahminlerinin ne kadar yanlış olduğunu bir "kayıp fonksiyonu" ile ölçer. Sınıflandırmada en yaygın kullanılan çapraz entropi kaybı şu şekilde çalışır: Model, bir yaprağın "geç yanıklık" olma olasılığını %90 olarak tahmin etmiş ama gerçek etiket "erken yanıklık" ise, kayıp yüksektir. Eğer %95 "erken yanıklık" derse kayıp düşüktür. Model, bu kaybı minimuma indirmek için parametrelerini günceller -- bu sürecin adı eğitim (training).

Regresyonda ise MSE (Ortalama Kare Hata) kullanılır: Modelin verim tahmini 5.2 ton/ha, gerçek verim 4.8 ton/ha ise hata (5.2 - 4.8)^2 = 0.16'dır. Model, tüm örneklerdeki bu hataların ortalamasını düşürmeye çalışır.

2.3 Gözetimsiz Öğrenme (Unsupervised Learning)

Tanım ve Tarımsal Mantık

Gözetimsiz öğrenmede modele yalnızca girdiler verilir; doğru cevaplar (etiketler) yoktur. Modelin görevi, verideki gizli yapıları, grupları veya örüntüleri kendisi keşfetmesidir.

Tarımsal bir örnekle düşünelim: Bir çiftlikte yüzlerce noktadan toprak örnekleri alınmış ve her birinin pH, organik karbon, kum, silt, kil oranları, nem kapasitesi ölçülmüştür. Ancak bu noktaların hangi "toprak tipine" ait olduğu bilinmemektedir. Kümeleme (clustering) algoritması, benzer toprak özelliklerine sahip noktaları otomatik olarak gruplayarak tarlanın farklı toprak zonlarını ortaya çıkarır. Bu zonlar daha sonra değişken oranlı gübreleme haritaları için temel oluşturur.

Temel Gözetimsiz Öğrenme Yöntemleri

K-Means Kümeleme: Veriyi önceden belirlenen K adet kümeye ayırır. Her küme, içindeki noktaların ortalamasına (centroid) en yakın olanları içerir.

Tarımsal örnek: Bir tarladaki 500 toprak örneğini 4 kümeye ayırmak istiyoruz. Algoritma, benzer pH, organik madde ve doku özelliklerine sahip örnekleri bir araya getirir. Sonuçta ortaya çıkan 4 küme, tarlanın farklı verimlilik zonlarını temsil edebilir: (1) yüksek organik maddeli verimli alan, (2) kumlu, düşük besinli alan, (3) killi, su tutan alan, (4) tuzlu sorunlu alan.

Temel Bileşen Analizi (PCA -- Principal Component Analysis): Yüksek boyutlu veriyi daha az boyuta indirger. Bir hiperspektral görüntünün 200 bandını 5-10 temel bileşene sıkıştırarak, bilgi kaybını minimize ederek boyutluluğu azaltır. Bu, hem hesaplama maliyetini düşürür hem de bazı modellerin performansını artırır.

Tarımsal örnek: Sentinel-2'nin 13 bandını PCA ile 3-4 bileşene indirgemek, toprak haritalamada modelin daha hızlı ve bazen daha doğru çalışmasını sağlar.

Anomali Tespiti: Normal veri dağılımından sapan gözlemleri tespit eder. Tarımda bir tarlanın büyük bölümüne kıyasla anormal derecede düşük NDVI gösteren bölgeler, olası hastalık veya zararlı salgını, su baskını veya gübre eksikliği işaret edebilir.

2.4 Pekiştirmeli Öğrenme (Reinforcement Learning)

Tanım ve Tarımsal Mantık

Pekiştirmeli öğrenmede bir "ajan" (agent) bir "ortam" (environment) içerisinde ardışık kararlar alır ve her kararın sonuçunda bir "ödül" (reward) veya "ceza" (penalty) alır. Zamanla, toplam ödülünü maksimize eden stratejiyi (politika) öğrenir.

Bu paradigmayı bir sulama robotu örneği ile düşünelim: Robot her gün "sula" veya "sulama" kararını verir. Eğer doğru zamanda sularsa verim artar (ödül); gereksiz yere sularsa su israf edilir (ceza); kuraklık döneminde sulamazsa bitki zarar görür (büyük ceza). Binlerce simülasyon sonunda robot, hava durumu koşullarına, toprak nemine ve bitki gelişim aşamasına göre optimal sulama stratejisini öğrenir.

Pekiştirmeli öğrenme, diğer iki paradigmadan temel bir farkla ayrılır: gözetimli öğrenmede "doğru cevap" her örnekte doğrudan verilir; pekiştirmeli öğrenmede ise yalnızca "gecikmiş bir geri bildirim" (verim sonu ödülü) vardır. Robot, "bugün sulamamanın" verime etkisini ancak haftalar sonra öğrenir.

CropGym: Tarımsal Pekiştirmeli Öğrenme Platformu

Tarımda pekiştirmeli öğrenme hala erken aşamada olsa da, önemli gelişmeler yaşanmaktadır. Kallenberg et al. (2023) tarafından geliştirilen CropGym sistemi, WOFOST bitki büyüme modelini bir OpenAI Gym ortamına dönüştürerek tarımsal karar verme için pekiştirmeli öğrenme araştırmalarını kolaylaştırmaktadır. CropGym'de ajan, mevsim boyunca haftalık azot gübreleme ve sulama kararları verir; ortam ise bitki büyümesini, toprak dinamiklerini ve hava koşullarını simüle eder. Mevsim sonunda verim ve çevresel maliyet birlikte değerlendirilerek ödül hesaplanır.

Bu platform, pekiştirmeli öğrenmenin tarımda güçlü potansiyel taşıdığı alanları göstermektedir: sulama zamanlama optimizasyonu, gübre uygulama stratejisi, hastalık yönetiminde ilaçlama zamanlama kararları. Ancak gerçek tarlada deneme yapmak pahalı ve riskli olduğu için, simülasyon ortamlarında eğitim özellikle yararlıdır.

2.5 Üç Paradigmanın Karşılaştırması

Özellik	Gözetimli	Gözetimsiz	Pekiştirmeli
Veri gereksinimi	Etiketli veri (pahalı)	Etiketsiz veri (ucuz)	Simülasyon ortamı
Öğrenme sinyali	Doğru cevap (etiket)	Verinin iç yapısı	Gecikmeli ödül
Tarımsal örnek	Hastalık teşhisi	Toprak zonlama	Sulama optimizasyonu
Tipik çıktı	Sınıf veya sayı	Küme veya düşük boyutlu temsil	Aksiyon politikası
Veri bol mu?	Etiketleme pahalı	Ham veri bol	Simülasyon gerekir
Olgunluk düzeyi	En olgun, binlerce çalışma	Olgun, yaygın kullanım	Erken aşama

2.6 Araştırma Örneği 1: PlantVillage -- Gözetimli Öğrenmenin Gösterisi

Mohanty et al. (2016) -- Bitki hastalığı tespitinde derin öğrenmenin uygulanabilirliğini gösteren öncül çalışma. PlantVillage veri setindeki 54.306 görüntüde (14 bitki türü, 26 hastalık, 38 sınıf), AlexNet ve GoogLeNet mimarileri karşılaştırılmıştır.

Bu çalışma, gözetimli öğrenmenin gücünü çarpıcı bir şekilde ortaya koymuştur: GoogLeNet modeli, transfer öğrenme ile renkli görüntülerde %99,35 genel doğruluk ve 0,9934 ortalama F1 skoru elde etmiştir. Sıfırdan eğitimde bile GoogLeNet %98,36'ya ulaşmıştır. Gri tonlamalı görüntülerle en düşük performans %85,53 olmuştur (AlexNet, sıfırdan eğitim).

Gözetimli öğrenme açısından önemli bulgular:

Transfer öğrenme etkisi: ImageNet üzerinde ön-eğitilmiş modeller, tarımsal görüntülerde sıfırdan eğitilen modellerden belirgin şekilde üstündür. Bu, gözetimli öğrenmenin farklı alanlar arasında "bilgi transferi" yapabildiğini gösterir.
Eğitim verisi miktarı: Eğitim verisi yalnızca %20'ye düşürüldüğünde bile transfer öğrenme ile %98,21 doğruluk korunmuştur -- bu, etiketli verinin sınırlı olduğu tarımsal senaryolar için umut vericidir.
Renk bilgisinin önemi: Renkli görüntüler gri tonlamalı görüntülerden çok daha iyi sonuç vermiştir; bu, hastalık belirtilerindeki renk değişimlerinin (sararma, kahverengileşme, lekeleme) sınıflandırma için kritik olduğunu doğrular.

Ancak çalışmanın en önemli uyarısı: gerçek dünya görüntüleri (çevrimiçi kaynaklardan toplanan) üzerindeki doğruluk %31-48 aralığına düşmüştür. Bu, gözetimli öğrenmenin temel sınırlılığını göstermektedir: model, yalnızca eğitim verisinin dağılımına benzer verilerde iyi çalışır.

2.7 Araştırma Örneği 2: CropGym -- Pekiştirmeli Öğrenme Platformu

Kallenberg et al. (2023) -- Tarımsal karar verme için pekiştirmeli öğrenme araştırmalarını kolaylaştıran CropGym platformunu geliştirmişlerdir. Sistem, WOFOST bitki büyüme simülasyon modelini OpenAI Gymnasium arayüzüne dönüştürerek, standart RL algoritmalarının (PPO, DQN, A2C) doğrudan tarımsal problemler üzerinde test edilmesine olanak tanır.

CropGym'de bir RL ajanı, tipik olarak şunları yapar: - Durum (State): Mevcut toprak nemi, bitki gelişim aşaması, hava tahmini, toprak azot düzeyi - Aksiyon (Action): Haftalık gübre miktarı (0-50 kg N/ha arası), sulama miktarı (0-30 mm) - Ödül (Reward): Mevsim sonu verim (pozitif) eksi çevre maliyeti (nitrat sızıntısı, su kullanımı)

Bu platformun önemi, pekiştirmeli öğrenmenin tarımda neden diğer paradigmalardan farklı olduğunu somutlaştırmasıdır: gözetimli öğrenmede "bu hafta 20 kg/ha azot ver" gibi bir doğru cevap yoktur; optimal gübre miktarı haftanın hava durumuna, önceki uygulamalara ve bitki aşamasına bağlıdır. Ancak mevsim sonunda toplam ödül (verim - maliyet) bize o mevsimki kararların toplam kalitesini söyler. RL ajanı, binlerce simülasyon mevsimi boyunca deneme-yanılma ile optimal stratejiyi keşfeder.

Platform, şu anda Hollanda'daki Wageningen Üniversitesi tarafından aktif olarak geliştirilmekte olup, Avrupa iklim koşullarında buğday ve patates için simülasyonlar desteklenmektedir.

2.8 Hibrit Yaklaşımlar: Paradigmaların Kesişimi

Gerçek dünyada bu üç paradigma çoğu zaman birlikte kullanılır:

Gözetimsiz + Gözetimli: Öncelikle gözetimsiz kümeleme ile tarla zonları belirlenir, ardından her zon için ayrı gözetimli verim tahmin modelleri eğitilir.
Öz-gözetimli öğrenme (Self-supervised): Büyük miktarda etiketsiz uydu görüntüsü ile bir temsil öğrenen model, az sayıda etiketli örnekle ince ayarlanır -- gözetimli ve gözetimsiz öğrenmenin melezi.
Pekiştirmeli + Gözetimli: RL ajanı, gözetimli öğrenme modelinin verim tahminlerini ödül fonksiyonunun bir parçası olarak kullanır.

Sonraki ders: Model Değerlendirme ve Aşırı Öğrenme -- Neden %99 Doğruluk Yanıltıcı Olabilir?