Transfer Öğrenme (Transfer Learning)

deep-learningfine-tuningpretrained-modelsimagenetdomain-adaptation

Transfer öğrenme, tarımda derin öğrenmenin belki de EN kritik kolaylaştırıcısıdır. Bu yaklaşım, büyük ölçekli genel amaçlı veri setleri (tipik olarak 1,4 milyon görüntü içeren ImageNet) üzerinde önceden eğitilmiş modellerin, etiketli verinin kıt ve pahalı olduğu özelleşmiş tarımsal görevlere uyarlanmasına olanak tanır.

Transfer Öğrenmenin Tarım İçin Önemi

Tarımsal veri setleri temel bir darboğazla karşı karşıyadır: etiketleme alan uzmanlığı gerektirir. Bir bitki patoloğu hastalık türlerini tanımlamalı, bir entomolog zararlı türlerini işaretlemeli, bir ziraat mühendisi bitki gelişim evrelerini sınıflandırmalıdır. Bu uzmanlık pahalı ve yavaştır. Tarımsal görüntü veri setlerinin çoğu, derin Convolutional Neural Networks ağlarını sıfırdan eğitmek için gereken düzeyin çok altında, yalnızca birkaç yüz ile birkaç bin etiketli örnek içerir.

Transfer öğrenme bu açığı kapatır. ImageNet üzerinde önceden eğitilmiş bir model, düşük düzey özellikleri (kenarlar, dokular, renk gradyanları) ve orta düzey özellikleri (şekiller, örüntüler, uzamsal yapılar) zaten öğrenmiş durumdadır ve bunlar tarımsal görüntü alanlarına olağanüstü iyi aktarılır. Yalnızca üst düzey, göreve özgü temsillerin küçük tarımsal veri setinden öğrenilmesi gerekir.

İnce Ayar Stratejileri (Fine-Tuning)

Özellik Çıkarma (Dondurulmuş Omurga / Frozen Backbone): Önceden eğitilmiş tüm evrişim katmanları dondurulur ve yalnızca yeni bir sınıflandırma başlığı eğitilir. Bu yöntem, tarımsal veri seti çok küçük olduğunda (birkaç yüz görüntü) ve ImageNet'ten alan farkı orta düzeyde olduğunda etkilidir.

Kısmi İnce Ayar (Partial Fine-Tuning): Erken evrişim katmanları (genel özellikleri yakalayan) dondurulur, sonraki katmanlar yeniden eğitim için serbest bırakılır. Bu, modelin sağlam düşük düzey özellikleri korurken üst düzey temsilleri tarımsal alana uyarlamasını sağlar.

Tam İnce Ayar (Full Fine-Tuning): Tüm katmanlar serbest bırakılır ve ağın tamamı düşük bir öğrenme hızıyla yeniden eğitilir. En esnek yaklaşım olmakla birlikte daha fazla veri gerektirir ve öğrenme hızı çok yüksek tutulursa felaket düzeyinde unutma (catastrophic forgetting) riski taşır. Ayrımcı öğrenme hızları (erken katmanlar için düşük, sonraki katmanlar için yüksek) yaygın bir önlem stratejisidir.

Aşamalı Yeniden Boyutlandırma (Progressive Resizing): İnce ayar düşük çözünürlüklü görüntülerle başlatılır, ardından çözünürlük kademeli olarak artırılır. fast.ai tarafından popülerleştirilen bu teknik, modelin önce kaba özellikleri öğrenmesine ve bunları aşamalı olarak iyileştirmesine yardımcı olur.

Yaygın Önceden Eğitilmiş Omurgalar

Model	Parametre Sayısı	Tipik Kullanım Alanı
ResNet-50	25M	Genel amaçlı omurga, tarım makalelerinde en çok atıf alan
EfficientNet-B0 - B4	5-19M	En iyi doğruluk/verimlilik dengesi
MobileNetV2	3.4M	Akıllı telefonlarda Edge Computing dağıtımı
InceptionV3	24M	Çok ölçekli özellik çıkarma
ViT (Vision Transformer)	86M+	Yükselen alternatif, bkz. Transformer Architectures

Alan Uyarlama Zorlukları (Domain Adaptation)

Tarımsal transfer öğrenmedeki en büyük zorluk, kontrollü laboratuvar görüntüleri ile gerçek tarla koşulları arasındaki alan farkıdır (domain gap). Temiz, iyi aydınlatılmış PlantVillage görüntüleri üzerinde ince ayar yapılmış bir model, değişken aydınlatmada, karmaşık arka planlarda veya hareket halindeki İHA'lardan çekilen görüntülerde ciddi şekilde başarısız olabilir.

Laboratuvardan Tarlaya Geçiş Farkı: Kontrollü veri setleri genellikle tekdüze arka planlarda tek yapraklar içerir. Tarla görüntülerinde ise örtüşme, üst üste binen yapraklar, toprak ve gölgeler bulunur.

Sensör Çeşitliliği: Bir kameradan elde edilen RGB görüntüleri üzerinde eğitilmiş modeller, farklı sensörlerden, çok bantlı kameralardan veya akıllı telefon modellerinden gelen görüntülere genellenemeyebilir.

Coğrafi ve Mevsimsel Farklılık: Bir bölgedeki ürünler üzerinde eğitilmiş bir hastalık sınıflandırıcısı, farklı çeşitler, toprak arka planları ve ışık koşulları nedeniyle başka bir bölgede düşük performans gösterebilir.

Alan farklarını azaltma stratejileri arasında agresif Data Augmentation, alana uyarlamalı ince ayar ve kalibrasyon için az miktarda da olsa alan içi tarla verisi toplama yer almaktadır.

Temel Araştırma Yönelimleri

Etiketlenmemiş tarımsal görüntüler üzerinde öz-denetimli ön eğitim (self-supervised pretraining) -- ImageNet yerine -- tarımsal görsel alana daha uygun omurgalar üretebilecek yükselen bir araştırma yönüdür. DINOv2 ve Segment Anything gibi temel modeller (foundation models), tarıma özgü önceden eğitilmiş temsiller oluşturmak için umut vaat etmektedir. Transfer öğrenmenin Federated Learning ile kesişimi de çiftlikler arasında ham veri paylaşımı olmadan işbirlikçi model geliştirme olanaklarını açmaktadır.

Ingest Edilen Makalelerden Bulgular

[Mohanty et al., 2016] — Transfer öğrenmenin bitki hastalığı tespitindeki etkisini sistematik olarak gosteren ilk büyük ölçekli çalışma. AlexNet ve GoogLeNet mimarileri, ImageNet on-eğitimli ağırlıklardan transfer öğrenme ve sifirdan eğitim olarak karsilastirildi. Temel bulgular:

Transfer öğrenme, bu çalışmadaki deney düzeneklerinde sifirdan eğitime göre daha iyi sonuçlar verdi.
GoogLeNet + Transfer Learning: F1 = 0,9934 vs. GoogLeNet + Sifirdan Eğitim: F1 = 0,9836 (%80-%20 bolinme, renkli görüntü).
Fark, az veri senaryolarinda daha belirgin hale geldi: %20 eğitim verisiyle transfer öğrenme F1 = 0,9820 iken sifirdan eğitim F1 = 0,9430.
AlexNet'te fark daha belirgin: Transfer öğrenme 0,9927 vs. sifirdan eğitim 0,9782 (%80-%20 bolinme).
Uygulama detayi: Transfer öğrenme sirasinda yalnizca son sınıflandırma katmaninin ağırlıklari yeniden baslatildi (AlexNet'te fc8, GoogLeNet'te loss{1,2,3}/classifier katmanlari), ancak tum katmanlar öğrenmeye acik birakildii -- yani "tam ince ayar" (full fine-tuning) stratejisi uygulandi.
Sonuç: ImageNet'ten öğrenilen görsel bilgi (kenarlar, dokular, sekiller), bitki yapraklarindaki hastalık oruntulerine olaginustu iyi transfer edildi. (4.288 atif)

[Selvaraj et al., 2019] — Muz hastalıklari tespitinde transfer öğrenme ile uc farkli mimari karsilastirildi. MobileNetV1 (SSD ile), InceptionV2 ve ResNet50 (Faster R-CNN ile) ImageNet on-eğitimli ağırlıklardan yeniden egitildi. ResNet50 ve InceptionV2 tutarli olarak MobileNetV1'den üstün performans gösterdi: yalanci gövde tespitinde ResNet50 mAP %99,99, InceptionV2 %99,94 iken MobileNetV1 %98,24. Tum bitki modeli için ResNet50 mAP %73,46, InceptionV2 %72,86, MobileNetV1 yalnizca %44,69. Bu bulgular, transfer öğrenmenin başarısinin mimari secimi ve görüntülerin karmaşıkligina bagli oldugunu göstermektedir. Karmasik arka planli görüntüler için (tum bitki, yaprak) daha derin mimariler (ResNet50) daha iyi transfer sagladi. (417 atif)

[Kamilaris & Prenafeta-Boldu, 2018] — 40 tarımsal derin öğrenme çalışmasini kapsayan anket. Transfer öğrenme kullanan çalışmalarin tutarli olarak daha iyi sonuç verdigi rapor edildi. ImageNet on-eğitimli CNN modelleri, el yapimi özelliklerle egitilen geleneksel yaklasimlardan (SVM, RF, YSA, GLCM + siniflandirici) hemen her durumda üstün performans gösterdi. Yalnizca bir çalışmada (Reyes et al., 2015), yerel tanimlayicilar + KNN kombinasyonu CNN'den %20 daha iyi LC skoru elde etti. Transfer öğrenmenin tarım disindaki alanlarda da (uydu görüntüleri, hayvan buyume tahmini, hava durumu tahmini) başarıyla uygulandigi goruldu. (4.247 atif)

[Al Sahili & Awad, 2022] — AgriNet: Tarıma özgü önceden eğitilmiş modellerin transfer öğrenmedeki üstünlüğünü gösteren çalışma. ImageNet üzerinde eğitilmiş genel amaçlı modeller yerine, 160.000 tarımsal görüntü (423 sınıf, 19 coğrafi bölge) içeren AgriNet veri seti üzerinde beş CNN mimarisi (VGG16, VGG19, InceptionV3, InceptionResNetV2, Xception) önceden eğitilmiştir. Temel bulgular:

AgriNet-VGG19 en yüksek sınıflandırma doğruluğunu elde etti: %94 doğruluk, %92 F1 skoru.
Tüm AgriNet modelleri 423 sınıfı minimum %87 doğrulukla sınıflandırdı (InceptionV3 en düşük).
Alana özgü ön eğitimin kritik avantajı: Bangladeş zararlı veri seti ve Keşmir bitki hastalıkları veri setinde AgriNet modelleri, aynı mimarinin ImageNet önceden eğitimli versiyonundan tutarlı biçimde üstün performans gösterdi.
Sınıf dengesizliği sorunu class weight mekanizması ile ele alındı (423 sınıf arasında ortalama 378 görüntü/sınıf, 102 sınıfta 100'den az görüntü).
Çalışma, ImageNet'in genel görsel bilgisi yerine tarıma özgü düşük ve orta düzey özelliklerin (yaprak dokuları, hastalık lezyonları, böcek morfolojileri) doğrudan öğrenilmesinin alan farkını azalttığını ve negatif transfer riskini düşürdüğünü göstermiştir.
Sonuç: Tarımsal transfer öğrenme için ImageNet yerine alana özgü ön eğitim veri setleri tercih edilmelidir.