Dr. Mehmet Solak Siirt Üniversitesi · Ziraat Fakültesi · Biyosistem Mühendisliği · Tarım ve Tarımsal Eğitim İçin Makine Öğrenmesi İçeriği

Faster R-CNN

sözlükalgoritma

Alternatif adlar: Faster Region-based Convolutional Neural Network

Kısa Tanım

Faster R-CNN, iki aşamalı (two-stage) bir nesne algılama mimarisidir. İlk aşamada Region Proposal Network (RPN) aday bölgeler üretir, ikinci aşamada bu bölgeler sınıflandırılır ve sınırlayıcı kutu (bounding box) regresyonu uygulanır. Selective search yerine RPN kullanarak önceki R-CNN varyantlarına kıyasla hem hız hem doğruluk açısından önemli iyileşme sağlamıştır.

Teknik Mantık

Giriş görüntüsü bir omurga ağı (backbone; VGG, ResNet vb.) ile öznitelik haritasına dönüştürülür. RPN, bu harita üzerinde kayan pencere (sliding window) ile her konumda farklı ölçek ve en-boy oranlarında çapa kutuları (anchor boxes) üretir ve bunları nesne/arka plan olarak ikili sınıflandırır. Yüksek puanlı öneriler RoI Pooling katmanına aktarılarak sabit boyutlu öznitelik vektörlerine dönüştürülür. Son olarak tam bağlantılı katmanlar sınıf tahmini ve kutu ince ayarı (refinement) gerçekleştirir. RPN ve algılama ağı ortak öznitelik haritasını paylaştığı için uçtan uca eğitilebilir.

Kullanım Bağlamı

Yüksek doğruluk gerektiren ve gerçek zamanlı kısıtın görece esnek olduğu nesne algılama görevlerinde tercih edilir. Küçük ve yoğun nesnelerde Feature Pyramid Network (FPN) eklentisiyle güçlendirilebilir. Gerçek zamanlı uygulamalarda YOLO veya SSD gibi tek aşamalı modeller alternatif olabilir.

Tarımsal Bağlam

Tarımda Faster R-CNN; meyve sayımı, zararlı böcek tespiti, yabancı ot lokalizasyonu ve hasat robotiği için görüntü tabanlı algılamada yaygın kullanılır. Örneğin, elma bahçesinde İHA görüntülerinden meyve sayımı yapılırken, farklı olgunluk aşamalarındaki meyvelerin ayrımı için çapa kutusu ölçekleri ürüne özgü ayarlanır. Ayrıca yaprak hastalık lezyon tespitinde bölgesel hassasiyet avantaj sağlar.

Sık Karıştırılan Nokta

Faster R-CNN'in yavaş olduğu genellemesi yapılır; ancak modern GPU'larda FPN-destekli versiyonlar 15-20 FPS hıza ulaşabilir. Asıl sınırlılık, çok küçük nesnelerde (piksel düzeyinde) anchor tasarımının yetersiz kalmasıdır; bu durumda anchor-free yöntemler (FCOS, CenterNet) değerlendirilmelidir.


Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği