Dr. Mehmet Solak Siirt Üniversitesi · Ziraat Fakültesi · Biyosistem Mühendisliği · Tarım ve Tarımsal Eğitim İçin Makine Öğrenmesi İçeriği

Belirtme Katsayısı (R²)

sözlükmetrik

Alternatif adlar: R-kare, Determinasyon Katsayısı, Coefficient of Determination

Kısa Tanım

Belirtme katsayısı (R²), bir regresyon modelinin bağımlı değişkendeki toplam varyansın ne kadarını açıkladığını gösteren boyutsuz bir uyum iyiliği (goodness-of-fit) metriğidir. Değeri 0 ile 1 arasında değişir; 1'e yaklaştıkça modelin tahmin gücü artar. Negatif değerler, modelin ortalama tahminden daha kötü performans gösterdiğini ifade eder.

Teknik Mantık

R² = 1 - (SS_res / SS_tot) formülüyle hesaplanır. SS_res, artık kareler toplamını (residual sum of squares); SS_tot ise toplam kareler toplamını (total sum of squares) temsil eder. Doğrusal regresyonda R², Pearson korelasyon katsayısının karesine eşittir. Ancak doğrusal olmayan modellerde bu eşitlik geçerli değildir. Düzeltilmiş R² (adjusted R²), bağımsız değişken sayısı arttıkça meydana gelen yapay şişmeyi cezalandırmak için serbestlik derecesiyle düzeltme uygular.

Kullanım Bağlamı

Sürekli değişken tahmini yapan regresyon modellerinde (doğrusal regresyon, SVR, rastgele orman regresyonu) standart raporlama metriğidir. RMSE ve MAE ile birlikte kullanılmalıdır; tek başına R² raporlamak, hata büyüklüğü hakkında bilgi vermez. Özellikle PLS (Partial Least Squares) kalibrasyon modellerinde R²_cal ve R²_cv ayrımı kritik önem taşır.

Tarımsal Bağlam

NIR spektroskopisi ile tahıl nem veya protein içeriği tahmini yapan kemometrik modellerde R² temel performans göstergesidir. Toprak organik karbon (SOC) haritalamada uzaktan algılama verileriyle kurulan regresyon modellerinde R² > 0.80 genellikle kabul edilebilir eşik olarak değerlendirilir. Verim tahmini modellerinde ise mekansal otokorelasyon nedeniyle şişirilmiş R² değerlerine karşı dikkatli olunmalıdır.

Sık Karıştırılan Nokta

Yüksek R² değeri nedensellik (causality) anlamına gelmez; yalnızca istatistiksel ilişkiyi ölçer. Ayrıca eğitim seti üzerinde hesaplanan R²_cal ile çapraz doğrulama veya bağımsız test seti üzerindeki R²_cv/R²_pred arasındaki fark göz ardı edilmemelidir. Aradaki büyük fark, aşırı öğrenme (overfitting) göstergesidir.


Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği