Ortalama Mutlak Hata (MAE)

sözlükmetrik

Alternatif adlar: Mean Absolute Error, L1 loss, ortalama mutlak sapma

Kısa Tanım

Ortalama mutlak hata (Mean Absolute Error, MAE), bir regresyon modelinin tahminleri ile gerçek değerler arasındaki mutlak farkların aritmetik ortalamasıdır. MAE = (1/n) * sum(|y_i - y_hat_i|) formülüyle hesaplanır. Hedef değişkenle aynı birime sahip olması ve yorumlanabilirliği nedeniyle yaygın kullanılan bir performans metriğidir.

Teknik Mantık

MAE, her bir tahmin hatasının mutlak değerini eşit ağırlıkla toplar ve örnek sayısına böler. MSE'den (Mean Squared Error) farklı olarak hata terimlerini kareye almadığı için aykırı değerlere (outliers) karşı daha dayanıklıdır (robust). Gradyan hesabında mutlak değer fonksiyonunun sıfır noktasında türevlenemez olması, optimizasyonda subgradient yöntemlerinin kullanılmasını gerektirir. Kayıp fonksiyonu olarak kullanıldığında L1 loss adını alır. Huber loss, MAE ve MSE arasında bir geçiş sağlayarak her ikisinin avantajlarını birleştirir: küçük hatalarda kuadratik, büyük hatalarda doğrusal davranır.

Kullanım Bağlamı

Hata dağılımının simetrik olduğu ve aykırı değerlerin fazla ağırlıklandırılmaması istenen regresyon görevlerinde tercih edilir. Farklı modellerin karşılaştırılmasında birim bağımlı olduğundan, ölçek bağımsız karşılaştırma gerektiğinde MAPE veya normalleştirilmiş MAE (nMAE) kullanılmalıdır. MAE tek başına yeterli değildir; RMSE, R-kare ve sapma (bias) ile birlikte raporlanmalıdır.

Tarımsal Bağlam

Tarımda MAE; verim tahmini (ton/ha cinsinden MAE), toprak nemi tahmini (m3/m3), yaprak alan indeksi (LAI) kestirimi, sera sıcaklık kontrolü ve spektroskopik kalite tahmin modellerinde standart değerlendirme metriği olarak kullanılır. Örneğin, buğday verim tahmin modelinde MAE = 0.35 ton/ha ifadesi, modelin ortalama 350 kg/ha sapmayla tahmin yaptığını doğrudan anlatır. NIR tabanlı protein tahmininde MAE, SEP (Standard Error of Prediction) ile birlikte raporlanır. Farklı parsellerde veya yıllarda model performansının karşılaştırılmasında göreli MAE (MAE/ortalama verim) daha bilgilendiricidir.

Sık Karıştırılan Nokta

MAE ile RMSE'nin birbirinin yerine kullanılabileceği düşünülür; ancak ikisi farklı bilgi taşır. RMSE büyük hataları orantısız şekilde cezalandırırken, MAE tüm hatalara eşit ağırlık verir. RMSE her zaman MAE'den büyük veya eşittir (Jensen eşitsizliği); ikisi arasındaki fark ne kadar büyükse hata dağılımındaki varyans o kadar yüksektir. Bir diğer hata, MAE = 0 olan modelin mükemmel olduğu varsayımıdır; eğitim setinde MAE = 0 aşırı uyum (overfitting) göstergesi olabilir ve çapraz doğrulama ile kontrol edilmelidir.

Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği