Kısmi En Küçük Kareler Regresyonu (PLS)
Diğer adları: Partial Least Squares Regression, PLSR, PLS Regresyonu
Kısa Tanım
PLS regresyonu, yüksek boyutlu ve çoklu doğrusal bağıntı (multicollinearity) içeren bağımsız değişken matrislerinden bağımlı değişkeni tahmin etmek için tasarlanmış bir projeksiyon tabanlı regresyon yöntemidir. Hem X hem Y uzayındaki varyansı eşzamanlı olarak maksimize eden gizli değişkenler (latent variables) çıkarır.
Teknik Mantık
PLS, X ve Y matrislerini X = T P' + E ve Y = U Q' + F biçiminde ayrıştırır; burada T ve U skor matrisleri, P ve Q yükleme (loading) matrisleridir. NIPALS algoritması iteratif olarak kovaryansı maksimize eden yönleri bulur. Bileşen sayısı (latent variable sayısı) çapraz doğrulama ile belirlenir; fazla bileşen aşırı öğrenmeye, az bileşen yetersiz modele yol açar. PCA'dan farklı olarak PLS, yalnızca X varyansını değil X-Y kovaryansını optimize eder.
Kullanım Bağlamı
Öznitelik sayısının gözlem sayısından çok büyük olduğu (p >> n) ve değişkenler arası yüksek korelasyon bulunan durumlarda tercih edilir. Kemometri, spektroskopi, metabolomik ve proses analitik teknolojilerin (PAT) temel aracıdır.
Tarımsal Bağlam
PLS, NIR/MIR spektroskopisi ile gıda kalite parametreleri (nem, protein, yağ, şeker) tahmini, toprak organik karbon ve besin elementi analizinde standart yöntemdir. Hiperspektral görüntüleme verilerinden piksel bazlı biyokimyasal haritalama yapılmasında da yaygın olarak kullanılır.
Sık Karıştırılan Nokta
PLS ile PCR (Principal Component Regression) sıklıkla karıştırılır. PCR önce X'in varyansını maksimize eden bileşenleri çıkarır, ardından Y'yi bu bileşenlerle regrese eder; dolayısıyla Y ile ilişkisiz yüksek varyanslı bileşenler modeli domine edebilir. PLS ise doğrudan X-Y kovaryansını hedeflediğinden tahmin performansı genellikle üstündür.
Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği