Kısmi En Küçük Kareler Regresyonu (PLS)

sözlükkemometri

Diğer adları: Partial Least Squares Regression, PLSR, PLS Regresyonu

Kısa Tanım

PLS regresyonu, yüksek boyutlu ve çoklu doğrusal bağıntı (multicollinearity) içeren bağımsız değişken matrislerinden bağımlı değişkeni tahmin etmek için tasarlanmış bir projeksiyon tabanlı regresyon yöntemidir. Hem X hem Y uzayındaki varyansı eşzamanlı olarak maksimize eden gizli değişkenler (latent variables) çıkarır.

Teknik Mantık

PLS, X ve Y matrislerini X = T P' + E ve Y = U Q' + F biçiminde ayrıştırır; burada T ve U skor matrisleri, P ve Q yükleme (loading) matrisleridir. NIPALS algoritması iteratif olarak kovaryansı maksimize eden yönleri bulur. Bileşen sayısı (latent variable sayısı) çapraz doğrulama ile belirlenir; fazla bileşen aşırı öğrenmeye, az bileşen yetersiz modele yol açar. PCA'dan farklı olarak PLS, yalnızca X varyansını değil X-Y kovaryansını optimize eder.

Kullanım Bağlamı

Öznitelik sayısının gözlem sayısından çok büyük olduğu (p >> n) ve değişkenler arası yüksek korelasyon bulunan durumlarda tercih edilir. Kemometri, spektroskopi, metabolomik ve proses analitik teknolojilerin (PAT) temel aracıdır.

Tarımsal Bağlam

PLS, NIR/MIR spektroskopisi ile gıda kalite parametreleri (nem, protein, yağ, şeker) tahmini, toprak organik karbon ve besin elementi analizinde standart yöntemdir. Hiperspektral görüntüleme verilerinden piksel bazlı biyokimyasal haritalama yapılmasında da yaygın olarak kullanılır.

Sık Karıştırılan Nokta

PLS ile PCR (Principal Component Regression) sıklıkla karıştırılır. PCR önce X'in varyansını maksimize eden bileşenleri çıkarır, ardından Y'yi bu bileşenlerle regrese eder; dolayısıyla Y ile ilişkisiz yüksek varyanslı bileşenler modeli domine edebilir. PLS ise doğrudan X-Y kovaryansını hedeflediğinden tahmin performansı genellikle üstündür.

Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği