Temel Bileşen Analizi (PCA)
Diğer adları: Principal Component Analysis, PCA, Ana Bileşenler Analizi
Kısa Tanım
Temel bileşen analizi, yüksek boyutlu veriyi daha düşük boyutlu bir alt uzaya doğrusal projeksiyon yoluyla indirgeyen denetimsiz bir istatistiksel yöntemdir. Veri matrisinin kovaryans yapısındaki en yüksek varyansı açıklayan ortogonal yönleri (temel bileşenler) sıralı biçimde belirler.
Teknik Mantık
Merkezileştirilmiş veri matrisi X'in kovaryans matrisi C = (1/(n-1)) X'X hesaplanır ve özdeğer ayrıştırmasına (eigendecomposition) tabi tutulur: C = V Λ V'. Özvektörler (eigenvectors) temel bileşen yönlerini, özdeğerler (eigenvalues) her yönün açıkladığı varyansı verir. Alternatif olarak, SVD (Singular Value Decomposition) ile doğrudan X = U Σ V' ayrıştırması yapılır. Tutulacak bileşen sayısı, kümülatif açıklanan varyans oranı veya scree plot ile belirlenir.
Kullanım Bağlamı
Boyut indirgeme, veri görselleştirme, gürültü filtreleme, çoklu doğrusal bağıntı giderme ve keşifsel veri analizi (EDA) amaçlarıyla kullanılır. Makine öğrenmesi öncesi ön işleme adımı olarak öznitelik uzayının sıkıştırılmasında yaygındır.
Tarımsal Bağlam
PCA, hiperspektral ve multispektral görüntülerde bant indirgeme, toprak ve bitki spektral verilerinde örüntü keşfi, çevresel değişkenler arası ilişkilerin görselleştirilmesi ve kemometrik modellerde ön işleme adımı olarak yaygın kullanılır. Skor grafiklerinde (score plots) numunelerin kümelenmesi, tarımsal sınıflandırma problemlerinde sınıf ayrılabilirliği hakkında ön bilgi sağlar.
Sık Karıştırılan Nokta
PCA yalnızca doğrusal ilişkileri yakalar; doğrusal olmayan yapılar için kernel PCA veya t-SNE/UMAP gibi yöntemler gerekir. Ayrıca PCA, varyansı maksimize eder ancak bu her zaman sınıf ayrımını maksimize etmek anlamına gelmez; denetimli boyut indirgeme için LDA (Linear Discriminant Analysis) daha uygun olabilir.
Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği