Dr. Mehmet Solak Siirt Üniversitesi · Ziraat Fakültesi · Biyosistem Mühendisliği · Tarım ve Tarımsal Eğitim İçin Makine Öğrenmesi İçeriği

Genom Geneli İlişkilendirme Çalışması (GWAS)

sözlükgenomik

Alternatif adlar: Genome-Wide Association Study, Genom Çapında İlişkilendirme Analizi, GWAS

Kısa Tanım

GWAS, bir popülasyondaki bireylerin genom genelindeki genetik varyantlarını (genellikle tek nükleotid polimorfizmleri, SNP) fenotipik özelliklerle istatistiksel olarak ilişkilendiren hipotez-bağımsız bir tarama yöntemidir. Aday gen yaklaşımının aksine, tüm genomu önceden bir varsayım olmaksızın tarar.

Teknik Mantık

Yüzlerce ila milyonlarca SNP markörü, yüksek yoğunluklu genotipleme dizileri (SNP array) veya tüm genom dizileme (WGS) ile elde edilir. Her SNP için fenotip ile genotip arasındaki ilişki doğrusal regresyon, lojistik regresyon veya karma doğrusal model (mixed linear model, MLM) ile test edilir. Popülasyon yapısı (population stratification) ve akrabalık (kinship) etkilerini kontrol etmek için temel bileşen analizi (PCA) kovaryant olarak eklenir veya genomik ilişki matrisi (GRM) kullanılır. Çoklu test düzeltmesi için Bonferroni eşiği (p < 5x10^-8) veya FDR (false discovery rate) uygulanır. Manhattan ve Q-Q grafikleri standart görselleştirme araçlarıdır.

Kullanım Bağlamı

Kantitatif veya kalitatif fenotiplerle ilişkili genomik bölgelerin (QTL) keşfedilmesinde, markör destekli seleksiyon (MAS) için aday genlerin belirlenmesinde ve genomik seleksiyon modellerinin bilgilendirilmesinde kullanılır.

Tarımsal Bağlam

Bitki ıslahında verim, kuraklık toleransı, hastalık direnci ve kalite parametreleri (protein oranı, yağ asidi profili) ile ilişkili SNP'lerin keşfi GWAS ile gerçekleştirilir. Buğday, mısır, çeltik ve soya gibi temel kültür bitkilerinde kapsamlı GWAS çalışmaları yürütülmüştür. Makine öğrenmesi entegrasyonunda, GWAS ile belirlenen önemli SNP'ler genomik tahmin modellerinde (GBLUP, Bayesian yöntemler, derin öğrenme) özellik seçimi (feature selection) amacıyla girdi olarak kullanılabilir.

Sık Karıştırılan Nokta

GWAS korelasyon tespit eder, nedensellik (causality) kanıtlamaz. Anlamlı bulunan SNP, ilişkili fenotipe neden olan gen olmayabilir; bağlantı dengesizliği (linkage disequilibrium, LD) nedeniyle gerçek nedensel varyantla fiziksel olarak yakın bir belirteç olabilir. Ayrıca GWAS nadir varyantları (minor allele frequency < 0.01) tespit etmekte sınırlıdır; bu tür varyantlar için ayrı istatistiksel çerçeveler gerekir.


Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği