Genom Geneli İlişkilendirme Çalışması (GWAS)
Alternatif adlar: Genome-Wide Association Study, Genom Çapında İlişkilendirme Analizi, GWAS
Kısa Tanım
GWAS, bir popülasyondaki bireylerin genom genelindeki genetik varyantlarını (genellikle tek nükleotid polimorfizmleri, SNP) fenotipik özelliklerle istatistiksel olarak ilişkilendiren hipotez-bağımsız bir tarama yöntemidir. Aday gen yaklaşımının aksine, tüm genomu önceden bir varsayım olmaksızın tarar.
Teknik Mantık
Yüzlerce ila milyonlarca SNP markörü, yüksek yoğunluklu genotipleme dizileri (SNP array) veya tüm genom dizileme (WGS) ile elde edilir. Her SNP için fenotip ile genotip arasındaki ilişki doğrusal regresyon, lojistik regresyon veya karma doğrusal model (mixed linear model, MLM) ile test edilir. Popülasyon yapısı (population stratification) ve akrabalık (kinship) etkilerini kontrol etmek için temel bileşen analizi (PCA) kovaryant olarak eklenir veya genomik ilişki matrisi (GRM) kullanılır. Çoklu test düzeltmesi için Bonferroni eşiği (p < 5x10^-8) veya FDR (false discovery rate) uygulanır. Manhattan ve Q-Q grafikleri standart görselleştirme araçlarıdır.
Kullanım Bağlamı
Kantitatif veya kalitatif fenotiplerle ilişkili genomik bölgelerin (QTL) keşfedilmesinde, markör destekli seleksiyon (MAS) için aday genlerin belirlenmesinde ve genomik seleksiyon modellerinin bilgilendirilmesinde kullanılır.
Tarımsal Bağlam
Bitki ıslahında verim, kuraklık toleransı, hastalık direnci ve kalite parametreleri (protein oranı, yağ asidi profili) ile ilişkili SNP'lerin keşfi GWAS ile gerçekleştirilir. Buğday, mısır, çeltik ve soya gibi temel kültür bitkilerinde kapsamlı GWAS çalışmaları yürütülmüştür. Makine öğrenmesi entegrasyonunda, GWAS ile belirlenen önemli SNP'ler genomik tahmin modellerinde (GBLUP, Bayesian yöntemler, derin öğrenme) özellik seçimi (feature selection) amacıyla girdi olarak kullanılabilir.
Sık Karıştırılan Nokta
GWAS korelasyon tespit eder, nedensellik (causality) kanıtlamaz. Anlamlı bulunan SNP, ilişkili fenotipe neden olan gen olmayabilir; bağlantı dengesizliği (linkage disequilibrium, LD) nedeniyle gerçek nedensel varyantla fiziksel olarak yakın bir belirteç olabilir. Ayrıca GWAS nadir varyantları (minor allele frequency < 0.01) tespit etmekte sınırlıdır; bu tür varyantlar için ayrı istatistiksel çerçeveler gerekir.
Dr. Mehmet Solak — Siirt Üniversitesi, Biyosistem Mühendisliği