Bitki Genetiği ve Makine Öğrenmesi Destekli Islah
Bitki ıslahı, artan küresel gıda talebini karşılamak için verim, kalite ve stres toleransı bakımından üstün çeşitlerin geliştirilmesini hedefler. Genomik seçilim (GS), genom çapında ilişkilendirme çalışmaları (GWAS) ve makine öğrenmesi algoritmaları, geleneksel ıslah süreçlerini hızlandırarak fenotip-genotip ilişkilerinin daha doğru modellenmesini sağlar. Önümüzdeki 30 yıl içinde temel tahıl üretiminin iki katına çıkarılması hedefi, bu teknolojilerin ıslah programlarına entegrasyonunu daha önemli hale getirmektedir.
Genomik Seçilim (GS)
Genomik seçilim, genom çapında DNA markörlerinin ıslah popülasyonundaki bireylerin ıslah değerini tahmin etmek için kullanıldığı bir yöntemdir. Crossa et al., 2014 CIMMYT'in mısır ve buğday ıslah programlarında GS'nin uygulanmasını kapsamlı biçimde değerlendirmiştir.
GS İş Akışı
GS modeli, hem genotiplenmiş hem de fenotiplenmiş bir eğitim popülasyonu üzerinde geliştirilir. Model, genom tahminli ıslah değerlerini (GEBV) hesaplamak için yalnızca genotiplenmiş test popülasyonuna uygulanır. Geleneksel markör destekli seleksiyondan (MAS) temel farkı, genotiplemenin seçilmiş bir markör alt kümesiyle sınırlı kalmaması ve tüm mevcut markör verisine dayalı olarak ıslah değerinin tahmin edilmesidir.
İstatistiksel Modeller
CIMMYT çalışmalarında test edilen modeller:
- Bayesian LASSO (BL): Parametrik lineer regresyon modeli olup markör etkilerini küçültme (shrinkage) ile tahmin eder
- GBLUP: Genomik en iyi lineer yansız tahmin edici; pedigri ve genomik bilgiyi birleştirerek additif genetik değerleri tahmin eder
- RKHS (Reproducing Kernel Hilbert Space): Yarı parametrik nonlineer model olarak doğrusal olmayan gen etkileşimlerini yakalar
- RBFNN (Radial Basis Function Neural Network): Bayesian düzenlileştirme ile sinir ağı yaklaşımı
- Rastgele Orman: Nonlineer makine öğrenmesi yöntemi olarak karmaşık genetik mimarilere uyum sağlar
Sonuçlar, pedigri (popülasyon yapısı) bilgisinin tahmin doğruluğunun önemli bir kısmını açıkladığını göstermektedir. Markör ve pedigri bilgisinin birlikte kullanılması, tüm modellerde tahmin doğruluğunu tutarlı biçimde artırmıştır. Buğday verilerinde, 306 hat ve 1717 DArT markör kullanılarak RKHS modeli ile tane verimi için 0.37-0.73 arası korelasyonlar elde edilmiştir.
Genom Çapında İlişkilendirme Çalışmaları (GWAS)
GWAS, agronomik özelliklerle ilişkili genleri veya QTL'leri belirlemek için kullanılır. Spindel et al., 2015 IRRI'nin sulanan pirinç ıslah programından 363 elit ıslah hattında GWAS ve GS'yi birlikte değerlendirmiştir.
Pirinç Genomik Seçilim Sonuçları
Popülasyon 73.147 markörle genotiplenmiş ve tane verimi, çiçeklenme zamanı ve bitki boyu için değerlendirilmiştir. Altı istatistiksel yöntem test edilmiştir: rrBLUP, Bayesian LASSO, RKHS, Rastgele Orman, Çoklu Doğrusal Regresyon (MLR) ve pedigri BLUP. Temel bulgular:
- GS, pedigri verisine dayalı tahminlere göre daha doğru sonuçlar üretebilmektedir
- GWAS sonuçları, GS modellerinin parametrelendirilmesini bilgilendirebilir
- Genetik mimari, istatistiksel yöntem seçimini etkiler
- Eğitim popülasyonu ile test popülasyonu arasındaki genetik ilişki, tahmin doğruluğunu güçlü biçimde etkiler
Mısır ve pirinç arasındaki genetik mimari farklılıkları dikkat çekicidir: mısır agronomik özellikleri genellikle küçük etkili birçok gen tarafından kontrol edilirken, pirinçte büyük etkili QTL'ler yaygın olarak gözlemlenir.
Markör Destekli Islah (MAS)
Geleneksel MAS, bilinen QTL'lerle bağlantılı markörler kullanarak seleksiyon yapar. Ancak bu yaklaşım çeşitli sınırlamalar taşır:
- Sadece büyük etkili QTL'ler etkili biçimde izlenebilir
- Küçük etkili genlerin kümülatif etkisi yakalanamaz
- QTL-markör ilişkisinin farklı popülasyonlarda doğrulanması gerekir
- Bilgi kaybı ve keşfif yanlılığı riski mevcuttur
GS, tüm markörleri modele dahil ederek bu sınırlamaları aşar.
Genotip × Çevre Etkileşimi (G×E)
Genotip-çevre etkileşimi, ıslah programlarının en zorlu boyutlarından biridir. Crossa et al., GS modellerinde G×E'nin dahil edilmesinin tahmin doğruluğunu artırabileceğini göstermiştir:
- Çok çevreli tahmin modelleri: İlişkili çevrelerden bilgi ödünç alarak gözlemlenmemiş bireylerin tahmin doğruluğunu yaklaşık %20 artırır
- Faktör analitik modeller: Pedigri ve genomik bilgiyi modellerken G×E yapısını da açıklar
- Çapraz doğrulama tasarımları: CV1 ve CV2 farklı pratik senaryoları temsil eder
CRISPR/Cas9 ve Gen Düzenleme
CRISPR/Cas9 teknolojisi, hedef genlerde hassas düzenlemeler yaparak ıslah sürecini kısaltır. Makine öğrenmesi, CRISPR uygulamalarını şu yönlerden destekler:
- Kılavuz RNA tasarımı optimizasyonu: Derin öğrenme modelleri, hedef dışı etkileri minimize eden kılavuz RNA dizilerini tahmin eder
- Fenotipik etki tahmini: Gen düzenleme sonuçlarının fenotipik etkilerinin öngörülmesi
- Pleiotropik etki analizi: Tek bir gende yapılan değişikliğin birden fazla özellik üzerindeki etkilerinin modellenmesi
Islah Süresinin Kısaltılması
GS'nin en önemli avantajlarından biri ıslah süresini kısaltmasıdır. Süt sığırcılığında GS'nin başarılı uygulanması, progeni testinin genç boğaların genotiplenmesiyle değiştirilmesi yoluyla kuşak aralığını yarıya indirmiştir. Bitki ıslahında benzer hızlandırma potansiyeli mevcuttur:
- Hızlı döngü popülasyonları: GS, erken kuşaklarda fenotipleme gerektirmeden seleksiyon yapılmasına olanak tanır
- Genotip imputasyonu: Düşük yoğunluktan yüksek yoğunluğa markör imputasyonu, büyük eğitim setleri ve yakın akraba bireylerin varlığında yüksek doğrulukla gerçekleştirilebilir
- Popülasyonlar arası tahmin: Dört popülasyonun birlikte kullanılmasıyla beşinci popülasyonu tahmin etme, GBLUP ile 0.41-0.79 arası korelasyonlar üretmiştir
Gelecek Perspektifler
Bitki ıslahında makine öğrenmesi entegrasyonu hızla gelişmektedir. Yüksek verimli fenotipleme platformları, drone tabanlı alan tarama ve remote-sensing-agriculture verileri ile genomik verilerin birleştirilmesi, çok omik (multi-omics) yaklaşımları ve derin öğrenme tabanlı genotip-fenotip tahmin modelleri, gelecek ıslah programlarını şekillendirecektir. Özellikle climate-agriculture adaptasyonu gerektiren stres toleransı özelliklerinin ıslahında, GS ve makine öğrenmesi kritik araçlar olarak öne çıkmaktadır.
Kaynaklar
- Crossa et al., 2014 -- "Genomic prediction in CIMMYT maize and wheat breeding programs." CIMMYT mısır ve buğday programlarında genomik tahmin sonuçları; pedigri, markör ve çevre etkileşimini modelleyen çoklu istatistiksel yaklaşımlar.
- Spindel et al., 2015 -- "Genomic Selection and Association Mapping in Rice." IRRI elit pirinç hatlarında GS ve GWAS entegrasyonu; genetik mimari, eğitim popülasyonu ve istatistiksel model etkisinin değerlendirilmesi.