Bölüm 11: Conclusion
Kaynak: Andriy Burkov -- "The Hundred-Page Machine Learning Book" (theMLbook.com)
Bölüm 11: Sonuç (Conclusion)
Bu bölümde yazar, kitapta ele alinmayan ancak bin sayfalik bir makine öğrenmesi kitabinda yer alacak konulara kisa bir bakis sunar. Bu konularin her biri basli basina derin bir çalışma alanidir ve daha fazla araştırma için yol gosterici nitelik tasir.
11.1 Konu Modelleme (Topic Modeling)
Metin analizinde konu modelleme, yaygin bir gozetimsiz öğrenme problemidir. Bir metin belgesi koleksiyonu vardir ve her belgede bulunan konular kesfedilmek istenir.
Gizli Dirichlet Atamasi (LDA -- Latent Dirichlet Allocation): Konu kesfinde son derece etkili bir algoritmadir. Analist, koleksiyondaki konu sayisina karar verir ve algoritma koleksiyondaki her kelimeye bir konu atar. Bir belgedeki konulari cikarmak icin, o belgede her konuya ait kac kelime bulundugu sayilir.
11.2 Gauss Surecleri (Gaussian Processes)
Gauss süreçleri (GP), cekirdek regresyon ile rekabet eden gozetimli bir öğrenme yöntemidir. Cekirdek regresyona kiyasla bazi avantajlari vardir; örneğin, regresyon cizgisi için her noktada guven araliklari (confidence intervals) saglar. Karmasik olmakla birlikte, öğrenmek için harcanacak zaman degerlidir.
11.3 Genellestirilmis Doğrusal Modeller (GLM -- Generalized Linear Models)
GLM, doğrusal regresyonun girdi özellik vektoru ile hedef arasındaki çeşitli bagimlilik bicimlerini modellemeye genellestirilmis halidir. Lojistik regresyon, GLM'lerin bir bicimi olarak siniflandirilir. Regresyonla ilgileniyorsaniz ve basit, yorumlanabilir modeller ariyorsaniz, GLM hakkinda derinlesmek faydali olacaktir.
11.4 Olasiliksal Grafiksel Modeller (PGM -- Probabilistic Graphical Models)
PGM'lerin bir örneği daha once ele alinmisti: Kosullu Rastgele Alanlar (CRF -- Conditional Random Fields). CRF ile kelime dizisi ve bu dizideki özellik-etiket ilişkileri ardisik bir bagimlilik grafi olarak modellenebilir.
Genel Yapisi
- Bir PGM herhangi bir graf olabilir.
- Graf, dugumler (rastgele değişkenler) ve kenarlardan (kosullu bagimliliklari gosteren) olusur.
- Örnek: "kaldirim islakligi" rastgele değişkeni "hava durumu" rastgele değişkenine baglidir.
- Bazi rastgele değişkenlerin değerlerini gözlemleyerek, bir optimizasyon algoritmasi gözlemlenen ve gözlemlenmeyen değişkenler arasındaki bagimliligi veriden ogrenebilir.
Yonlu ve Yonsuz Graflar
Graf kenarlarinin yonlu olmasi durumunda nedensellik (causality) çıkarımi mumkun olur. Ancak bu modelleri elle oluşturmak, önemli alan uzmanligi ile olasılik teorisi ve istatistik bilgisi gerektirir.
Diger Modeller
- Gizli Markov Modeli (HMM -- Hidden Markov Model): Gecmiste konusma tanima, zaman serisi analizi ve diger zamansal çıkarım gorevlerinde sik kullanilmisti, ancak sinir aglarina yenildi.
- PGM'ler ayrica Bayes aglari, inanc aglari ve olasıliksal bagimsizlik aglari olarak da bilinir.
CRF, en cok kullanilan PGM olup uygulamalari büyük ölçüde metin ve görüntü işlemedir; ancak bu iki alanda da sinir aglari tarafından asildi.
11.5 Markov Zinciri Monte Carlo (MCMC)
Grafiksel modellerle çalışırken, bagimlilik grafi tarafından tanimlanan karmaşık bir dagilimindan örnekler cekmek için MCMC algoritmalari kullanılır.
MCMC, matematiksel olarak tanimlanmis herhangi bir olasılik dagilimindan örnekleme yapabilen bir algoritmalar sınıfıdir. Normal veya duzgun gibi standart dagilimlardan örnekleme kolaydir; ancak bagimlilik grafinden öğrenilmiş keyfi bicimli bir dagilimdan örnekleme cok daha karmaşıktir.
11.6 Genetik Algoritmalar (Genetic Algorithms -- GA)
Genetik algoritmalar, turevlendirilemeyen optimizasyon amac fonksiyonlarini optimize etmek için kullanilan sayisal bir optimizasyon tekngidir. Evrimsel biyoloji kavramlarini kullanarak global optimumu arar.
Calisma Prensibi
- Baslangic nesli: Model parametrelerinin rastgele birden fazla kombinasyonu olusturulur.
- Değerlendirme: Her parametre kombinasyonu amac fonksiyonuna karsi test edilir.
- Sonraki nesil: "Secilim (selection)", "çaprazlama (crossover)" ve "mutasyon (mutation)" kavramlari uygulanir.
- En iyi performans gosterenler korunur.
- En kotu performans gosterenler, en iyilerin mutasyonlari ve çaprazlamalari ile degistirilir.
- Mutasyon: Bir noktanin bazi özelliklerinin rastgele bozulmasiyla elde edilir.
- Çaprazlama: Birden fazla noktanin belirli bir kombinasyonudur (örneğin ortalama).
GA, olculebilir herhangi bir optimizasyon kriterini optimize etmeye izin verir. Örneğin, bir öğrenme algoritmasinin hiper parametrelerini optimize etmek için kullanilabilir. Ancak genellikle gradyan tabanli optimizasyon tekniklerinden cok daha yavastir. Ayrica bkz. Hyperparameter Optimization.
11.7 Pekistirmeli Öğrenme (Reinforcement Learning)
Pekistirmeli öğrenme (RL), karar vermenin ardisik oldugu ozel bir problem turunu cozer. Genellikle bilinmeyen bir ortamda hareket eden bir ajan (agent) vardir. Her eylem bir odul (reward) getirir ve ajani ortamin baska bir durumuna (state) tasir. Ajanin amaci uzun vadeli odulunu optimize etmektir. Ayrica bkz. Reinforcement Learning.
Uygulama Alanlari
- Video oyunu oynama
- Robotik navigasyon ve koordinasyon
- Envanter ve tedarik zinciri yonetimi
- Karmasik elektrik guc sistemleri (guc sebekeleri) optimizasyonu
- Finansal ticaret stratejileri öğrenimi
Q-öğrenme ve sinir agi tabanli turevleri, pekistirmeli öğrenmenin temel algoritmalaridir.
Kitabin Genel Değerlendirmesi
Yazar, bu kitapta her seyi kapsamamis olsa da, yuz sayfa icinde normalde her biri bin sayfa kalinliginda birkac kitapta bulunabilecek içeriği sunmus oldugunu belirtir. Tipik makine öğrenmesi kitaplarinin muhafazakar ve akademik olmasinin aksine, bu kitap gunden gune çalışmada faydali bulunacak algoritma ve yöntemleri vurgular.
Kitabin eslik eden wiki sayfasi (theMLbook.com) surekli guncellenmektedir ve kitapta ele alinan her makine öğrenmesi alanindaki yeni gelismeleri takip etmek için ziyaret edilmesi onerilir.
Ozet: Kitapta Ele Alinmayan Konular
| Konu | Kisa Aciklama |
|---|---|
| Konu Modelleme (LDA) | Belgelerde konu kesfetme |
| Gauss Surecleri | Guven aralikli cekirdek regresyon alternatifi |
| GLM | Doğrusal regresyonun genellestirilmesi |
| PGM (CRF, HMM) | Degiskenler arasi bagimlilik grafi modelleme |
| MCMC | Karmasik dagilimlardan örnekleme |
| Genetik Algoritmalar | Turevlendirilemeyen fonksiyonlarda evrimsel optimizasyon |
| Pekistirmeli Öğrenme | Ardisik karar verme, odul optimizasyonu |
Lisans ve Atıf
Bu sayfa, Andriy Burkov tarafından yazılan "The Hundred-Page Machine Learning Book" kitabına dayalı notlar içermektedir.
- Kitap: theMLbook.com
- GitHub: github.com/aburkov/theMLbook
- Lisans: MIT License — Copyright (c) 2019 Andriy Burkov
- İlke: "Read first, buy later" — Kitabı önce okuyun, beğenirseniz satın alın.
MIT Lisansı gereği bu copyright bildirimi ve izin bildirimi, Yazılımın tüm kopyalarına veya önemli bölümlerine dahil edilmelidir.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND. Bu içerik eğitim amaçlıdır ve orijinal eserin yerine geçmez. Tam kitap için themlbook.com adresini ziyaret edin.