# Etkileşimli Bağlamsal Bandit

<div class="mlv-demo-links">
  <a class="mlv-demo-link" href="hundred_page_ml.html">Genel Harita</a>
  <a class="mlv-demo-link" href="book_causal_interventions_and_policy_learning.html">Müdahale ve Politika</a>
  <a class="mlv-demo-link" href="interactive_book_causal_interventions.html">Nedensel Müdahale</a>
  <a class="mlv-demo-link" href="interactive_book_policy_optimization.html">Politika</a>
  <a class="mlv-demo-link active" href="interactive_book_contextual_bandit.html">Bandit</a>
  <a class="mlv-demo-link" href="interactive_book_reinforcement_decisions.html">Pekiştirmeli Karar</a>
  <a class="mlv-demo-link secondary" href="../_static/demos/book-contextual-bandit.html">Tam Ekran Demo</a>
</div>

<div class="mlv-demo-hero">
  <div class="mlv-demo-kicker">Kitap / Keşif Yoksa Öğrenme de Yok</div>
  <p class="mlv-demo-lead">Bağlamsal bandit, her yeni gözlemde hangi aksiyonu deneyeceğine karar verirken hem ödül toplar hem de öğrenmeye devam eder. Bu demo, keşif ile sömürü arasındaki hassas dengeyi canlı olarak gösterir.</p>
</div>

<div class="mlv-demo-grid">
  <div class="mlv-demo-panel">
    <strong>Ne Yap</strong>
    <span>Keşif oranını, ödül gürültüsünü, özellik sinyalini, güvenlik tabanını ve trafik hacmini değiştir.</span>
  </div>
  <div class="mlv-demo-panel">
    <strong>Ne Gör</strong>
    <span>Çok az keşif yaparsan ajan erken donar; çok fazla keşif yaparsan öğrenirken pahalı hata biriktirirsin.</span>
  </div>
  <div class="mlv-demo-panel">
    <strong>Kitaptaki Karşılığı</strong>
    <span>Karar vericinin kalitesi, yalnızca bugünkü ödülden değil, yarın daha iyi seçim yapmayı öğrenmesinden gelir.</span>
  </div>
</div>

<div class="mlv-demo-note">
Bandit mantığı, veriyi pasifçe beklemek yerine hangi veriyi görmek için hangi aksiyonu seçeceğini de karara dahil eder.
</div>

<iframe
  class="mlv-demo-frame"
  src="../_static/demos/book-contextual-bandit.html"
  title="Bağlamsal Bandit Demosu"
  loading="lazy"
  frameborder="0"
></iframe>
