# Etkileşimli Pekiştirmeli Kararlar

<div class="mlv-demo-links">
  <a class="mlv-demo-link" href="hundred_page_ml.html">Genel Harita</a>
  <a class="mlv-demo-link" href="book_causal_interventions_and_policy_learning.html">Müdahale ve Politika</a>
  <a class="mlv-demo-link" href="interactive_book_causal_interventions.html">Nedensel Müdahale</a>
  <a class="mlv-demo-link" href="interactive_book_policy_optimization.html">Politika</a>
  <a class="mlv-demo-link" href="interactive_book_contextual_bandit.html">Bandit</a>
  <a class="mlv-demo-link active" href="interactive_book_reinforcement_decisions.html">Pekiştirmeli Karar</a>
  <a class="mlv-demo-link secondary" href="../_static/demos/book-reinforcement-decisions.html">Tam Ekran Demo</a>
</div>

<div class="mlv-demo-hero">
  <div class="mlv-demo-kicker">Kitap / Kısa Vadeli Ödül, Uzun Vadeli Kaderi Gizleyebilir</div>
  <p class="mlv-demo-lead">Pekiştirmeli kararlar, bir eylemin etkisini tek adımda değil zaman boyunca okur. Bu demo, horizon uzunluğu, iskonto, simülasyon kalitesi ve güvenlik kısıtları altında politikanın ne kadar olgunlaştığını gösterir.</p>
</div>

<div class="mlv-demo-grid">
  <div class="mlv-demo-panel">
    <strong>Ne Yap</strong>
    <span>Ufuk uzunluğunu, discount oranını, simülatör sadakatini, reward shaping'i ve politika kararlılığını değiştir.</span>
  </div>
  <div class="mlv-demo-panel">
    <strong>Ne Gör</strong>
    <span>Bazı politikalar kısa vadede parlak görünür; ama uzun vadeli geri dönüş ve kısıt ihlali birlikte okunduğunda zayıf kalır.</span>
  </div>
  <div class="mlv-demo-panel">
    <strong>Kitaptaki Karşılığı</strong>
    <span>Karar problemleri bazen tek atışlık değildir; bugünkü aksiyonun yarın yarattığı durum da modelin parçasıdır.</span>
  </div>
</div>

<div class="mlv-demo-note">
Pekiştirmeli düşünme, tahminden farklı olarak durumun gelecekte nasıl değişeceğini de modellemeye zorlar.
</div>

<iframe
  class="mlv-demo-frame"
  src="../_static/demos/book-reinforcement-decisions.html"
  title="Pekiştirmeli Kararlar Demosu"
  loading="lazy"
  frameborder="0"
></iframe>
