Für ein Einzelspieler-Spiel sind Q-Wert-Updates ziemlich intuitiv. Der aktuelle Zustand und der zukünftige Zustand hängen von der Strategie eines einzelnen Spielers ab, für zwei Spieler ist dies jedoch nicht der Fall. Betrachten Sie das Szenario, in dem der Gegner gewinnt und das Spiel beendet wird. Wie werden die Q-Werte aktualisiert?Wie aktualisierst du Q-Werte für ein Zwei-Spieler-Spiel?
3
A
Antwort
1
Ein gängiger Ansatz ist, deinen Gegner als Teil der Umgebung zu betrachten, also würde der Zustand so definiert werden, dass er das Sagen, die Position des Gegners enthält. Sie wählen eine Aktion aus und führen sie aus, indem Sie den Status ändern. Der Gegner ergreift dann seine Aktion und ändert den Zustand erneut. Ihr Agent erhält dann den Zustand prime, der das Ergebnis seiner vorherigen Aktion und der vorherigen Aktion des Gegners ist.
So in dem Fall, dass in dem Zustand s
Sie Maßnahmen ergreifen a
, dann die Gegner wirken und beenden das Spiel, würden Sie einen Übergang von s
zu einem Terminal Zustand über a
aufzeichnen.
Verwandte Themen
- 1. Wie aktualisierst du ckeditor?
- 2. Wie aktualisierst du die Fernbedienungen in Magit?
- 3. Wann und wie aktualisierst du ein geändertes Element in Memcached?
- 4. Wie aktualisierst du gc_grace_seconds mit cassandra-cli?
- 5. Wie aktualisierst du ein DateTime-Feld in T-SQL?
- 6. Wie aktualisierst du MAMPs PHP auf PHP 5.3?
- 7. Wie aktualisierst du nur NuGet-Pakete mit bestimmten IDs?
- 8. Wie aktualisierst du Rubygems mit rvm und ree?
- 9. Wie aktualisierst du einen Benutzer in Firebase mit AngularFire2?
- 10. Wie aktualisierst du ein Tomcat Java Applet zur Verwendung von JNLP?
- 11. Wie aktualisierst du ein Bild in einer Datenbank? C# asp.net sql
- 12. Wie aktualisierst du ein KnockOutJs ViewModel von einem Jquery Ajax Aufruf?
- 13. Mungo - Wie aktualisierst du ein bestimmtes Objekt in einem Array von Referenzobjekten?
- 14. Wie aktualisierst du die neueste Python 3.5.1 Version auf einem Raspberry Pi?
- 15. Wie aktualisierst du das Apple TV Developer Kit? tvOS Software nicht über iTunes verfügbar
- 16. Wie aktualisierst du XML-Inhalt in Jackrabbit mit einer XPath-Abfrage?
- 17. Wie aktualisierst du die Levels eines Pandas MultiIndex nach dem Schneiden seines Dataframes?
- 18. Wie aktualisierst du einen CoreData-Eintrag, der bereits in Swift gespeichert wurde?
- 19. Wie aktualisierst du das Modell aus der Direktive in Angular 2?
- 20. Wie machst du ein Makefile
- 21. Wie machst du ein Radialdiagramm?
- 22. Wie programmierst du ein Attribut?
- 23. Wie machst du ein Netz?
- 24. Wie stellst du die 16 Terminalfarben für Git-Bash ein?
- 25. Wie installierst du ein Modul in erlang?
- 26. Wie kompilierst du ein Flash-Projekt neu?
- 27. Wie kompilierst du ein VST Plugin?
- 28. Wie definierst du ein @interface in Scala?
- 29. Spielentwicklung: Wie machst du ein Geschichtenspiel?
- 30. Wie installierst du ein Maven2 Plugin?