Wenn mein Baum tief genug ist, dass Endknoten ausgewählt werden, hätte ich angenommen, dass ich nur eine Null-Bewegung "Playout" davon ausführen und die Ergebnisse zurück propagieren sollte, aber die IEEE survey of MCTS methods zeigt diese Auswahl an Schritt sollte den "dringendsten erweiterbaren Knoten" finden und ich kann nirgendwo anders Gegenbeispiele finden. Soll ich sie irgendwie ausschließen? Was ist hier richtig?Wie mit Endknoten in Monte Carlo Tree Search umgehen?
Antwort
Wenn Sie in der Auswahlphase tatsächlich einen Endknoten erreichen, überspringen Sie die Erweiterung und die Wiedergabe (sie sind nicht mehr sinnvoll) und leiten den Wert dieses Endknotens geradeaus.
Aus dem Papier, das Sie verbunden ist, ist dies von Seite nicht klar 6, aber es ist in diesem Pseudo-Code in Algorithmus 2 auf Seite 9 klar, die TreePolicy()
Funktion einen Endknoten v am Ende zurückkehrt. Wenn der Zustand dieser Knoten wird dann in die DefaultPolicy()
Funktion übergeben, diese Funktion wird direkt die Belohnung zurückgeben (die Bedingung der while-Schleife dieser Funktion wird nie erfüllt sein).
Es macht auch Sinn, dass Sie das tun möchten, wenn Sie ein gutes intuitives Verständnis des Algorithmus haben und wollen, dass er bei unendlicher Verarbeitungszeit optimale Schätzungen der Werte garantiert. Mit einer unendlichen Verarbeitungszeit (unendliche Anzahl von Simulationen) möchten Sie Werte aus den "besten" Endzuständen unendlich häufig sichern, so dass die gemittelten Werte aus Sicherungen in Knoten, die näher am Stamm liegen, auch diesen Werten entsprechen beste Blattknotenwerte im Limit.
- 1. Monte Carlo Tree Search oder andere Algorithmen für ein stochastisches Kartenspiel?
- 2. Monte Carlo Simulator
- 3. Population Monte-Carlo-Implementierung
- 4. numpy.random und Monte Carlo
- 5. Warum Monte-Carlo-Methode?
- 6. Monte-Carlo-Simulation in Ruby
- 7. Monte Carlo Schätzung von m_coloring
- 8. Anpassung mit Monte Carlo in Python
- 9. Monte Carlo Integration funktioniert nicht?
- 10. Monte-Carlo-Baum Alternierende Suche
- 11. Monte-Carlo-Politik Auswertung Verwirrung
- 12. R: Monte Carlo Simulation mit bergangsmatrix
- 13. Finden von PI-Ziffern mit Monte Carlo
- 14. 10-dimensionale Monte-Carlo-Integration mit openmp
- 15. Monte-Carlo-Simulation in der Prognose?
- 16. Monte Carlo Würfel Simulation in R
- 17. Gleichmäßige zufällige (Monte-Carlo) Verteilung auf Einheitskugel
- 18. Monte-Carlo-Löser parallel zu QuTiP
- 19. Monte Carlo Stil einen integrierten MATLAB
- 20. Eine effizientere Monte-Carlo-Simulation machen
- 21. Implementierung der sequentiellen Monte Carlo-Methode (Partikelfilter)
- 22. Monte Carlo Baum Verbesserungen der Suche
- 23. Monte-Carlo-Baumsuche: Baumrichtlinie für Zwei-Spieler-Spiele
- 24. Averaging-Lösungen in Monte Carlo Simulation mit Octave
- 25. Monte Carlo mit Raten, Systemsimulation mit CUDA C++
- 26. Problem mit Monte-Carlo-Analyse mit Unsicherheit auf LCIA
- 27. Multi und Parallel Monte Carlo fehlgeschlagen mit Schlüsselfehler (auf Datenbankname)
- 28. Integral sinx dx mit Monte-Carlo-Methode berechnen?
- 29. Falsches Ergebnis bei einfacher Monte-Carlo-Integration in R
- 30. Binary Search Tree Balance