Könnte jemand bitte klarstellen, wie (wie ich nirgends ein klares Beispiel gefunden habe) Der MCTS-Algorithmus iteriert für den zweiten Spieler. Alles, was ich zu scheinen scheint scheint zu sein, wie
In dem in Wikipedia beschriebenen Algorithmus mcts wird bei jeder Knotenauswahl genau ein Playout (Simulation) durchgeführt. Jetzt experimentiere ich diesen Algorithmus in einem einfachen Connect-K-Sp
Ich versuche, den MCTS-Algorithmus für ein Spiel zu implementieren. Ich kann nur ungefähr 0,33 Sekunden pro Zug benutzen. In dieser Zeit kann ich aus dem Startzustand, der etwa 500 Kindknoten enthält,