Obwohl ich verwalten kann die Beispiele und meinen eigenen Code bekommen zu laufen, ich bin mehr gespannt auf die reale Semantik/Erwartungen hinter OpenAI Fitness-Studio-API, insbesondere Env.reset()OpenAI Gym: Wann ist Reset erforderlich?
Wenn Reset erwartet/erforderlich? Am Ende jeder Episode? Oder erst nach dem Erstellen einer Umgebung?
Ich denke eher, dass es vor jeder Episode Sinn macht, aber ich konnte das nicht explizit lesen!