Der Algorithmus, der diese New York Times schlägt Rock/Paper/Scissors AI

Der Algorithmus, der * diese New York Times KI schlägt ohne Brute Forcing in Rock/Paper/Scissors? (In Veteran-Modus)Der Algorithmus, der diese New York Times schlägt Rock/Paper/Scissors AI

http://www.nytimes.com/interactive/science/rock-paper-scissors.html?_r=1& (Flash muss aktiviert sein, mit der KI spielen) (Website gibt ständig Informationen darüber, wie AI seinen nächsten Zug wählt, nachdem Sie mindestens 5 Mal gespielt)

Ich lerne Maschine alleine lernen und ich bin ziemlich Anfänger. (Gerade angefangen gestern).

Mein Freund sagte mir, dass sie beauftragt wurden, das obige Problem zu lösen, ohne irgendwelche ML-Techniken in ihrer ML-Klasse zu lernen. Ich wollte es auch machen, aber ich kann nicht anders denken als den brutalen Zwang.

Für den Trainingsdatensatz mit AI 100 oder mehr spielen und diese 100 oder mehr Daten sammeln. Verwenden Sie diese Daten, um einen Algorithmus zu erstellen, mit dem Sie mehr Spiele gewinnen, wenn Sie Ihr Programm verwenden, als ohne Ihr Programm zu verwenden. Als super Novize kann ich gar nichts denken.

irgendwelche Hinweise? Dank

Quelle

2017-03-07 Rikenm

Novice Modus

Also das schöne an der Seite ist, ist, dass es die Idee zeigt hinter jeder Bewegung ist. Es versucht, deine Aktion vorherzusagen, indem du dir die Geschichte deiner Züge ansiehst. So könnte Ihr Umzug Geschichte sein, die folgenden: (rock = r, Scheren = s und Papier = p)

r p s p p s s r r p s

Jetzt ist es die Geschichte schaut durch und versucht, eine Wiederholung von r p s zu finden. Sie finden dies am Anfang der Geschichte r p s p p s s r r p s, und finden Sie, dass Sie danach gespielt haben. Somit wird der nächste Schritt des Computers s sein.

Wenn es die Wiederholung der Zeichenfolge nicht finden kann (r p s), sieht es kleinere Strings (p s) und so weiter. Wenn es mehrere Wiederholungen gibt, wählt dasjenige aus, das am häufigsten auftrat (oder für nur zufällige Picks eins).

So könnte man ein Programm schreiben, das genauso funktioniert wie auf der Website. Sie versuchen, Ihren eigenen Zug vorherzusagen (wie das Programm der Seite). So lassen Sie zum Beispiel (r p s), der Computer würde eine Bewegung von voraussagen, also mit diesem Wissen würden Sie s wählen.

Veteran Modus

In Veteran-Modus verwendet die KI die Geschichte von 200000 Spiele Ihren nächsten Schritt zu prognostizieren. Um zu versuchen, das zu bezwingen, werden Sie die Geschichte von 100 Spielen genau so verwenden, wie die KI es tut.

Sie betrachten die Geschichte Ihres aktuellen Versuch plus Ihrer Geschichte (100 Spiele) und versuchen, Wiederholung eines bestimmten Typs (Beispiel r s p r) zu finden. Und Sie schauen, was der Computer darauf ansprach. Jetzt wählst du entsprechend aus, damit du den Computer besiegst. Natürlich gewinnt das nicht immer, weil der Computer oft eine zufällige Antwort zwischen zwei Picks verwendet (und eine längere Geschichte, also mehr Samples zur Auswahl). Aber dies sollte die Anzahl der Siege erhöhen.

Ich habe auch keine Erfahrung mit maschinellem Lernen, aber das wäre meine Strategie beim Schreiben eines Programms.

Ich hoffe, das hilft.

Wenn Sie sie nicht schlagen können sie beitreten;) Prost

Quelle

2017-03-07 15:24:08

Dank für die Beantwortung von mir Also, sagen Sie die KI zu manipulieren, aber es gibt ein Problem. KI lernt nicht viel von mir oder wird sogar von mir manipuliert, da die KI bereits über 200.000 Spiele in ihrem Gedächtnis gespeichert hat. Die Sache, die du sagst, wird funktionieren, wenn ich mit einer KI-Anfängerin spiele, die alles von mir lernt, aber in diesem Fall spielen wir mit einer Veteranen-KI, die bereits 200.000 Spiele gespeichert hat. – Rikenm

Dann verwenden Sie youre 100 Spiele als eine Geschichte, um zu versuchen, das Ergebnis vorherzusagen. Genau wie die KI es tun würde. Verwenden Sie wieder die Idee, die das Ai auf der Website verwendet. –

Ich habe meine Antwort aktualisiert @ Rikenm –

Der Algorithmus, der diese New York Times schlägt Rock/Paper/Scissors AI

Antwort

Verwandte Themen