2017-01-17 5 views
2

Sequenz-IDs sind im CNTK-Textformat optional. Ich frage mich, wie Sequenz-IDs während des Trainings verwendet werden. Wenn ein Minibatch aus einem CNTKTextFormat mit Sequenz-IDs erstellt wird, wird eine Zeile in CNTKTextFormat als eine Stichprobe betrachtet oder werden alle Zeilen mit derselben Sequenz-ID zusammen als eine Stichprobe betrachtet?Wie verwendet CNTK Sequenz-IDs während des Trainings?

Antwort

1

Wenn IDs angegeben werden, bilden alle Zeilen mit der gleichen Sequenz ID zusammen eine Trainingsinstanz (im CNTK-Jargon: sie bilden eine Sequenz aus Samples).

Wenn IDs fehlen, dann ist jede Zeile eine neue Trainingsinstanz (bestehend aus einer Sequenz mit einem einzelnen Sample).

+0

danke. Follow-up-Fragen, bedeutet eine Trainingsinstanz, dass alle Samples in der gleichen Trainingsinstanz nacheinander ausgeführt werden müssen und nicht getrennt oder geändert werden können? Ist die Minibatch-Größe durch die Anzahl der Proben oder die Anzahl der Trainingsinstanzen definiert? Wenn zum Beispiel eine Sequenz 50 Samples hat und die Minibatch-Größe auf 32 gesetzt ist, wie funktioniert das? – dragon

Verwandte Themen