2017-04-03 6 views
-1

Ich versuche, eine große Anzahl von Textzeichenfolgen aus einer CSV-Datei zu lesen. Jeder String ist durch einen Zeilenumbruch getrennt und keiner hat dieselbe Länge. Die Dokumentation auf der Tensorflow-Website enthält Anweisungen zur Eingabe von CSV-Daten. Sie ist jedoch unklar und trifft auch nicht auf mein Problem zu. Also meine Frage ist, was ist der beste Weg, um große Mengen von kurzen Zeichenfolgen (< 140 Zeichen) aus einer CSV-Datei zu nehmen, und geben Sie sie in eine RNN oder LSTM mit dem Tensorflow Datenpipeline?Tensorflow CSV-Eingang zu RNN

Antwort

0

Wir haben besprochen, wie man aus der CSV-Datei lesen und Stapel bilden kann: [Converting TensorFlow tutorial to work with my own data Es gibt dort einen detaillierten Code, der funktioniert (nicht für RNN, aber Sie können es anpassen). Ich könnte mir vorstellen, dass Sie ein Problem mit Strings unterschiedlicher Länge haben könnten, weil TF erwartet, dass Sie die Variable, die die Daten aus jeder Zeile der CSV enthält, mit einer vordefinierten Liste von Standardwerten füllen. Nicht sicher, wie leicht es wäre, das zu umgehen, aber dein Leben wäre viel einfacher, wenn du jede Zeile der CSV mit fester Länge hättest und dann von dort aus in TF arbeiten würdest.

Verwandte Themen