Wie nehme ich kategorische und kontinuierliche Daten aus einer CSV-Datei (wie Titanic dataset) und bekomme sie in ein gutes Format für Tensorflow, ohne die tf.learn API zu verwenden (zB pure Tensorflow) ?Mischen von kategorischen und kontinuierlichen Daten in reinem Tensorflow
Zum Beispiel
- kategorische Daten könnten (in meinem Fall) sein 'vehicle_make', 'vehicle_model'
- Kontinuierliche Daten könnten 'Preis' sein, 'Kilometerstand'
I dann will, wie im folgenden Beispiel, diese Daten als Eingabe in ein mehrschichtiges Perzeptron neuronales Netzwerk verwenden:
Cheers,
Baz
Muss ich die kontinuierlichen Werte zwischen 0 und 1 skalieren? Wenn ja, wie empfehlen Sie das? Prost. –
Normalisierung von Eingabedaten ist fast immer ein vernünftiger Schritt zu tun, stellen Sie einfach sicher, dass alle Daten auf die gleiche Weise normalisiert werden und das Testen von Daten keine Informationen an Trainingssätze "leckt" e.t.c. – hamilyon