2017-10-28 4 views
0

Ich mag würde Daten aus einer CSV-Datei zu transformieren, wie diesePentaho binäre Darstellung zu Transaktionsdaten

ID 1 2 3 4 5 6 7 8 9 
1 0 0 0 0 1 0 1 0 0 
2 1 0 1 0 1 0 0 0 0 
3 0 0 0 0 1 1 0 0 0 

in eine CSV-ähnlichen

ID Item 
1 5 
1 7 
2 1 
2 3 
2 5 
3 5 
3 6 

Datei Wie diese Datei zu verwandeln?

Antwort

0

Holen Sie sich die Daten mit einem CSV file input, dann schwenken mit Row Normalizer um die ID-Spalte, und Filter the rows mit Item = 0, und in einem Text output file mit einem CSV-Format das Ergebnis setzen.

Der einzige herausfordernde Teil kann die Definition des Normalisierers enter image description here sein.

Die Row filter ist einfach. Wenn Sie es zum ersten Mal verwenden, beachten Sie, dass Sie auch send false data to step angeben müssen, wenn Sie eine send true data to step angeben. In Ihrem Fall geben Sie keine an, sodass nur die Daten gefüllt werden.

enter image description here

+0

Vielen Dank, ich weiß nicht, ob es Filterreihe gibt. Ich habe eine Idee, wie man Reihen-Normalisierer benutzt, aber ich weiß nicht, wie man den 0 Artikel säubert. – Farifiyanto

+0

Ich habe die 'Filterzeile' hinzugefügt. – AlainD

0

Darf ich vorschlagen, Sie zu lesen, die Official StartUp guide: .

Sie können auch eine Hand auf das Kettle Buch: Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration von M. Casters, R. Bouman, J. van Dongen. Es ist ein riesiges und schweres Buch, aber erschöpfend und noch nicht überholt.

Sie können auch in das Beispielverzeichnis schauen, das mit Ihrer Distribution geliefert wurde. Es enthält Arbeitsbeispiele für fast alle Schritte.

+0

Vielen Dank. Ich weiß nicht, wo ich den Kessel studieren soll. Ich werde Ihren Vorschlag notieren. Danke vielmals. – Farifiyanto

Verwandte Themen