Ich untersuche ETL-Tools (wie Talend) und untersuche, ob Apache Nifi verwendet werden kann. Könnte Nifi verwendet werden, die folgende auszuführen:Wie man zwei CSVs mit Apache Nifi verbindet
- Pick-up zwei CSV-Dateien, die auf der lokalen Festplatte
- die CSVs auf einer gemeinsamen Spalte
- die verbundene CSV auf die Festplatte schreiben Join platziert sind
Ich habe versucht, einen Job in Nifi einzurichten, konnte aber nicht sehen, wie die Verknüpfung von zwei separaten CSV-Dateien durchgeführt wird. Ist diese Aufgabe in Apache Nifi möglich?
Es sieht so aus, als könnte die QueryDNS processor verwendet werden, um die Anreicherung einer CSV-Datei mit der anderen durchzuführen, aber das scheint für diesen Anwendungsfall zu kompliziert zu sein.
Hier ist ein Beispiel der Eingangs CSVs, die auf state_id verbunden werden müssen:
Eingabedateiencustomers.csv
id | name | address | state_id
---|------|--------------|---------
1 | John | 10 Blue Lane | 100
2 | Bob | 15 Green St. | 200
states.csv
state_id | state
---------|---------
100 | Alabama
200 | New York
Ausgabedatei
output.csv
id | name | address | state
---|------|--------------|---------
1 | John | 10 Blue Lane | Alabama
2 | Bob | 15 Green St. | New York