2017-02-22 2 views
2

Ich habe ein Klassenprojekt mit Pentaho. Ich muss ein Dashboard mit zwei verschiedenen Eingaben in eine PostgreSQL-Ausgabe erstellen. Mein Problem ist, dass ich mit Kettle zwei verschiedene .csv-Dateien, die in den Postgres eingehen, abgleichen muss. Einer der CSV ist über Verbrechen, der andere ist über das Wetter. Ich habe manuell zwei Spalten in das Wetterfeld eingefügt, sodass sie zwei übereinstimmende Spalten haben: "Monat" und "Jahr".Wasserkocher - Zwei CSV-Eingänge in PostgreSQL-Ausgabe

kettle transformation

Meine Frage ist, wie kann ich diese passenden Spalten (oder macht das keinen Sinn macht), so kann ich später das Dashboard erstellen und Abfragen machen wie ‚Was Verbrechen wo engagiert, wenn es regnet?‘ .

Entschuldigung, wenn ich nicht sehr genau bin, bin ich etwas verloren bei der Verwendung von Pentaho. Wenn mir jemand helfen könnte, wäre ich dankbar.

+0

Soll die Ausgabe in einer einzelnen Tabelle oder zwei separaten Tabellen sein? – Cyrus

+0

Ich bin mir nicht wirklich sicher, ich muss in der Lage sein, Abfragen basierend auf den beiden csv zu tun. Also ich weiß nicht, was die beste Option ist. Ich muss auch die Maße/Dimensionen auswählen. Meine Idee war, ein paar Filter zu machen, sortiert nach "Stadt, wo es passiert ist", "Mordwaffe", "Wetter". Ich habe wirklich Probleme, diese Konzepte zu verstehen. –

Antwort

2

Wenn Sie zwei CSV-Dateien verknüpfen möchten, überprüfen Sie den Join-Schritt.

Verwandte Themen