Consumer-transformationProducer-transformationApache Kafka Verbraucher nehmen lange Zeit, wenn als Plugin in Pentaho verwendet
ZIEL: Transfer Tabellen (120 Tabellen) aus Oracle-Datenbank zu vertica Datenbank.
Die derzeitige Praxis: Verwenden pentaho Werkzeugdaten aus Oracle-Datenbank zu extrahieren und sie als Datei speichern und laden sie wieder in vertica Datenbank.
Problem konfrontiert: Der gesamte Prozess läuft für eine lange Zeit. Das Speichern als Datei belegt mehr Platz und reduziert die Leistung.
Neuer Ansatz: Verwenden Sie Kafka als Messaging-System und sein Plugin in Pentaho.
Problem konfrontiert: Consumer-Plugin nimmt sehr viel Zeit für die Nachrichtenraubend und Laden in vertica Tabellen (6-mal die Zeit für das Laden Nachricht in Produzenten genommen).. 1. Avro-Format 2. Beispiel von 2 Millionen Datensätzen mit 200 Spalten
Wir würden gerne Vorschläge hören, um diese Leistung zu verbessern oder eine andere Möglichkeit vorschlagen, das Ziel mit Kafka zu erreichen.
Verwenden Sie Pentaho 7? – AlainD
Ja, ich benutze Pentaho 7.1 – Anjana