Ich bin dabei, Apache NiFi für den Einsatz in einem Projekt zu bewerten. Ich habe vier Instanzen von NiFi v1.1.2 läuft in der Cloud auf Ubuntu 14 Systeme. Drei der Instanzen agieren als Fernprozessgruppen (R1
, R2
& R3
) und die verbleibende Instanz (M1
) wird verwendet, um den Fluss zwischen den RPGs zu verwalten. M1
generiert ein FlowFile, übergibt das FlowFile durch eine Pipeline, die aus den drei RPGs besteht, und protokolliert das FlowFile am Ende. Jedes RPG fügt einfach R{id}
an ein Attribut ProcessedBy in der FlowFile an, damit die Reihenfolge, in der die Daten verarbeitet werden, leicht ersichtlich ist.Apache NiFi unregelmäßiger Datenfluss durch Remote Process Groups
Das Problem, das ich habe, ist die Bestellung ist nicht wie erwartet in 100% der Zeit. Ich benutze 2 Pipelines (P1
& P2
), die die RPGs in der Reihenfolge R1->R2->R3
bzw. R2->R1->R3
durchqueren. Was ich sehe ist, dass ~ 50% der Zeit, die Flowfile in P1
nicht von R2
verarbeitet, während in P2
es Richtung tatsächlich umkehrt und wird von R2
zweimal so verarbeitet, dass die Strömung um R2->R1->R2->R3
bearbeiten wird: Hier
ist ein Bild meiner Strömung in M1
Können Sie ein Bild des Flusses teilen? Wie segmentieren Sie den Verkehr für P1 vs. P2? Haben Sie die Provenance-Ereignisse aus Beispiel-Flowfiles betrachtet, um ihre Pfade zu sehen? – James
@James, um den Verkehr für 'P1' &' P2' zu trennen. Ich laufe entweder den einen oder den anderen. Ich schaue mir die Datenherkunfts-Ereignisse an, aber es gibt mir keine Informationen über die Ursache.Ich kann den Pfad des FlowFile sehen, der sich durch die Pipeline bewegt, aber ich kann nicht sehen, was den falschen Fluss verursacht. –