2017-09-14 2 views
0

Ich habe eine Kafka Streams-Anwendung, die Daten aus wenigen Themen aufnimmt und die Daten verbindet und in ein anderes Thema bringt.KStream-KStream Join vs KStream-KTable Join Performance

Kafka Konfiguration:

5 kafka brokers 
Kafka Topics - 15 partitions and 3 replication factor. 

Nur wenige Millionen von Datensätzen verbraucht werden/erzeugt jede Stunde.

Ich mache KStream-KStream beitreten, die 2 interne Themen erstellt. Während der KStream-KTable-Join erstellt wird, wird 1 internes Topic + 1-Tabelle erstellt.

Was ist besser in Bezug auf die Leistung und andere Faktoren?

Antwort

1

Die Wahl ist nicht eine Frage der Leistung, sondern eine Frage der Semantik : Was sollte die Verbindung Ergebnis seiner? Beide Joins berechnen sehr unterschiedliche Ergebnisse, daher sollten Sie die Semantik auswählen, die Ihren Anwendungsanforderungen entspricht.

:

Die verschiedenen Semantik sind in CP-Dokumentation und AK Wiki dokumentiert