Ich entwerfe Hochdurchsatz-System, wo ich mehrere Produzenten haben werde.Beeinträchtigt die ungleiche Verteilung von Nachrichten zwischen Partitionen die Leistung des Kafka-Clusters?
Meine Themen werden partitioniert. Hersteller werden Datensätze als Schlüssel-Wert-Paare senden.
Schlüssel werden zur Partitionierung der Daten verwendet.
Die Verbraucher werden in Verbrauchergruppen organisiert (ihnen wird die gleiche Gruppen-ID zugewiesen, damit sie gleichzeitig Nachrichten desselben Themas, aber von verschiedenen Partitionen konsumieren können).
Kafka garantiert die Reihenfolge der Nachrichten innerhalb einer einzelnen Partition.
Den Verbrauchern wird ihr gerechter Anteil an Partitionen zugewiesen.
Die einzige Sache, die mir Sorgen macht, wird meine Partition Key nicht Nachrichten in der Round-Robin-Mode verteilen und einige Partitionen können belebter sein als andere.
Frage: Können ungleichmäßige Partitionen die Leistung eines Kafka-Clusters in irgendeiner Weise beeinträchtigen? Gibt es irgendwelche roten Fahnen?
Ich verstehe, dass einige Verbraucher mehr Arbeit haben werden, aber das ist nicht meine Hauptsorge. Jede Hilfe in dieser Angelegenheit wird geschätzt.