2017-12-18 4 views
0

Ich habe in Cassandra eine Tabelle mit einem Partitionsschlüssel (d. H. Einem Primärschlüssel) erstellt und ca. 50K Datensätze darin eingefügt, wobei 35K eindeutige Datensätze sind.Anzahl der in Cassandra erstellten Partitionen

Gemäß der Regel (Bitte korrigieren Sie mich, wenn ich falsch liege), sollte die Anzahl der Partitionen in Cassandra den eindeutigen Datensätzen in der Tabelle entsprechen (d. H. Keine Partitionen = eindeutiger Datensatz im Primärschlüssel).

Aber während ich habe das Knotenwerkzeug -

./nodetool tablestats -H keyspace.tablename

es gibt mir: -

Number of keys (estimate partitions key): 7500 

also viel weniger als die keine eindeutigen Datensätze in meiner Tabelle.

Also bitte kann jemand dieses Szenario erklären.

+0

Haben Sie nur 1 Knoten? Hast du gespült? Welche Version? –

Antwort

3

tablestats gibt Ihnen nur relative Größe der Anzahl der Schlüssel, nicht die genaue Größe. Wenn Sie insgesamt eindeutige Zeilen anzeigen möchten, führen Sie select count(partition_key_col) from tableName aus. Es ist möglich, dass Sie beim Ausführen der Abfrage ein Abfrage-Zeitlimit erhalten, indem Sie cqlsh request-timeout festlegen, bevor Sie die Abfrage ausführen.

1

Die Tabellendaten werden bei Spülung aktualisiert. Wenn Sie manuell ein nodetool-Flush ausführen, sollten Sie eine genaue Zahl sehen.

Verwandte Themen