Ich habe eine Cassandra Tisch mit Terabytes von Daten (Cassandra Version 2.0 ist), hier ist das, was das Schema sieht wieüberprüfen Tabellengröße in cassandra historisch
"my_table" (
key ascii,
timestamp bigint,
value blob,
PRIMARY KEY ((key), timestamp)
)
Ich möchte einige Daten löschen, aber bevor Sie abschätzen wollen, wie viel Speicherplatz es zurückgewinnt.
Leider sind Statistiken von JMX-Metriken nur für die letzten zwei Wochen verfügbar, also ist das nicht sehr nützlich.
Gibt es eine Möglichkeit zu überprüfen, wie viel Speicherplatz von bestimmten Datensätzen verwendet wird (z. B. wo Timestamp < 1000)?
Ich fragte mich auch, ob es eine Möglichkeit gibt, Abfrage Ergebnismenge zu überprüfen, so dass ich etwas wie select * from my_table where timestamp < 1000
tun kann und sehen, wie viele Bytes das Ergebnis belegt.
Als eine Anmerkung, das nodetool clearsnapshot kann Ihre "Backups" loswerden. Diese werden erstellt, wenn Sie Tabellen abschneiden und löschen, damit Sie sie wiederherstellen können. Wenn Sie also nach Speicherplatz auf der Festplatte suchen, können Sie sie sicher löschen. – Highstead