2017-05-15 1 views
0

Ich möchte 1000 Zeilen aus einer HBase Tabelle abzurufen, sind rowkeys wie folgt angeordnet:HBase Charge erhalten vs Scan

row1: 1000|0001 
... 
row1000: 1000|1000 

Meine Frage ist, wäre es besser, eine Reihe Scan von 1000|0001 zu 1000|1000 zur Ausgabe von oder geben Sie für jede Zeile einen get aus und senden Sie sie als Stapel?

Zeilen befinden sich wahrscheinlich auf demselben Regionsserver.

Antwort

0

Für diesen Anwendungsfall würde ich vorschlagen, mit Bereichsscan zu gehen, indem Sie den Start- und den Endzeilenschlüssel angeben.

Da es für HBase einfach wäre, den Startschlüssel zu finden und alle Datensätze bis zum Ende-Schlüssel zu erhalten (End-Key wird exklusiv, also in Ihrem Fall ist der EndKey 1000 | 1001) in einer einzigen Scan-Anfrage an Region Server.

1

Scannen, Hände nach unten. Multi-Get ist wirklich für nicht zusammenhängende Daten da.

Verwandte Themen