Ich versuche, 20k-Dateien in eine HBase-Tabelle zu laden. Die durchschnittliche Dateigröße beträgt 400 KB. Einige der Dateien sind jedoch so groß wie 70 MB. Die Gesamtgröße aller Dateien zusammen ist 11 GB. Der Ansatz ist Standard und gibt Schlüsselwertpaare nach einem Aufruf von loadIncremenalFiles aus. Wenn ich den Code für eine zufällige Stichprobe von 10 Dateien ausführen, funktioniert alles. Ich stellte fest, dass die Größe der generierten hfiles das 1,3-fache der Größe der Dateien selbst betrug. Wenn ich jedoch den gleichen Code für alle 20k-Dateien ausführen, bekomme ich hfiles, die zusammen 400GB groß sind. 36 mal so groß wie die Daten selbst. HFiles enthalten Indizes und Metadaten zusätzlich zu den Tabellendaten, aber was kann solch eine dramatische Größenzunahme erklären?Seltsames Verhalten in HBase-Massenlast
1
A
Antwort
1
Ich entdeckte den Grund hinter dem dramatischen Anstieg des Weltraums.
Dies ist, was meine Mapper aussendende Schlüsselwertpaare aussahen (Eingabe war eine Sequenzdatei).
public void map(Text key, BytesWritable value, Context context)
....
byte[] row = Bytes.toBytes(rowID);
hKey.set(row);
kv=getKV(familyRaw, Bytes.toBytes("content"), value.getBytes());
Das Problem ist in dem Aufruf value.getBytes()
. Es gibt ein Byte-Array zurück, das mit Nullen aufgefüllt ist. Ändern Sie es zu value.copyBytes()
das Verhalten behoben.
Dies wird in HADOOP-6298
diskutiertVerwandte Themen
- 1. Seltsames Verhalten
- 2. Seltsames Verhalten in GHCi
- 3. Seltsames Verhalten in EditText
- 4. Seltsames Verhalten in Java
- 5. Seltsames FormArray Verhalten in Angular2
- 6. Seltsames Pager-Verhalten in ListView
- 7. Seltsames Verhalten mit NOT IN
- 8. AnTLR4 seltsames Verhalten in Vorrang
- 9. für In-Loop seltsames Verhalten
- 10. UILabel in UIScrollview seltsames Verhalten
- 11. Seltsames Float-Verhalten in IE7
- 12. Seltsames Verhalten in HTML Seite
- 13. Seltsames Verhalten in IIS-Bindungen
- 14. Seltsames Debugger-Verhalten in VB.net
- 15. Seltsames RAM-Verhalten in Kingfisher
- 16. Seltsames stdout Verhalten in C++
- 17. Seltsames Verhalten in Javascript-Funktion
- 18. Seltsames Verhalten in Nebula CDateTime
- 19. Seltsames Timing-Verhalten in Javascript
- 20. appendChild seltsames Verhalten in Javascript
- 21. LinqToSql seltsames Verhalten
- 22. AngularJS Suchfilter seltsames Verhalten
- 23. Pandas HDFStore seltsames Verhalten
- 24. $ http.post seltsames Verhalten
- 25. Seltsames Verhalten mit Programmfolge
- 26. Seltsames Verhalten bei 8
- 27. iOS YTPlayerView Seltsames Verhalten
- 28. std :: stringstream seltsames Verhalten
- 29. Angular berechnen seltsames Verhalten
- 30. Seltsames Verhalten mit Microsoft.WindowsCE.Forms