Ich habe Notizen über Lucene-Dateien gelesen, die auf 2-GB-Dokumente beschränkt sind. Gibt es zusätzliche Einschränkungen für die Größe von Dokumenten, die in Elasticsearch indiziert werden können?Was ist die maximale Elasticsearch Dokumentgröße?
16
A
Antwort
30
Lucene verwendet intern einen Byte-Puffer, der 32-Bit-Ganzzahlen für die Adressierung verwendet. Per Definition begrenzt dies die Größe der Dokumente. Also 2GB ist theoretisch maximal.
In Elasticsearch:
Es gibt eine max http request size
im ES GitHub-Code, und es wird gegen Integer.MAX_VALUE
oder 2^31-1
. Also, im Grunde, 2GB ist die maximale Dokumentgröße für Massenindizierung über HTTP. Darüber hinaus verarbeitet ES keine HTTP-Anforderung, bis sie abgeschlossen ist.
Good Practices:
- nicht einen sehr großen Java-Heap verwenden Sie, wenn Sie es vermeiden können: legen Sie es nur so groß wie nötig ist (im Idealfall nicht mehr als die Hälfte des RAM der Maschine) zu halten die maximale Größe des Arbeitssatzes für Ihre Verwendung von Elasticsearch. Dies lässt den verbleibenden (hoffentlich beträchtlichen) Arbeitsspeicher für das Betriebssystem für das IO-Caching übrig.
- Verwenden Sie auf der Clientseite immer die Bulk-API, die mehrere Dokumente in einer Anforderung indexiert, und experimentieren Sie mit der richtigen Anzahl von Dokumenten, die mit jeder Massenanforderung gesendet werden sollen. Die optimale Größe hängt von vielen Faktoren ab, aber versuchen Sie, in Richtung zu wenig und nicht zu vielen Dokumenten zu irren. Verwenden Sie gleichzeitige Massenanforderungen mit clientseitigen Threads oder separaten asynchronen Anforderungen.
Für weitere Studie beziehen sich auf diese Links gilt:
Verwandte Themen
- 1. Elasticsearch: Dokumentgröße und Abfrageleistung
- 2. Was ist maximale Entropie?
- 3. Was ist die maximale Verzögerung für setInterval?
- 4. Was ist die maximale Größe von Scripting.Dictionary?
- 5. Was ist die maximale Vererbungsebene in Java?
- 6. Was ist die maximale Länge einer Zeichenfolge?
- 7. Was ist die maximale Abfragegröße für mysql?
- 8. Was ist die maximale Speicherkapazität eines PLIST?
- 9. Was ist die maximale Anzahl von Verbindungen?
- 10. was die @param in Elasticsearch Massenladen ist
- 11. Wie mongodb BSON Dokumentgröße zu erhöhen
- 12. Größte Dokumentgröße in MongoDB finden
- 13. Was ist die maximale Länge einer Python-Zeichenfolge?
- 14. Was ist die maximale Länge einer Mongodb-Abfrage?
- 15. Was ist die maximale Größe einer ItemView in EWS?
- 16. Was ist die maximale Größe von int (10) in Mysql
- 17. Was ist die maximale Anzahl von nummerierten Regex-Captures?
- 18. Was ist die maximale Länge eines Zeichenfolgenparameters für gespeicherte Prozedur?
- 19. Was ist die maximale Länge von subprocess.Popen des Parameter args?
- 20. Was ist die maximale Grenze für Nachrichten in WCF?
- 21. Was ist die maximale Größe für eine Zeichenfolge in C#?
- 22. Was ist die maximale Genauigkeit des Timers in .NET?
- 23. Was ist die maximale Länge eines Windows-Befehlszeilenbefehls (cmd.exe)?
- 24. Was ist die maximale Texturgröße auf dem iPad?
- 25. Was ist die maximale Größe eines Primärschlüssels in Firebird?
- 26. Was ist die maximale URL-Länge des Apache?
- 27. Was ist die maximale Länge eines Strings in PHP?
- 28. Was ist die maximale Länge von Breite und Länge?
- 29. Was ist die maximale Größe der Volley-Bibliothek Request-Queue
- 30. Was ist die maximale Größe für ein int in PHP?
Für maximale HTTP-Request-Größe finden Sie unter: https://github.com/elastic/elasticsearch /blob/148265bd164cd5a614cd020fb480d5974f523d81/docs/reference/modules/http.asciidoc – vvs14