SideInput ist eine Art Broadcasting in Spark, das bedeutet, dass Sie Daten auf einem lokalen Worker-Computer zwischenspeichern, um die Netzwerk-/Shuffle-Overhead zu reduzieren. Es ist logisch zu denken, wie viel Speicher in einem Heap gespeichert werden kann. In Dataflow documentation heißt es Limit ist 20K shard. Was bedeutet das? Wie groß ist eine Scherbe?Cloud Datenfluss/Beam: Side Input Limit
0
A
Antwort
1
Um Ihre ursprüngliche Frage zu beantworten, können Sie die von einem Dataflow-Worker über die Option --workerCacheSizeMb
in der Befehlszeile vorgenommene In-Memory-Zwischenspeicherung konfigurieren, die setWorkerCacheSizeMb
ist, wenn Sie eine Pipeline programmgesteuert aufrufen. Der Standardwert ist 100 MB.
Verwandte Themen
- 1. Schreiben in BigQuery aus Cloud Dataflow: Ich kann keine Side-Input-Ansicht von Eingabe erstellen
- 2. Limit of Bulk Firebase Cloud Messaging
- 3. Google Cloud Translate API - "Tägliches Limit überschritten"
- 4. Activity Side-by-Side-Lebenszyklus
- 5. R Side-by-Side Boxplot
- 6. Mercurial Side-by-Side-Konfiguration ist falsch
- 7. Google Cloud Vision api 10 Limit-Ergebnisse (NodeJS)
- 8. Cloud Code Parse Limit 1000 mit Verkettung überwunden?
- 9. CSS - Responsive Side-by-Side Bilder
- 10. Side-by-Side Balkendiagramme mit konsistentem Farbschema
- 11. Erstellen eines Side-by-Side-Balkendiagramms
- 12. Server Side Checkout vs Agent Side Checkout
- 13. Fenster im Side-by-Side-Modus finden
- 14. Side-by-Side-Konfigurationsfehler (Microsoft.VC80.CRT v8.0.50608.0)
- 15. Side by Side Display von zwei Sektionen
- 16. Side-by-Side Boxplots mit Pandas
- 17. Side-by-Side-Barplot mit ggplot
- 18. R Shiny: Side by Side Checkbox
- 19. TortoiseSVN Side-by-Side-Konfiguration ist falsch
- 20. COM-Interop-Side-by-Side-Assemblies
- 21. Side Slidebar in Angularjs
- 22. Side-by-Side-Ausführung und MS Einheit Test
- 23. Side-by-Side Konfigurationsfehler, Referenz kann nicht aufgelöst werden mscorlib
- 24. VBA Line Input vs. Input
- 25. KeyError: u'x-Rate-Limit-Limit '
- 26. WPF Custom Control für Side-by-Side-Layout
- 27. HTML Ärger Schwimmdock Zwei Bilder Side-By-Side
- 28. .NET4: In-Prozess Side-by-Side-Ausführung erklärt
- 29. Side-by-Side-Balken können nicht erstellt werden
- 30. Ausgang Venn GLIST Objekt und Netzwerk-Plot side-by-side
Ist es möglich, eine externe Festplatte mithilfe der Instanzvorlage in Computing mit Dataflow zuzuweisen? Auch eine von Ihnen erwähnte Option scheint nirgendwo dokumentiert zu sein. – Mayumi