Wie funktioniert die Leistungsoptimierung der Batchverarbeitung mit max_batch_size, batch_timeout_micros, num_batch_threads und anderen Parametern? Versucht, diese Parameter mit dem Query-Client zu verwenden, funktioniert es nicht.Tensorflow Serving Batching-Parameter
Im folgenden Beispiel habe ich 100 Bilder und ich möchte in der Größe von 10 Stapel. Die Abfrage läuft für alle Bilder anstelle von 10. bazel-bin/tensorflow_serving/Beispiel/demo_batch --server = localhost: 9000 - -max_batch_size = 10
Auch für die Batch-Planung, wie es alle 10 Sekunden nach dem ersten Batch ausgeführt werden? Vielen Dank.