Ich verwende Tensorflow in Android. Ich habe die apk für TFClassify zur Verfügung gestellt. Ich lief die Anwendung und es läuft schnell mit Inferenzzeit von nicht mehr als 400ms. Wenn ich jedoch das verfügbare trainierte Modell durch mein Modell ersetze, dauert es ungefähr 2000 ms für die Berechnung, bevor das Ergebnis angezeigt wird. Warum gibt es so einen Unterschied und wie kann ich meine umtrainierte_graph.pb optimieren?Wie zu verbessern Rechenzeit in Tensorflow
0
A
Antwort
0
Dies ist die am besten geeignete Lösung, die ich über bekam:
Codelabs Tensorflow for poets 2
Einige helfen auch durch diese Gruppendiskussion Seite getroffen werden können. die Folgerung Zeit von wenigen ms
Reduce the TensorFlow Model (using tf.contrib.learn API) computation time
0
Haben Sie das umgeschulte Modell in einen optimierten & quantisierten Graphen umgewandelt?
Wenn nicht versuchen:
tensorflow/bazel-bin/tensorflow/python/tools/optimize_for_inference \
--input=retrained_graph.pb \
--output=optimized_graph.pb \
--input_names=Mul \
--output_names=final_result
tensorflow/bazel-bin/tensorflow/tools/quantization/quantize_graph \
--input=optimized_graph.pb \
--output=rounded_graph.pb \
--output_node_names=final_result \
--mode=weights_rounded
FYI, müssen Sie zunächst diese Werkzeuge bauen.
Verwandte Themen
- 1. Rechenzeit! =
- 2. Wie Rechenzeit über Datatable Fußzeile
- 3. Wie bekomme ich Rechenzeit in NDK?
- 4. Rechenzeit in Sekunden mit Bash
- 5. Rechenzeit mit Zeitstempel
- 6. Reduzieren Rechenzeit in Spark-Anwendung
- 7. Rechenzeit der Simulation in Java
- 8. Rechenzeit von Komplexitätsklassen
- 9. Python3 Rechenzeit mit Datetime?
- 10. C++/Qt - Rechenzeit
- 11. Wie kann Drop Out in Tensorflow angewendet werden, um die Genauigkeit des neuronalen Netzwerks zu verbessern?
- 12. QlikView RangeSum Funktion Rechenzeit
- 13. Wie HBase Scanner zu verbessern?
- 14. Wie zu Argsort in Tensorflow?
- 15. Verbessern der Genauigkeit eines Tensorflow neuronalen netz- Python
- 16. php - wie Code mit OOP zu verbessern
- 17. Wie Planung zu verbessern und Latenz
- 18. Rede zu Text mit TensorFlow
- 19. Wie PHP für die Schleife zu verbessern?
- 20. wie zu verbessern Opencart Erweiterung Bewertung
- 21. Android: Rechenzeit weg von der App
- 22. Wie schnell Eigenschaften in einem Dict in Python zu verbessern?
- 23. Tensorflow - Wie Saver zu manipulieren
- 24. Höhere Ordnungsfunktionen in TensorFlow - Wie zu verwenden?
- 25. Wie effektiv tf.bucket_by_sequence_length in Tensorflow zu verwenden?
- 26. Wie tf.nn.embedding_lookup_sparse in TensorFlow zu verwenden?
- 27. Hausaufgaben - Big O Notation und Rechenzeit
- 28. wie MySQL Abfrage verbessern?
- 29. Schnellere Rechenzeit mit Python und Sklearn
- 30. Möglichkeiten, diesen Code zu verbessern
I optimiert und quantisiert die Grafik und es verbessert. Die Inferenzzeit ist nun auf 1800ms reduziert, aber immer noch sehr viel mehr als beim ursprünglichen Modell (400ms). Gibt es noch weitere Möglichkeiten zur Verbesserung? Die Größe meines Modells ist 87,1 MB –
Zunächst spielt die Größe der Grafikdatei keine Rolle. Quantisierte Graphen können komprimiert werden, wenn sie in .APK gepackt sind. Zweitens möchte ich auch wissen, wie man die Inferenzleistung auf Android verbessern kann. Ich habe noch nicht versucht, aber http://stackoverflow.com/questions/43585773/how-to-pass-optimization-flags-to-bazel-build-for-tensorflow (Build mit Makefile) ist der einzige Anhaltspunkt Ich konnte so weit finden. –