Das Tensorflow-Textzusammenfassungsmodell, wie hier beschrieben https://github.com/tensorflow/models/tree/master/textsum erfordert eine Multi-GPU-Architektur, um zu trainieren. Meine wiederholten Versuche, das Modell zu trainieren, führten zu Speicherausfällen, Maschinenausfällen aus verschiedenen Gründen. Ist das trainierte Zusammenfassungsmodell verfügbar, so dass das Zusammenfassungsmodell ohne Schulungsbedarf genutzt werden kann? Das Zusammenfassungsmodell wird mit dem nicht freien Gigaword-Datensatz trainiert, wenn das trainierte Modell nicht von Google verfügbar ist. Ist dies ein Grund warum?Verwenden Sie das Zusammenfassungsmodell ohne Schulung
Antwort
Also soweit ich das beurteilen kann, hat niemand das trainierte Modell da draußen angegeben, auf das verwiesen wird. Ich hatte auch Probleme mit dem Speicher meines MacBook Pro und kam schließlich mit meinem Gaming-Laptop, der eine viel bessere GPU hatte.
Die andere Option ist natürlich, AWS zu nutzen und etwas wie ihre g2.2xlarge-Instanz zu verwenden. Sie haben auch ihre P2-Instanzen, aber ich habe das noch nicht überprüft.
In Bezug auf den Gigaword-Datensatz geht es einfach um die Lizenzierung. Es ist keine freie Lizenz von LDC, und oft haben viele der Wissenschaftler, die daran arbeiten, den Datensatz über ihre Universitäten oder Firmen zur Verfügung gestellt. Ich hatte kein Glück, es zu finden, aber LDC kam zu mir und wies darauf hin, dass sie andere Artikel-Datensätze haben, die einen Preis von etwa $ 300 haben, der viel vernünftiger für diejenigen ist, die nur versuchen, TF zu lernen. Das heißt, wenn Sie nichts kaufen wollten, können Sie immer Ihren eigenen Page Scraper schreiben und die Daten für das Textum-Modell formatieren. https://github.com/tensorflow/models/pull/379/files
Hoffe das hilft einige. Viel Glück!
- 1. Visual Studio 2008 Schulung
- 2. Verwenden Sie das Klassenobjekt als Zeichenfolge, ohne str() zu verwenden
- 3. Speicherverlust in TensorFlow Google Cloud ML-Schulung
- 4. Schulung LUIS, um eine Jobticketnummer zu erkennen
- 5. Schulung vor Ort mit ML Motor & gcloud
- 6. Verwenden Sie Rohr ohne das erste Argument zu führen
- 7. Verwenden Sie matplollib.pyplot, ohne das Grafikfenster zu öffnen
- 8. So verwenden Sie Symfony-Methoden Aktion ohne das Wort "Aktion"
- 9. Verwenden Sie können verschlüsseln ohne Kontrolle über das Stammverzeichnis
- 10. Verwenden Sie eine Thymeleaf-Vorlage ohne das Fragmentdefinitionselement?
- 11. Verwenden Sie Zend Framework-Komponenten ohne das eigentliche Framework?
- 12. Definieren Sie Klassen ohne das Klassenschlüsselwort in Typoskript zu verwenden
- 13. Verwenden Sie Recaptcha ohne unsafeWindow?
- 14. Verwenden Sie Guardian ohne Modell
- 15. Kann ich das Typoskript ohne requireJS verwenden?
- 16. Verwenden Sie log4net ohne web.config
- 17. Verwenden Sie HVite ohne Vokabular
- 18. Verwenden Sie Composer ohne Packagist
- 19. Verwenden Sie mod_jk ohne Tomcat
- 20. Verwenden Sie Jenkins ohne Versionskontrollsysteme
- 21. Verwenden Sie das Animationspaket
- 22. UICollectionVIEW ohne das Storyboard zu verwenden?
- 23. Effektive Art der Schulung des Bot, Sprachverarbeitung APIs
- 24. Verwenden Sie ASP.NET Core ohne MVC
- 25. Bootstrap - Verwenden Sie vertikalen Raum ohne Mauerwerk
- 26. Scala wie Standardeinstellungen zu verwenden, ohne sie
- 27. Verwenden Sie GCM/Firebase ohne Clientside SDK
- 28. How to: Verwenden Sie EJS ohne Express
- 29. So erkennen Sie das Tastendruckereignis und das Tastenherunterhalteereignis, ohne pygame zu verwenden
- 30. Geben Sie das Datum ein, ohne das Oszilloskop oder den Controller zu verwenden.