2016-10-06 5 views
0

Das Tensorflow-Textzusammenfassungsmodell, wie hier beschrieben https://github.com/tensorflow/models/tree/master/textsum erfordert eine Multi-GPU-Architektur, um zu trainieren. Meine wiederholten Versuche, das Modell zu trainieren, führten zu Speicherausfällen, Maschinenausfällen aus verschiedenen Gründen. Ist das trainierte Zusammenfassungsmodell verfügbar, so dass das Zusammenfassungsmodell ohne Schulungsbedarf genutzt werden kann? Das Zusammenfassungsmodell wird mit dem nicht freien Gigaword-Datensatz trainiert, wenn das trainierte Modell nicht von Google verfügbar ist. Ist dies ein Grund warum?Verwenden Sie das Zusammenfassungsmodell ohne Schulung

Antwort

0

Also soweit ich das beurteilen kann, hat niemand das trainierte Modell da draußen angegeben, auf das verwiesen wird. Ich hatte auch Probleme mit dem Speicher meines MacBook Pro und kam schließlich mit meinem Gaming-Laptop, der eine viel bessere GPU hatte.

Die andere Option ist natürlich, AWS zu nutzen und etwas wie ihre g2.2xlarge-Instanz zu verwenden. Sie haben auch ihre P2-Instanzen, aber ich habe das noch nicht überprüft.

In Bezug auf den Gigaword-Datensatz geht es einfach um die Lizenzierung. Es ist keine freie Lizenz von LDC, und oft haben viele der Wissenschaftler, die daran arbeiten, den Datensatz über ihre Universitäten oder Firmen zur Verfügung gestellt. Ich hatte kein Glück, es zu finden, aber LDC kam zu mir und wies darauf hin, dass sie andere Artikel-Datensätze haben, die einen Preis von etwa $ 300 haben, der viel vernünftiger für diejenigen ist, die nur versuchen, TF zu lernen. Das heißt, wenn Sie nichts kaufen wollten, können Sie immer Ihren eigenen Page Scraper schreiben und die Daten für das Textum-Modell formatieren. https://github.com/tensorflow/models/pull/379/files

Hoffe das hilft einige. Viel Glück!

Verwandte Themen