2017-08-05 1 views
0

Ich möchte Aufmerksamkeit ocr Modell bei http://download.tensorflow.org/models/attention_ocr_2017_05_17.tar.gz mit Synth 90k Test-Set zu bewerten. Das Problem ist, dass die Auswertung sehr schlechte Ergebnisse liefert, nur 0,1 Zeichen Genauigkeit wird berichtet. Es scheint, dass für jedes Eingangsbild Modellausgabe etwas FSN-Datensatz verwandt ist:tensorflow Aufmerksamkeit ocr auf synth90k Datensatz

Hier ist eine Liste von Eingangs- und Ausgangswerte, wenn eval.py Skript mit diesem Befehl:

python eval.py --split_name test --train_log_dir attention_ocr_2017_05_17 --dataset_name synth90k --num_batches 10 
  • anklagen: Rue du Chauzou
  • Verlockungen: Rue le le le le le Tetuint lau ...
  • slinking: Rue de la Ruère
  • ...

Hier sind einige Details der Implementierung:

Ich habe mit 10 Beispielen aus Synth 90k Testuntergruppe erstellt tfrecord. Außerdem habe ich die Datei charset_synth90k.txt erstellt, die Zeichenkodierungen enthält (gleicher Inhalt wie fsns charset_size = 134.txt).

Das ist meine synth90k.py-Datensatz-Datei (einschließlich nur geänderte Zeilen):

DEFAULT_DATASET_DIR = os.path.join (os.path.dirname (Datei), 'synth90k')

=

default_config {

'name': 'synth90k',

'spaltet': {

'test': { 
     'size': 10, 
     'pattern': 'synth90k_test*.tfrecord' 
    } 

},

'charset_filename': 'charset_synth90k.txt',

'image_shape': (31, 200, 3),

'num_of_views': 1,

'max_sequence_length': 37,

'null_code': 133,

...

}

Antwort

2

Die Aufmerksamkeit OCR-Modell wurde nur FSN Zug Dataset trainiert und es wird nur für Bilder arbeiten, die auf französisch Straßennamen mehr oder weniger ähnlich aussehen. Um es auf Bilder aus einer anderen Distribution anzuwenden, müssen Sie es mithilfe von Bildern aus dieser Distribution umlernen (oder zumindest verfeinern).

Verwandte Themen