Ich möchte Aufmerksamkeit ocr Modell bei http://download.tensorflow.org/models/attention_ocr_2017_05_17.tar.gz mit Synth 90k Test-Set zu bewerten. Das Problem ist, dass die Auswertung sehr schlechte Ergebnisse liefert, nur 0,1 Zeichen Genauigkeit wird berichtet. Es scheint, dass für jedes Eingangsbild Modellausgabe etwas FSN-Datensatz verwandt ist:tensorflow Aufmerksamkeit ocr auf synth90k Datensatz
Hier ist eine Liste von Eingangs- und Ausgangswerte, wenn eval.py Skript mit diesem Befehl:
python eval.py --split_name test --train_log_dir attention_ocr_2017_05_17 --dataset_name synth90k --num_batches 10
- anklagen: Rue du Chauzou
- Verlockungen: Rue le le le le le Tetuint lau ...
- slinking: Rue de la Ruère
- ...
Hier sind einige Details der Implementierung:
Ich habe mit 10 Beispielen aus Synth 90k Testuntergruppe erstellt tfrecord. Außerdem habe ich die Datei charset_synth90k.txt erstellt, die Zeichenkodierungen enthält (gleicher Inhalt wie fsns charset_size = 134.txt).
Das ist meine synth90k.py-Datensatz-Datei (einschließlich nur geänderte Zeilen):
DEFAULT_DATASET_DIR = os.path.join (os.path.dirname (Datei), 'synth90k')
=default_config {
'name': 'synth90k',
'spaltet': {
'test': { 'size': 10, 'pattern': 'synth90k_test*.tfrecord' }
},
'charset_filename': 'charset_synth90k.txt',
'image_shape': (31, 200, 3),
'num_of_views': 1,
'max_sequence_length': 37,
'null_code': 133,
...
}