-3

Meine Aufgabe: Ich muss Faltungs neuronalen Netzwerk zu erkennen Kfz-Kennzeichen erkennen.Training Faltungs neuronalen Netzwerk zu erkennen Auto Kennzeichen

Input: Bild (Array von Pixeln (i kann es normalisieren))

Output: Informationen über Position des Nummernschilds.

Fragen:

1) Welche Form am besten ist, um ein Ergebnis zu bekommen? Zum Beispiel: wenn ich Ziffern erkennen will, verwende ich einen Vektor mit 10 Elementen, deren Werte die Wahrscheinlichkeit der entsprechenden Ziffer enthalten. Aber ich weiß nicht, welches Ausgabeformular in meinem Fall verwendet wird.

2) Welche Größe ist geeigneter für Eingabebilder?

3) Dieses Problem hängt mit dem ersten zusammen. Wie kann ich meinen Trainingsdatensatz erstellen? Meine Varianten: Maske der Bits, wobei 1 bedeutet, dass hier ein Pixel des Nummernschilds ist, und JSON Beschreibung der Platte rect (x, y, Breite, Höhe). Und welches Programm kann ich zum Mapping verwenden?

Es tut mir leid, wenn meine Fragen an Sie scheinen zu dumm :)

+0

Willkommen bei StackOverflow. Bitte lesen und befolgen Sie die Buchungsrichtlinien in der Hilfe. [zum Thema] (http://stackoverflow.com/help/on-topic) und [how to ask] (http://stackoverflow.com/help/how-to-ask) gilt hier. – Prune

Antwort

1

es mir nicht klar ist, wenn Sie Auto Platte erkannt werden soll oder die Autoplatte Ziffern zu erkennen. Um Sie in beiden Fällen zu beantworten, hängt alles von Ihrem Datensatz ab.

  1. , wenn Ihre Daten-Set enthalten Bilder von Autos in verschiedener Position mit verschiedenen Größen

    • , wenn Ihre Aufgabe ist die Platte so Ihre Aufgabe zu erkennen ist, das System zu trainieren, zu erkennen, ob es Autoplatte ist in das Bild und lokalisieren Sie es durch Segmentierung, Aufmerksamkeit, Pix Standort Regression, was auch immer ist die Prozedur, die Sie anwenden möchten.

    • Wenn Ihre Aufgabe darin besteht, die Ziffern zu erkennen, dann sollten Sie zuerst die Plattenerkennung anwenden, dann entweder die Ziffernerkennung durch sequenzielles Anwenden Ihrer Eingabe oder durch Segmentierung der Ziffern vor der Erkennung anwenden.

  2. wenn Ihr Dataset die Ziffern enthalten, dann müssen Sie nur Ihr Modell anzuwenden, um die Ziffern zu erkennen, indem jedes Modell wählen Sie bevorzugen.

Ich würde empfehlen Sie einige der Forschung zu tun, zuerst zu verstehen, was Sie tun werden und was die Menschen getan haben, bevor Sie Ihren stat der Technik zu definieren, da ich aus Ihrer Frage sehen das Problem für sehr verschwimmen Sie.

Verwandte Themen