0

Wie, die Positionen aller A's innerhalb eines .png zu finden, unabhängig von der Skala, aber alle richtig gedreht?Was ist eine gute Methode, um alle Vorkommen eines bestimmten Buchstabens in einem Bild zu finden?

Edit: Diejenigen, die darauf hingewiesen, dass dies ein schwierigeres Problem ist, als ich es mache, sind richtig. Ich wollte etwas Detail hinzufügen; Ich suche nach einem Weg, um entweder die Position eines Buchstabens von einem (schwarz-auf-weiß gescannten handschriftlichen Bild) zu finden oder ein Bild nur des Buchstabens zu geben, das A-ness davon zu finden (WRT eine bestimmte Schriftart) .

Ich weiß, dies ist ein großes Projekt, also habe ich mich gefragt, ob es Open-Source-Bibliotheken, die so etwas oder einen einfachen Algorithmus tun. Ich habe einige Ecken-Matching-Systeme ausprobiert, aber hatte kein Glück.

+0

Welche Schriftart? Anti-Alias-Zeichen? Farbig? Hintergrund? Subpixel-Glättung? Minimale und maximale Höhe in Pixeln? Wir brauchen mehr Informationen. Die richtige Wahl hängt von diesen Eigenschaften ab. Vielleicht würde ein einfaches Muster, das mit vordefinierten Referenzbuchstaben übereinstimmt, dies tun (nach Segmentierung und Normalisierung des Zielzeichens/-bildes). Oder Sie müssen geometrische Merkmale und nicht nur Pixelinformationen extrahieren. Man könnte eine Doktorarbeit über diese Probleme schreiben ... – Flinsch

+0

Die beste Methode ist immer noch die manuelle Suche. Nun, nicht genau manuell, ich meine mit deinen Augen. Es sei denn, sie sind Braille-Buchstaben. –

Antwort

0

Zuerst ist Ihre Frage in der Domäne der Computer Vision (nicht Bildverarbeitung, obwohl es so für den Uneingeweihten scheinen mag). Dann macht es einen großen Unterschied, ob das PNG-Bild ein Foto einer natürlichen Szene oder eines gescannten Dokuments ist. Bei natürlichen Bildern müssen Sie die Literatur in der Objekterkennung im Allgemeinen oder der Texterkennung im Besonderen überprüfen. Bei gescannten Dokumenten ist Ihr Bereich die Dokumentenanalyse (oder Dokumentenverarbeitung).

In jedem Fall denke ich, dass Ihr Problem wahrscheinlich lösbar ist, obwohl die Lösung weiter (in Aufwand und Zeit) sein kann, als Sie vielleicht beibehalten möchten.

+0

Ich habe meine Frage aktualisiert, ich befürchte, dass Sie Recht haben, weiter zu gehen, als ich möchte. –

+0

Nur aus Neugier: Warum sollte diese Frage nicht im Bereich der Bildverarbeitung liegen? Bilderkennung (auch Zeichenerkennung) und Bildsegmentierung sind sicher Teil der Bildverarbeitung ... Und alles zusammen gehören sie zum Bereich der Computer Vision, der weit mehr umfasst als das ... Das haben uns zumindest unsere Professoren gelehrt ... Aber fühlen Sie sich frei, mich zu korrigieren ... – evident

0

Nun eine sehr gute Möglichkeit, dies zu tun, ist eine NGC (Nicht-Graustufen-Korrelation) mit Ihrem 'A' als Modell zu verwenden. Das Problem ist, dass dies keine skaleninvariante Methode ist. Tatsächlich könnte diese Frage sehr kompliziert sein. Um die mehreren Skalen zu lösen, können Sie Modelle für jede Skala und jeden Loop erstellen (langsam).

+0

Ich glaube nicht, dass ich etwas größer als 64x64 px treffen werde, ich werde das untersuchen. Vielen Dank! –

Verwandte Themen