2017-07-17 4 views
1

Ich arbeite an riesigen Excel-Blättern aus verschiedenen Quellen über die gleiche Sache. Die Art, wie die Quellen dies melden und Informationen aufschreiben, ist anders. So würde man zum Beispiel den Ort als "Khurais" schreiben, während der andere es als "Khorais" schreiben würde.übereinstimmende zwei Spalten in Excel mit geringfügigem Unterschied in der Rechtschreibung

Da beide Dateien wichtige Informationen enthalten, möchte ich sie in einem Excel-Blatt zusammenfassen, damit ich leichter mit ihnen umgehen kann. Wenn Sie also einen Vorschlag oder ein Tool haben, von dem Sie glauben, dass es von Vorteil wäre, teilen Sie es bitte hier mit.

Ps.s. Die Wörter in der Excel-Tabelle sind Übersetzungen arabischer Wörter.

+0

Warum die ursprünglichen arabischen dann nicht verwenden, das soll ich annehmen lassen. – Luuklag

Antwort

0

Sie FuzzyLookup verwenden könnte, ein Makro, das Sie eine geeignete Anpassung zu tun erlaubt. Es hat in der Vergangenheit sehr gut funktioniert und ist wirklich sehr gut dokumentiert.

FuzzyLookup

Sie können es hier finden: https://www.mrexcel.com/forum/excel-questions/195635-fuzzy-matching-new-version-plus-explanation.html einschließlich Beispiele, wie es zu benutzen.

Hoffe, dass hilft!

PS offensichtlich können Sie es auch stricly in VBA verwenden (nicht Arbeitsblatt Funktionen)

1

Sie könnten die Levenshtein-Distanz verwenden, um festzustellen, ob zwei Wörter "nahe beieinander" sind. Darauf basierend könnten Sie passen.

0

Die Doppel Metaphone Algorithmus springt mir in den Sinn. Es versucht, Zeichenfolgen in phonetische Darstellungen zu konvertieren. Zum Beispiel sollten "Folly" und "Pholee" denselben phonetischen Code haben.

Wenn Sie diese Codes generieren könnten, könnten Sie Ihre Datensätze basierend auf ihnen anstelle der Zeichenfolgen zuordnen.

Hier ist ein Artikel, der, zusammen mit Beispiel-VBA-Code erklärt: https://bytes.com/topic/access/insights/965241-fuzzy-string-matching-double-metaphone-algorithm

Hoffnung, das Sie inspiriert :)

Verwandte Themen