Gibt es eine Bibliothek, die postalische Adressen analysiert (idealerweise global, aber mindestens US) und sie in einem normalisierten Format speichert, um zu überprüfen, ob es sich bei einer Adresse um eine Wohnung oder ein freistehendes Haus handelt ?Postadressen normalisieren, um Wohnungstypen zu unterscheiden
Antwort
In Großbritannien kann eine einzige Postleitzahl mehrere Adressen abdecken, von denen einige freistehende Häuser sein können und einige Wohnungen sein können.
Wenn Sie die vollständige Adresse haben und sich die Immobilie in England und Wales befindet und die Immobilie seit 1995 verkauft wurde, können Sie sie im offenen Paid-Datensatz des Grundbuchs nachsehen, der eine Flagge enthält, die angibt, ob die Immobilie ist freistehend, Reihenhaus, angebaut, oder Wohnung (Wohnung):
In den USA Sie einen Dienst verwenden können, dass die USPS Daten mit einer Adresse verbunden kehrt zurück. Zum Beispiel hat SmartyStreets (Disclaimer: Ich arbeite für sie) eine US Street API, die eine Adresse als Eingabe nimmt und dann viele Informationen über diese Adresse ausgibt, einschließlich des Datensatztyps. Der Datensatztyp teilt Ihnen mit, ob es sich bei der Adresse um ein freistehendes Haus oder um einen Wohnungstyp-Komplex (Hochhaus) handelt. Siehe weitere Informationen here.
Ebenfalls relevant ist this similar question
- 1. Regex, um Themenlinks im Diskursforum zu normalisieren
- 2. Normalisieren Unicode
- 3. taskkill, um 2 Bilder nach Pfad zu unterscheiden
- 4. MSBuild: Wie überschreibt Ausgabedateiname, um sich von Assemblyname zu unterscheiden?
- 5. $ templateCache überschreiben, um zwischen Groß- und Kleinschreibung zu unterscheiden
- 6. Legende zum Streudiagramm hinzufügen, um Farben zu unterscheiden?
- 7. Normalisieren von Daten zu [-1, 1] Bereich
- 8. Was bedeutet es, einen Wert zu normalisieren?
- 9. NumPy: Wie schnell viele Vektoren zu normalisieren?
- 10. Wie zu normalisieren OpenCV Sobel Filter Kernelgröße
- 11. Normalisieren Dateipfad mit WinAPI
- 12. Normalisieren Zeilenenden in Ruby
- 13. normalisieren Datum deprecated Zeitklasse
- 14. Python, benutzerdefinierte Ausnahmen zu unterscheiden
- 15. Wie zu unterscheiden Interface-Erweiterung
- 16. Verwendung von before_create in Rails, um eine viele zu viele Tabelle zu normalisieren
- 17. In Python analysieren: Was ist der effizienteste Weg, um Strings zu unterdrücken/zu normalisieren?
- 18. pandas: Einen Datenrahmen normalisieren
- 19. Schienen normalisieren csv-Dateidaten
- 20. Normalisieren einer Variablen data.table
- 21. Normalisieren Sie einen Vektor?
- 22. Normalisieren Datensatz mit Rubin
- 23. Normalisieren auf verschiedene Datenbanken?
- 24. Normalisieren von ASCII-Zeichen
- 25. NAudio Normalisieren Audio
- 26. Normalisieren arabischen Text mysql
- 27. R normalisieren einen Datensatz
- 28. XML Elemente normalisieren
- 29. Normalisieren Verzeichnisnamen in C#
- 30. PHP - Normalisieren Benutzereingabe Array
unwahrscheinlich scheint, können einige Eigentumswohnungen haben die gleiche Hausnummer, mit jedem Hause eine andere „Hausnummer“ ist, was unmöglich wäre, aus einer Wohnung in einem Gebäude zu unterscheiden. Um die Adresse zu "normalisieren", könnten Sie versuchen, Apples CLGeocoder-Klasse zu verwenden. – EmilioPelaez
Natürlich ist das aber ein Teil der Adresse wie APT 1 oder UNIT 1 also sollte es noch möglich sein zu normalisieren. Recht? z.B. so etwas wie https://pypi.python.org/pypi/postal-address – user393144
Dieses Modul kann alle Adresskomponenten, Eigenschaften und Untereigenschaft (wie Wohnung) Identifikatoren trennen. https://github.com/kimryan/Lingua-EN-AddressParse –