Ich habe eine Menge Avro-Dateien mit IPs (Weblogs) in Azure Blobs gespeichert. Ich möchte die IP zu Standort zuordnen. Wie macht man das mit Azure Data Lake Analytics (ADLA)?Map IP zu Location mit Azure Data Lake Analytics
Im Moment habe ich einen Spark-Job, der die Maxmind IP-Datenbank mit einer Java-Bibliothek verwendet, die eine 113MB große .mmdb-Datei mit allen IP-Standortdaten liest, um diese Suche durchzuführen. Ich untersuche jetzt, ob es möglich ist, diesen Job zu ADLA zu verschieben
Maxmind stellt auch eine C# -Bibliothek zur Verfügung, so dass dieser Teil kein Problem darstellt. Allerdings ist es für mich nicht offensichtlich, wie man mit dieser großen mmdb-Datei umgeht, die gelesen und dann für die Suche verwendet werden muss. Offensichtlich wäre es nicht schnell, die Datei für jede IP-Suche zu lesen. Wie kann dies (und ähnliche Fälle) mit ADLA gehandhabt werden, oder ist ADLA für diese Art von Operationen ungeeignet?
Wenn ich ein normales Programm ausgeführt hätte, würde ich die Nachschlag wie folgt tun:
using (var reader = new Reader("GeoIP2-City.mmdb"))
{
foreach(var ip in ips)
{
var data = reader.Find<Dictionary<string, object>>(ip);
...
}
}
Die MaxMind db finden Sie hier: https://dev.maxmind.com/geoip/geoip2/downloadable/ (beachten Sie, dass ich die Datenbank Im derzeit gekauft haben, verwenden) und C# Bibliothek es hier zu lesen: https://github.com/maxmind/MaxMind-DB-Reader-dotnet
Ehrlich gesagt klingt das wie eine einfache Datenbankoperation - Join, aka Lookup, aber ich weiß nichts über die Maxmind-Daten. Kannst du uns mehr erzählen? Haben Sie beispielsweise die Datei bezahlt und heruntergeladen? – wBob
Die Antwort wurde ein wenig erweitert mit der Verwendung der Datenbank in einem "normalen" Befehlszeilenprogramm. – viblo
Haben Sie erwogen, die ADLA-Tabelle zum Speichern der großen Datei zu verwenden und dann wie eine Nachschlagetabelle zu verwenden? Sie können Ihre Eingabedatei direkt mit der ADLA-Tabelle verknüpfen, basierend auf der IP (vorausgesetzt, sie haben das gleiche Format), ähnlich wie bei der Suche mit natürlichen Schlüsseln. – jatal