ich einen Python-Skript geschrieben Apache-Logs zu analysieren und speichern sie in mongodb in folgendem Format:Wie ein Dokument vorhandenes Dokument in mongodb anhängen
{
"_id": ObjectId("589e77cf74eea90879f49c80"),
"http_version": "HTTP/1.1",
"time": ISODate("2017-02-11T02:32:46Z"),
"server_ip": "x.x.x.x",
"method": "GET",
"content_length": 529,
"referral": "-",
"uri": "/xxxxxxx.sdsd",
"agent": "Mozilla/5.00 (Nikto/2.1.5) (Evasions:None) (Test:map_codes)",
"status_code": 404
}
Ich brauche die Zählung von 404, 200 zu finden und 302 Anfragen pro IP-Adresse. Ich habe ein weiteres Skript geschrieben, um die Werte zu holen und in einem Wörterbuch zu speichern. Das Skript dauert jedoch 2 Minuten, um die Ergebnisse abzurufen.
Muss ich meine Python-Codelogik ändern oder Soll ich die Art ändern, wie ich die Daten in MongoDB speichere?
Jede Hilfe wird sehr geschätzt.
Das funktionierte wie ein Zauber. Es war 3 Minuten vorher. Jetzt dauert es 50 Sekunden, um alle Daten zu holen. – vijay
50 Sekunden ist immer noch sehr langsam für so eine grundlegende Abfrage stellen Sie sicher, meine Antwort zu überprüfen. – leonziyo
Ich habe 400K Dokumente in einer einzigen Sammlung. – vijay