2017-05-04 3 views
0

Ich bin immer noch neu in der Programmierung (Python) und ein wenig überwältigt von der Aufgabe, eine Liste von etwa 40.000 Kontakten zu aktualisieren. Natürlich möchte ich das nicht manuell machen und versuche herauszufinden, wie ich die Aufgabe am besten automatisiere. Jeder Rat oder jede Hilfe, die in die richtige Richtung weisen, würde sehr geschätzt werden. Hier sind die Themen:Wie würden Sie sicherstellen, dass eine Liste von 40.000 Kontakten aktuell ist?

  1. Ich muss sicherstellen, dass die Informationen immer noch auf dem neuesten Stand (das heißt, dass die Person arbeitet immer noch an der gleichen Firma und/oder hat nicht seinen Job Titel geändert). Was wäre der beste Weg, dies zu tun? Parse LinkedIn? Versuchen Sie, ihre Facebook-Profile zu finden und hoffen Sie, dass sie offenlegen, wo sie arbeiten?
  2. Für einige Kontakte habe ich nur eine E-Mail und einen Firmennamen (vielleicht eine Berufsbezeichnung), aber nicht den Namen der Person. Gibt es eine Möglichkeit, den Vor- und Nachnamen mit den Informationen zu erhalten, die ich habe und wie würdest du es machen?

Antwort

0

Dies scheint wie eine unmögliche Aufgabe, da

1: die Informationen da draußen falsch sein könnte

2: Es gibt oft mehrere Personen mit dem gleichen Namen, so wie würden Sie sie

identifizieren

3: selbst wenn jemand bei einer Firma aufgehört hat, arbeitet sie Spuren haben diese Tatsache online und

4: Sie werden nicht in der Lage sein, jemand den Namen von ihren E-Mail-unle zu finden ss es ist buchstäblich eine Teilzeichenfolge ihres Namens, d. h. [email protected]

Wenn du irgendwo anfangen willst, würde ich sagen, arbeite mit dem E-Mail-Namen Parsing. Wenn Sie sich in Hardcore-Webcrawing verzweigen wollen, können Sie es versuchen, aber das wird keine kleine Aufgabe sein. Sie müssen eine andere Schnittstelle für jede Plattform erstellen und Sie werden eine Art von Logik benötigen, um frühere vs aktuelle zu finden, die nicht in einem schönen Format gespeichert werden können. Wenn Sie irgendwo an dieser Front starten wollen check out:

https://pypi.python.org/pypi/python-linkedin/4.0

und vielleicht Ihr Land Version schreien suche, 118 etc., die eine REST-api oder JSON-Schnittstelle

+0

Dank haben! Was, wenn ich eine E-Mail an die 40.000 Kontakte sende, um zu sehen, welche zurückspringen? Das könnte die Liste verkürzen und zeigen, welche Kontakte definitiv veraltet sind. Sie können davon ausgehen, dass, wenn eine E-Mail funktioniert, die Person dort immer noch an der gleichen Position oder in ähnlicher Position arbeitet. Ich könnte dann Daten von LinkedIn kratzen und Querverweis mit dem, was ich bereits habe. Ie., erhalten Sie Informationen über jeden, der für Acme Corp arbeitet und dann alle John Smiths, die dort arbeiten und die auf meiner Liste sind. Wahrscheinlichkeiten sind dort nicht so viele Übereinstimmungen, besonders wenn eine Person einen eindeutigen Vor- oder Nachnamen hat. – DinDinSem

+0

Ja, Sie könnten definitiv eine E-Mail an alle senden, aber Sie wollen sicherstellen, dass es kein Spam ist (wenn Sie so behandelt werden) könnte Probleme mit dem Antwortcode haben). Was Sie für Linkedin vorschlagen, ist, was ich in Erwägung gezogen habe. Auch hier wird es darum gehen, herauszufinden, wer Vergangenheit/Gegenwart ist, aber diese Informationen sind auf der Website. Denken Sie daran, dass große Unternehmen wahrscheinlich eine hohe Anzahl an Duplikaten haben, so dass Sie vielleicht testen möchten, ob die Beschäftigungsdauer der Person die Zeit umfasst, in der die Daten korrekt waren. – TLOwater

Verwandte Themen