2010-06-15 8 views
7

Viele Jobseiten haben gebrochene Suchen, die Sie Jobs nach Erfahrungsniveau nicht einschränken lassen. Selbst wenn sie es tun, ist es normalerweise falsch. Dies erfordert, dass Sie durch Hunderte von Postings waten, die Sie nicht beantragen können, bevor Sie einen relevanten finden, ziemlich mühsam. Da ich mich lieber auf das Schreiben von Anschreiben usw. konzentrieren möchte, möchte ich ein Programm schreiben, um eine große Anzahl von Postings zu durchsuchen und die URLs nur der Jobs zu speichern, die keine jahrelange Erfahrung erfordern.Online-Jobsuche ist mühsam. Helfen Sie mir, es zu automatisieren

Ich brauche keine Hilfe beim Schreiben des Scraper, um die HTML-Stellen von möglicherweise relevanten Stellen zu erhalten. Das Problem besteht darin, genau festzustellen, welche Erfahrung für den Job erforderlich ist. Dies sollte nicht allzu schwierig sein, da die Stellenanzeigen in der Regel sehr explizit sind ("muss 5 Jahre Erfahrung in ... haben"), aber es kann einige Probleme mit übermäßig einfachen Lösungen geben.

In meinem Fall suche ich nach Einstiegspositionen. Oft sagen sie nicht "Einstiegsniveau", aber die Einbeziehung der Wörter bedeutet wahrscheinlich, dass der Job gespeichert werden sollte.

Als nächstes kann ich sicher einen Job ausschließen der besagt, dass es "5 Jahre" Erfahrung in was auch immer benötigt, so scheint ein Regex wie/\ d \ syears/sinnvoll, Jobs auszuschließen. Aber dann realisierte ich, dass einige Jobs sagen, dass sie 0-2 Jahre Erfahrung brauchen werden, die mit dem Ausschluss-Regex übereinstimmen, aber eindeutig eine Arbeit ist, die ich mir ansehen möchte. Hmmm, ich kann das mit einer anderen Regex umgehen. Aber manche sagen "weniger als 2 Jahre" oder "weniger als 2 Jahre". Kann das auch handhaben, aber ich frage mich, an welche anderen Muster ich nicht denke und möglicherweise viele Jobs ausschließe. Das bringt mich hierher, um einen besseren Weg zu finden, als Regexes, wenn es einen gibt.

Ich möchte die falsch negative Rate minimieren und speichern alle Jobs, die scheinen, als ob sie nicht viele Jahre Erfahrung benötigen. Schließt das Ausschließen von irgendetwas, das zu/[3-9] \ syears | 1 \ d \ syears/passt, vernünftig aus? Oder gibt es einen besseren Weg? Vielleicht einen Bayesian Filter trainieren?

Bearbeiten: Es gibt ein ähnliches, aber härteres Problem, das wahrscheinlich besser zu lösen wäre. Es gibt viele Jobs, die nur einen "Ingenieursabschluss" erfordern, da man nur ein paar technische Dinge verstehen muss. Aber die Suche nach "Engineering" gibt Ihnen Tausende von Jobs, meistens irrelevant.

Wie schränke ich dies auf jene Jobs ein, die irgendeinen Ingenieurgrad erfordern, anstatt bestimmte Grade, ohne jeden selbst zu betrachten?

+9

Wenn die Erfahrung der Hauptfaktor ist, oder einer von ein paar, würde ich keine Zeit verschwenden, versuchen, den Algorithmus zu perfektionieren und dann wundern, was ich kann oder nicht fehlen. Ich formatiere die Ausgabe, um den Kontext um jede Instanz von "Erfahrung" in einer linken Spalte anzuzeigen, und gebe mir einen Link in der rechten Spalte. Ich bin sicherer in meiner Fähigkeit, die Liste schnell zu scannen und die richtigen auszuwählen. Wenn Sie einige gut definierte Formate wiederholt sehen und diese ausschließen möchten, können Sie die Ergebnisse progressiv verfeinern, bis Sie mit der Ergebnismenge zufrieden sind. Hoffentlich finden Sie den Job, bevor Sie fertig sind. – Jay

+0

Das Problem mit dem Ausschließen von Mustern, die ich oft sehe, ist, dass die Regex möglicherweise Jobs entspricht, für die ich mich tatsächlich bewerben könnte. Und da ich nicht darauf achten werde, was ausgeschlossen ist, ist es schwer zu wissen, was ich vermisse. Ich kann nur Versuch und Irrtum benutzen, aber ich habe nur gehofft, dass es einen besseren Weg gibt. Vielleicht nicht! – ehsanul

+2

Achten Sie auf Orte, die um 2 ** 25 Sekunden Erfahrung mit etwas bitten ... –

Antwort

1

Ok, diese Antwort wird wahrscheinlich nicht hilfreich sein - ich werde das im Voraus sagen. Aber meiner Meinung nach genügt es, wenn man nur so über das Problem nachdenkt, dass man an den meisten Orten eingestellt wird, an denen ich gearbeitet habe. Mein Vorschlag? Kontaktieren Sie den Personalchef bei einer der Stellen, an denen Sie Interesse haben, sagen Sie ihnen, dass dies das ist, was Sie tun. Erzählen Sie ihnen generisch, was Sie bisher codiert haben, und bitten Sie um Unterstützung beim Erlernen der Muster, die sie beim Verfassen ihrer Anzeigen verwenden.

Wenn ich am Empfangsende dieses Briefes wäre, würde ich die Person zu einem Interview einladen.

+0

Sie haben Glück, an solchen Orten gearbeitet zu haben. Es könnte für mich funktionieren, wenn ich nach einer Software-Engineering-Position suchen würde. Aber Programmierung ist mein Hobby; Ich bin auf der Suche nach einem Job im Maschinenbau (und das liegt an dummen Regeln für internationale Studenten, die versuchen in den USA zu arbeiten). Ich würde aber gerne einen Software Job bekommen, aber mein Status macht es momentan praktisch unmöglich. Wenn Sie jemanden kennen, der einen Maschinenbauingenieur benötigt, der programmieren kann, lassen Sie mich bitte wissen :) – ehsanul

+1

@ehsanul: haben Sie auf careers.stackoverflow.com gepostet? – Ether

+0

@ether Sehen Sie meinen Kommentar über Ihrem. Ich kann momentan keinen softwarebezogenen Job annehmen (sowieso nicht legal). Ich suche Maschinenbaujobs. – ehsanul

1

Ich entwickelte eine gute Pars und E-Mail-Routine für ein paar Job-Websites, als ich nach Arbeit für mich selbst und ein paar Freunde suchte. Ich stimme den anderen Beiträgen zu, das ist eine gute Möglichkeit, das Problem zu betrachten. Um nur ein paar Infos zu verlieren, habe ich es hauptsächlich in Ruby gemacht und habe Proxies und einige andere Methoden verwendet, um sicherzustellen, dass ich nicht von der Job-Site vereist werde. Diese Art von Projekt ist anders als das übliche Scraping, da Sie es sich wirklich nicht leisten können, von einer Jobbörse ausgeschlossen zu werden. Jedenfalls habe ich nur einen Ratschlag: Vergiss es, diese zu intensiv zu sortieren und fein abzustimmen. Lassen Sie die Personalabteilung das für Sie erledigen und Ihren Lebenslauf und Ihre Referenzen überallhin mitnehmen. Es ist ein statistisches Spiel, und Sie möchten sich selbst ausstrahlen und dieses Netz so weit wie möglich werfen.

+0

Danke für den Rat. – ehsanul

0

Hier ist ein Beispielcode, wenn Sie interessiert sind. Es ist für die Suche nach einer Wohnung, kein Job, aber die Konzepte sollten ähnlich genug sein.

Verwandte Themen