Ich benutze AngelList DB, um Startups basierend auf ihren Branchen zu kategorisieren, da diese Startups basierend auf Community-Input kategorisiert werden, was die meiste Zeit irreführend ist.Die Branche des Startups finden Sie in der Beschreibung
Mein Geschäftsziel ist Schlüsselwörter zu extrahieren, die diese spezifische Start welcher Branche anzuzeigen gehört dann in LinkedIn Blatt spezifiziert eine der Branchen abzubilden https://developer.linkedin.com/docs/reference/industry-codes
ich mit Azure Maschinelles Lernen experimentiert, wo ich 300 Start-ups geschoben Beschreibungen und analysiert die Keyword-Extraktion war ziemlich schlecht und war nicht einmal annähernd das, was ich erreichen möchte.
Ich würde gerne wissen, wie Datenwissenschaftler dieses Problem angehen werden? Wo soll ich hinschauen? und wo sollte ich nicht? ist Keyword-Analyse-Tools (wie Google Adwords Keyword-Planer ist eine praktikable Option)
Können Sie mit einem vollständigen Beispiel klären, was Sie anstreben? – mjalajel
Algorithmus für Cluster-Startups: http: //blog.funderbeam.com/5-competitive-startup-clustering-skills/ – user1808924
http://cs.stackexchange.com/q/55138/755 –