Ich schaute durch die documentation und Testen Google's Natural Language API und bemerkte, dass es eine Reihe von Menschen, Veranstaltungen, Organisationen und Standorten inkorrekt - es scheint, Wikipedia als eine wichtige Datenquelle zu verwenden, so wenn es nicht in Wikipedia scheint es zu haben Probleme beim Identifizieren der Art der verschiedenen Wörter. Wenn bestimmte Wörter in einem Namen (Eigenname) erscheinen, scheint es immer eine Entität als einen bestimmten Typ zu identifizieren, der nicht immer korrekt ist.Zug oder benutzerdefinierte Word-Entitätstypen?
Zum Beispiel: "Kongress" scheint immer als eine Organisation [Regierung] zu identifizieren, auch wenn es Teil eines Ereignisses ist. Der Name "WordCamp" wird als Ort angezeigt, ist aber ein Ereignis.
Gibt es eine Möglichkeit, die Engine für natürliche Sprache zu trainieren oder einen benutzerdefinierten Satz von Organisationen, Standorten, Ereignissen usw. bereitzustellen, damit genauere Typinformationen für Entitäten bereitgestellt werden, die nicht besonders beliebt sind?
Danke für die Erklärung – Jim
@Apoorv Irgendwelche Updates zu diesem Thema? –
Bleiben Sie dran für zukünftige Updates. –