2009-07-03 2 views
1

Ich muss den Beitrag eines Benutzers analysieren und kategorisieren. Zum Beispiel: Ich muss jeden Beitrag als einen "Kauf" -Posten oder einen "Verkauf" -Posten kategorisieren, basierend auf dem Text - "Ich suche nach verkaufe mein Haus" ist kategorisiert als "verkaufen". Das Problem ist, dass es oft nicht so einfach ist - "Ich möchte mein altes Haus loswerden" muss auch als "verkaufen" kategorisiert werden. "Ich suche ein Haus" wird "kaufen". Ich würde diese Beiträge auch auf der Grundlage des fraglichen Artikels kategorisieren - zum Beispiel würde der obige Beitrag als "kaufen" und als "Haus" kategorisiert werden.beste Methode, um Text in PHP zu analysieren?

Kann jemand einen guten Ansatz/guten Rahmen/Technik empfehlen, wenn es darum geht, Benutzereingaben zu analysieren und zu verstehen? Danke.

+0

Warum nicht ein Kauf/Verkauf Radio Button Combo? – Residuum

+0

Wie gesagt, ich muss nicht nur kaufen/verkaufen, sondern auch welche Art von Artikel es ist. Ich könnte Radio-Buttons und Dropdown-Listen hinzufügen, aber ich wollte etwas cleverer. Vielleicht als Fallback, wenn das System nicht verstanden hat, was der Typ geschrieben hat. – daniel

Antwort

2

Sie haben Recht; Es ist eine schwierige Sache zu tun.

Yahoo! hat einen Term Extraction API/Web-Service, den Sie verwenden können. Es ist eine ziemlich gute Möglichkeit, Sprachanalyse für Ihren eigenen Text zu verwenden, ohne eine Million Codezeilen selbst zu schreiben. Ich habe es nicht benutzt, also habe ich keine Ahnung, wie gut es mit ähnlichen Bedeutungen funktioniert, wie deine Frage fragt.

Verwandte Themen