2017-08-09 4 views
0

SVM ist ein geometrischer Algorithmus, der versucht, den Abstand zwischen zwei Klassen zu maximieren, indem er eine Hyperebene zwischen ihnen zeichnet. Dies ist mit Zahlen als Datenpunkten verständlich. Allerdings verstehe ich nicht, wie der Rand und die Hyper-Ebene bestimmt werden, wenn die Daten Text sind? Ich würde es begrüßen, wenn jemand ein Beispiel geben könnte, wie SVM mit Text umgeht.Wie SVM den Rand mit Textdaten bestimmt?

+0

Intern arbeiten die meisten maschinellen Lernalgorithmen nur mit Zahlen. Also wird Ihr Text irgendwie in eine numerische Darstellung umgewandelt und dann behandelt. –

Antwort

0

Im Allgemeinen wird beim maschinellen Lernen Texteingabe in ein Wörterbuch von Textdaten und entsprechenden numerischen Werten umgewandelt. Nehmen wir an, Sie haben 3 Wörter in Ihrem Korpus: Äpfel, Orangen, Bananen. Das Wörterbuch kann aussehen wie

Äpfel: 1

Orangen: 2

Bananen: 3

So 1 Sie passieren, 2, 3 zu Ihrem Modell und numerische Werte in Textdaten konvertieren zurück, wenn Du bekommst deine Ergebnisse. Zum Beispiel, wenn Sie ein Ergebnis von 2 haben, bedeutet es Orangen.