2016-03-05 7 views
11

Ich bin ein Neuling in Machine Learning und Natural Language Processing.Unterschied zwischen Parametern, Features und Klasse in Machine Learning

Ich bin immer verwirrt zwischen was sind diese drei Begriffe?

Von meinem Verständnis:

Klasse: Die verschiedenen Kategorien unserer Modellausgabe. Geben Sie bei einem Namen der Person an, ob er männlich oder weiblich ist?

Sagen wir, ich verwende Naive Bayes Klassifikator.

Was wären meine Funktionen und Parameter?

Auch, was sind einige der Aliase der oben genannten Wörter, die synonym verwendet werden.

Danke

Antwort

12

das Beispiel der Klassifizierung das Geschlecht einer Person nutzen lassen. Dein Verständnis über die Klasse ist korrekt! Bei einer Eingabebeobachtung sollte unser Naive Bayes Classifier eine Kategorie ausgeben. Die Klasse ist diese Kategorie.

Funktionen: Funktionen in einem Naive Bayes-Klassifizierer oder einem beliebigen allgemeinen ML-Klassifizierungsalgorithmus sind die Datenpunkte, die wir zur Definition unserer Eingaben auswählen. Für das Beispiel einer Person können wir möglicherweise nicht alle Datenpunkte über eine Person eingeben; Stattdessen wählen wir einige Funktionen aus, um eine Person zu definieren (sagen wir "Höhe", "Gewicht" und "Fußgröße"). Insbesondere in einer Naive Bayes Classifier, die Schlüsselannahme, die wir machen, ist, dass diese Funktionen unabhängig sind (sie beeinflussen sich nicht gegenseitig): die Höhe einer Person hat keinen Einfluss auf das Gewicht hat keinen Einfluss auf die Größe des Fußes. Diese Annahme mag stimmen oder nicht, aber für ein naives Bayes nehmen wir an, dass es wahr ist. In dem speziellen Fall Ihres Beispiels, in dem die Eingabe nur der Name ist, können Features die Häufigkeit von Buchstaben, die Anzahl von Vokalen, die Länge des Namens oder Suffixe/Präfixe sein.

Parameter: Parameter in Naive Bayes sind die Schätzungen der wahren Verteilung von allem, was wir zu klassifizieren versuchen. Zum Beispiel könnten wir sagen, dass etwa 50% der Menschen männlich sind, und die Verteilung der männlichen Körpergröße ist eine Gauß-Verteilung mit einem Mittelwert von 5 '7 "und einer Standardabweichung von 3". Die Parameter wären die 50% Schätzung, die 5'7 "Mittelwertschätzung und die 3" Standardabweichungsschätzung.

Aliase: Merkmale werden auch als Attribute bezeichnet. Mir ist kein allgemeiner Ersatz für "Parameter" bekannt.

Ich hoffe, das war hilfreich!

+0

Vielen Dank für die erstaunliche Antwort. Hatte eine kleine Ahnung von der Antwort, aber immer noch bestätigt. Vielen Dank. –

+1

Gern geschehen, froh, dass es hilfreich war! – txizzle

6

@txizzle erklärte den Fall von Naive Bayes gut. Allgemeiner ausgedrückt:

Klasse: Die Ausgabekategorie Ihrer Daten. Sie können diese Kategorien auch aufrufen. Die Etiketten auf Ihren Daten zeigen auf eine der Klassen (wenn es ein Klassifizierungsproblem ist, natürlich.)

Merkmale: Die Eigenschaften, die Ihr Problem definieren. Diese werden auch Attribute genannt.

Parameter: Die Variablen, die Ihr Algorithmus versucht, ein genaues Modell zu erstellen.Als Beispiel wollen wir sagen, dass Sie versuchen, zu entscheiden, ob Sie einen Schüler in die Schule aufnehmen oder nicht, basierend auf verschiedenen Faktoren wie seinem/ihrem Anfänger GPA, Testergebnisse, Bewertungen auf Empfehlungen, Projekte usw. In diesem Fall Die oben genannten Faktoren sind Ihre Merkmale/Attribute, ob der Schüler eine Zulassung erhält oder nicht Ihre 2 Klassen wird, und die Zahlen, die darüber entscheiden, wie diese Merkmale kombiniert werden, um Ihre Ausgabe zu erhalten, werden zu Ihren Parametern. Was die Parameter tatsächlich darstellen, hängt von Ihrem Algorithmus ab. Für ein neuronales Netz sind es die Gewichte der synaptischen Verbindungen. In ähnlicher Weise sind die Parameter für ein Regressionsproblem die Koeffizienten Ihrer Features, wenn sie kombiniert werden.

1

eine einfache Klassifizierung linear nehmen problem-

y = {0, wenn 5-fach-3> = 0, sonst 1}

hier y-Klasse ist, x Funktion ist, sind 5,3-Parameter.

Verwandte Themen