2015-08-24 7 views
5

Ich möchte die Beziehung zwischen Trainingsdatensatz, Testdatensatz und Vertrauenswürdigkeit kennenlernen. Ich weiß die Bedeutung jedes einzelnen getrennt, aber ich kann die Beziehung zwischen ihnen nicht besonders Grundwahrheit und Trainingsdaten sehen.Ground Truth und Trainingsdatensatz

Antwort

6

Mit Ihren Trainingsdaten trainieren Sie Ihren Klassifikator.

Sie testen dann die Genauigkeit Ihres Modells auf Ihrem Test-Set.

Boden Wahrheit bezieht sich auf die Beschriftung für jede Trainingsprobe Sie haben also Sie wissen, welche Kategorie/Ergebnis jeder Trainingsprobe gehört zu

+0

Was passiert, wenn ich nicht die Bezeichnung jeder Probe in meinen Trainingsdaten wissen kann? Kann ich damit nicht noch arbeiten? – Arwa

+0

Sie können, aber Sie möchten an diesem Punkt etwas namens unüberwachtes Lernen betrachten. Für das überwachte Lernen benötigen Sie Labels, da es sonst nicht erfahren kann, dass die Features x, y, z beispielsweise der Kategorie 1 zugeordnet sind. – Simon

+0

Ich habe eine andere Frage, wenn ich das Etikett von Teilen meines Trainings kenne? Kann ich diesen Teil als Grundwahrheit betrachten und mit dem kompletten Trainingssatz verarbeiten? – Arwa

0

Es ist eine weitere wichtige Verwendung des Begriffs ‚Ground Truth‘, wo in Regressionsprobleme ist es sehr wertvoll, um die wahre deterministische Komponente der zu modellierenden Daten zu kennen.

0

Ground Truth sind faktische Daten, die beobachtet oder gemessen wurden und objektiv analysiert werden können. Es wurde nicht gefolgert. Wenn die Daten auf einer Annahme beruhen, einer Meinung unterliegen oder zur Diskussion stehen, dann sind dies definitionsgemäß keine Ground-Truth-Daten.

Ihre Fähigkeit, ein Problem mit Data Science zu lösen, hängt sehr davon ab, wie Sie das Problem einrahmen und zweifelsfrei unterscheiden, wenn Sie Ground Truth etablieren können. Weitere Informationen finden Sie hier The Importance of Ground Truth in Data Science

Verwandte Themen