Ich möchte die Beziehung zwischen Trainingsdatensatz, Testdatensatz und Vertrauenswürdigkeit kennenlernen. Ich weiß die Bedeutung jedes einzelnen getrennt, aber ich kann die Beziehung zwischen ihnen nicht besonders Grundwahrheit und Trainingsdaten sehen.Ground Truth und Trainingsdatensatz
Antwort
Mit Ihren Trainingsdaten trainieren Sie Ihren Klassifikator.
Sie testen dann die Genauigkeit Ihres Modells auf Ihrem Test-Set.
Boden Wahrheit bezieht sich auf die Beschriftung für jede Trainingsprobe Sie haben also Sie wissen, welche Kategorie/Ergebnis jeder Trainingsprobe gehört zu
Es ist eine weitere wichtige Verwendung des Begriffs ‚Ground Truth‘, wo in Regressionsprobleme ist es sehr wertvoll, um die wahre deterministische Komponente der zu modellierenden Daten zu kennen.
Ground Truth sind faktische Daten, die beobachtet oder gemessen wurden und objektiv analysiert werden können. Es wurde nicht gefolgert. Wenn die Daten auf einer Annahme beruhen, einer Meinung unterliegen oder zur Diskussion stehen, dann sind dies definitionsgemäß keine Ground-Truth-Daten.
Ihre Fähigkeit, ein Problem mit Data Science zu lösen, hängt sehr davon ab, wie Sie das Problem einrahmen und zweifelsfrei unterscheiden, wenn Sie Ground Truth etablieren können. Weitere Informationen finden Sie hier The Importance of Ground Truth in Data Science
- 1. Wo finde ich eine gute Auswahl an Benchmark-Clustering-Datasets mit Ground-Truth-Labels?
- 2. Trainingsdatensatz in FANN
- 3. GoogleMap Ground: Squeeze Bild zu vier LatLngBounds
- 4. Groovy CompileStatic auf Android vermasselt Groovy Truth
- 5. WEKA auf großem Trainingsdatensatz (Java-Code)
- 6. Bereiten Sie einen Trainingsdatensatz für Multilabel-Klassifizierung vor
- 7. Erstellen von Trainingsdatensatz mit. Mids-Objekt in R
- 8. Wie wähle ich den richtigen Trainingsdatensatz für die Prognose?
- 9. Wie überprüfe ich, ob eine Sammlung mindestens N übereinstimmende Elemente in google-truth enthält?
- 10. Bedeutung und Verwendung von "_embedded" in HATEOAS
- 11. Kamera Pose Schätzung: Wie interpretiere ich Rotations-und Translationsmatrizen?
- 12. Wie kann ich echte positive und echte negative trennen?
- 13. Relativer Pfad auf f.LoadFromfile und f.SaveToFile
- 14. Background Worker und Garbage Collection?
- 15. Pandas Spalte boolean machen und Löschen von Zeilen, die nicht
- 16. Mehrere Funktionen in React aufrufen, eine innerhalb und eine außerhalb einer Komponente?
- 17. Wie man Formularfelder auf der Grundlage einer Auswahl aus einem Dropdown-Menü in Django ein- und ausblenden
- 18. Pandas Filtern und Vergleichen von Daten
- 19. Verschlüsselungs- und Entschlüsselungsklasse?
- 20. Javascript: Erwartete einen Auftrag oder Funktionsaufruf und sah stattdessen einen Ausdruck
- 21. Python: wie Schlüssel aus einem Wörterbuch zu löschen, wenn es nicht in einem anderen Wörterbuch vorhanden ist?
- 22. Jeremy McAnally Kontext Verwendung zum Testen in Rails 2.3.x
- 23. Python Pandas Dataframe: Daten zwischen 0,01 und 0,99 normalisieren?
- 24. Orange3 Wie man Vorverarbeitung auf neue Daten anwendet
- 25. Physijs, Bewegung und Physik kombinierend
- 26. MATLAB und Zellenfeld für Schleife Handling in
- 27. Android wischen und addforce Einheit
- 28. 508 Einhaltung von Radio-Buttons, Position Problem auf IE und Chrome
- 29. dann läuft vor Ajax zurück
- 30. SpriteKit Auswickeln Optional Error (Swift)
Was passiert, wenn ich nicht die Bezeichnung jeder Probe in meinen Trainingsdaten wissen kann? Kann ich damit nicht noch arbeiten? – Arwa
Sie können, aber Sie möchten an diesem Punkt etwas namens unüberwachtes Lernen betrachten. Für das überwachte Lernen benötigen Sie Labels, da es sonst nicht erfahren kann, dass die Features x, y, z beispielsweise der Kategorie 1 zugeordnet sind. – Simon
Ich habe eine andere Frage, wenn ich das Etikett von Teilen meines Trainings kenne? Kann ich diesen Teil als Grundwahrheit betrachten und mit dem kompletten Trainingssatz verarbeiten? – Arwa