Ich habe eine Daten, in der jede Probe Feature-Vektor bestehend aus x und etwa 9000 andere Funktionen und auch entsprechende y (Zielwert). in denen x und y beide kontinuierliche Werte sind (zwischen 0 und 20). x eine verrauschte Daten, aber wir können die Quelle des Rauschens nicht erkennen. Das Ziel ist, y von x und anderen Features vorherzusagen (Features sind nicht laut). Die Anzahl der Proben beträgt etwa 900.000. Was sind die Ansätze zum maschinellen Lernen, die ich in diesem Problem anwenden kann? auch berühmte Netzwerke im neuronalen Netzwerk oder Deep Learning.vorhersagen kontinuierlichen Zielwert von verrauschten Eingabe mit maschinellen Lernen approches
Antwort
Das klingt für mich wie ein Standard-Regressionsproblem, obwohl Ihre Vorhersagekorrelation (technischer Begriff :-)) in direktem Verhältnis zu dem Lärm von x saugen wird. Sehen Sie sich alle Bildungsbeispiele zur Vorhersage von Wohnungspreisen an (oft zur Veranschaulichung des Gradientenabfalls). Sie haben 9000 Funktionen statt 3 oder 4, aber das ist nur eine Frage der Trainingszeit.
Sie könnten auch eine "Faktoranalyse" in Erwägung ziehen, damit Sie die Merkmale eliminieren können, die nicht genug zu y (Korrelationskoeffizient nahe 0,0) beitragen. Dies wird "Dimensionalitätsreduktion" genannt; Suchen Sie nach PCA (Hauptkomponentenanalyse).
Bitte geben Sie einen Wikipedia-Algorithmus an, der auf den Fachbegriff 'suck' verweist. Es würde meinem Fortschritt in ML helfen. – javadba
Nur ein Witz; Ich hätte es als solches markieren sollen. :-) Es bedeutet ungefähr "unakzeptable Ergebnisse und Reaktionen". – Prune
Vielleicht ein Link zu "mit PHP für große ML" – javadba
- 1. Feedback oder Verstärkung beim maschinellen Lernen verwenden?
- 2. Was bedeutet clf beim maschinellen Lernen?
- 3. Schnellste allgemeine Bibliothek zum maschinellen Lernen?
- 4. So berechnen Sie Protokollverlust beim maschinellen Lernen
- 5. Eine Frage zu Klassifizierern im maschinellen Lernen
- 6. Wie können bestimmte Funktionen im maschinellen Lernen stärker gewichtet werden?
- 7. Verwenden von maschinellem Lernen zum Vorhersagen von Daten
- 8. Warum wird Kernel im maschinellen Lernen als Kernel-Funktion bezeichnet?
- 9. Entfernung von verrauschten Pixeln mit opencv
- 10. Modul exportiert zwei diffrent mit approches
- 11. Gibt es verteilte Bibliotheken zum maschinellen Lernen für die Verwendung von Python mit Hadoop?
- 12. Autounfälle mit Tensorflow vorhersagen
- 13. Binding Zielwert geändert Ereignis
- 14. Scipy FFT-Frequenzanalyse von sehr verrauschten Signal
- 15. Zeitreihenprognose mit scikit lernen
- 16. Vorhersagen mit ARIMA (python statsmodels)
- 17. Ändern Sie Google-Autocomplete-Vorhersagen mit meinen Vorhersagen
- 18. Python: mit scikit-lerne vorhersagen, gebe leere Vorhersagen
- 19. ANTLR auf einem verrauschten Datenstrom
- 20. Gradient in verrauschten Daten, Python
- 21. Wie kann ich mit maschinellem Lernen Fehler in der Systemprotokolldatei vorhersagen?
- 22. ANTLR auf einem verrauschten Datenstrom Teil 3
- 23. NSString Parsing von kontinuierlichen Daten
- 24. Mithilfe von maschinellem Lernen den Zusammenbruch und die Stabilisierung komplexer Systeme vorhersagen?
- 25. Wie man die Klasse kennt, in der das klassifizierte Ergebnis dem maschinellen Lernen näher kommt
- 26. Welches ist der beste Scikit-Learning-Algorithmus zum maschinellen Lernen für unterschiedliche Trainingsdaten?
- 27. Tupeln von geschlossenen kontinuierlichen Abständen
- 28. Vorhersagen mit h2o.randomForest gespeichert Modell
- 29. Warum verbessert eine Hot-Encoding-Technologie die Leistung beim maschinellen Lernen?
- 30. Auswahl zwischen GeForce- oder Quadro-GPUs zum maschinellen Lernen über TensorFlow
Ich bin ein wenig verwirrt, was Sie suchen? Möchten Sie Vorschläge zu Algorithmen, Konfigurationen von Algorithmen, beides? – Andnp
Ich bin auf der Suche nach Algorithmen oder gemeinsamen maschinellen Lernansätzen kann zur Lösung dieses Problems verwendet werden. Zum Beispiel kann dieses Problem als ein Regressionsproblem angesehen werden, aber Eingabedaten, die x sind, sind laut, dass wir diese Eigenschaft nicht in der Regression haben. Ich möchte wissen, ob es eine gemeinsame Methode oder einen Algorithmus im maschinellen Lernen gibt, um diese Art von Problemen oder Problemen in der Nähe dieses Problems zu lösen. Wenn es welche gibt, würde ich es begrüßen, wenn ich es nur nenne. – sandra
In diesem Fall, ich denke, Sie haben die Frage selbst beantwortet. Der erste Ansatz, der mir einfällt, wäre ein neuronales Netzwerk. Die Interaktionen zwischen den Features Ihres Datasets würden die Architektur dieses Netzwerks bestimmen (daher können wir dort keine Kommentare abgeben), und Sie hätten einen einzigen Ausgabeknoten, der die Regression bewältigen würde. – Andnp