In meinem Problem habe ich sehr große Datenmenge, die aus meinem Gedächtnis ist. Ich würde gerne mein Modell mit Disk-Daten wie HDF5 oder ähnlichem trainieren. Unterstützt sklearn dies oder gibt es eine andere Alternative?Gibt es eine Möglichkeit, ein Sklearn-Modell mit Festplatten-Daten wie HDF5 oder ähnlichem zu trainieren?
7
A
Antwort
4
Was Sie fragen, heißt Out-of-Core- oder Streaming-Lernen. Dies ist nur mit einer Teilmenge der scikit-learn-Modelle möglich, die die Methode partial_fit
für die inkrementelle Anpassung implementieren.
Es gibt eine example in the documentation. Es gibt kein spezifisches Dienstprogramm, um Modelle speziell an Daten in HDF5 anzupassen, sondern kann dieses Beispiel anpassen, um die Daten von einer externen Datenquelle (z. B. HDF5-Daten auf der lokalen Festplatte oder einer Datenbank über das Netzwerk, z. B. mit dem Pandas SQL-Adapter) zu holen).
Verwandte Themen
- 1. Gibt es eine Möglichkeit, ein neuronales Encog-Netzwerk zu trainieren, ohne alle gespeicherten Trainingseinheiten zu laden?
- 2. Gibt es eine Möglichkeit, Speicher in atexit oder ähnlichem freizugeben, ohne globale Variablen zu verwenden?
- 3. Gibt es eine Möglichkeit, IEnumerable zu speichern oder zu speichern?
- 4. Gibt es eine Möglichkeit, ein Etikett mit c3js zu ändern?
- 5. Fehler Import hdf5 Datei in caffe zu trainieren hdf5_classification
- 6. Gibt es eine Möglichkeit zu testen, ob ein Edelstein funktioniert? Oder eine Möglichkeit zu sehen, welche Funktionen es hat
- 7. Gibt es eine Möglichkeit, Creeps zu löschen?
- 8. Gibt es eine Möglichkeit, ein Projekt nur für ein C# -Projekt zu erstellen oder zu erstellen
- 9. Gibt es eine Möglichkeit, django.db.connection.queries zu löschen?
- 10. Gibt es eine Möglichkeit, Kovarianz zu deklarieren?
- 11. Gibt es eine Möglichkeit, Formularantwort zu ignorieren?
- 12. Gibt es eine Möglichkeit, ein alphanumerisches Unicode-Symbol zu erkennen?
- 13. Gibt es eine Möglichkeit, Selektoren zu gruppieren?
- 14. Gibt es eine Möglichkeit, ein Etikett zu deaktivieren?
- 15. Gibt es eine Möglichkeit, ein unveränderliches (schreibgeschütztes) XDocument zu erstellen?
- 16. Gibt es eine Möglichkeit, ein Array in Klasseneigenschaften zu konvertieren?
- 17. Gibt es eine Möglichkeit, Datenbanktransaktionen zu beschleunigen?
- 18. Gibt es eine Möglichkeit, onPanResponderMove zu verwalten?
- 19. Gibt es eine Möglichkeit, ein Kalenderereignis über UIActivityViewController zu senden?
- 20. Gibt es eine Möglichkeit, eine Express-App zu booten?
- 21. Gibt es eine Möglichkeit zu wählen, wie mit benutzerdefinierten Separator
- 22. Gibt es eine Möglichkeit, Webkonsolenfehler zu erkennen?
- 23. Gibt es eine Möglichkeit, ein X509Certificate hübsch zu drucken?
- 24. Gibt es eine Möglichkeit, ein gesamtes SVN-Repository zu visualisieren?
- 25. Gibt es eine Möglichkeit, Duplikate zu vermeiden?
- 26. Gibt es eine Möglichkeit, ein zugängliches Modal zu machen?
- 27. Gibt es eine Möglichkeit, ein Prädikat zu negieren?
- 28. Gibt es eine einfache Möglichkeit, ein ASP.NET-Formular zu löschen?
- 29. Gibt es eine Möglichkeit, Typdeklarationen zu erweitern?
- 30. Gibt es eine kürzere Möglichkeit, ein QByteArray zu initialisieren?
Diese Frage setzt voraus, dass prinzipiell alle Modelle trainiert werden können, ohne dass alle Daten im Speicher sind. Ich bezweifle, dass dies der Fall ist. – cel
Dies ist perfekt möglich, zum Beispiel Caffe verwendet db-ähnliche Struktur, um Daten von der Festplatte zu holen, während das Training läuft. – erogol
Ogrisel hat eine Antwort gegeben, aber haben Sie weitere Möglichkeiten gefunden? Ich versuche das Gleiche zu tun. – KobeJohn