Ich würde gerne eine Attribute-Relation File Format mit scikit-lernen, um einige NLP-Aufgabe zu tun, ist das möglich? Wie kann eine .arff
Datei mit scikit-learn
verwendet werden?.arff-Dateien mit scikit-lernen?
Antwort
Ich empfehle wirklich liac-arff. Es lädt nicht direkt an numpy, aber die Umsetzung ist einfach:
import arff, numpy as np
dataset = arff.load(open('mydataset.arff', 'rb'))
data = np.array(dataset['data'])
Ich fand, dass scipy has a loader for arff files, um sie als numpy Record-Arrays zu laden. Ich bin nicht 100% sicher, dass diese Arrays für den direkten Konsum von scikit-learn geeignet sind, aber das sollte beginnen.
Denkst du, dass ich diese numpigen Arrays parsen muss? ... Welche Art von Vorprozess müsste ich machen, um einen Klassifizierungsalgorithmus in scikit-learn zu füttern? – tumbleweed
Follow renatopp Antwort: übernehmen Ihre Daten der Iris-Datensatz ist, sollte es 5 dimensional mit letzte ist die Klasse Label Spalte.
s = svm.SVC()
data_input = data[:,0:4]
labels = data[:,4] # this is the class column
s.fit(data_input, labels)
Ich denke, das ist etwas, was Sie wollen.
- 1. Mit zwei Befehlen (Rohr mit |) mit Laich
- 2. Umgang mit Daten mit MVC mit AngularJS
- 3. mit Deklaration mit enum?
- 4. Mit jQuery mit DevExpress
- 5. Mit NodeJS mit Typoskript
- 6. Mit MaterializeCSS mit Aurelia
- 7. mit ffmpeg mit Xcode
- 8. Mit AngularJS mit MeteorJS
- 9. mit Arrays.sort mit Lambda
- 10. Mit OpenBLAS mit GSL
- 11. mit DBMS_APPLICATION_INFO mit Jboss
- 12. Mit MvxCommand Mit Command
- 13. Mit Supercollider mit Python
- 14. Mit forever.js mit Python
- 15. Mit GraphiQL mit Foxx
- 16. Mit Moles mit System.Reflection
- 17. Probleme mit jQuery Mit
- 18. Mit Parsec mit data.text
- 19. Mit Repo mit msysGit
- 20. Mit html2Canvas mit HighCharts
- 21. Mit javac mit Import
- 22. mit KeyStore mit .crt
- 23. Mit DevicIOControl mit VC#
- 24. mit Python mit bash
- 25. mit pushstate mit Slashes
- 26. Mit mkl_set_num_threads mit numpy
- 27. mit Atom.io mit winscp
- 28. Mit scala.sys.process mit Timeout
- 29. mit jQuery mit socket.io
- 30. Mit Reflection mit Android
Danke für die Rückmeldung. Irgendeine Idee von, wie ich dieses Gespräch verwenden kann, um zu klassifizieren ?. – tumbleweed
ich alle bereit wissen, dass zum Beispiel mit SVM die Grundidee für die Klassifizierung ist: 'von sklearn Import svm s = svm.SVC() lables = [label1, label2] s.fit (training_data, Etiketten)' Wie könnte ich präsentiere eine 'arff' Datei zu einem Klassifikationsalgorithmus? – tumbleweed
Können Sie TF-IDF-Ergebnisse aus der .arff-Datei analysieren und in sklearn verwenden? –