ich einen Text-Klassifikator erstellt haben, die Kommentare in verschiedenen Kategorien wieKFold Kreuzvalidierung für KNN Text Classifier in R
Comment Category
Good Service provided Service
Excellent Communication Communication
I-Klassifikation getan klassifiziert:
knn(modeldata[train, ], modeldata[test,] , cl[train], k =2, use.all = TRUE)
Jetzt möchte ich Bewerten Sie dieses Modell mit der K-Fold Cross Validation. Ich erwarte eine Zahl, die ich verwenden kann wissen, ob Modell Überanpassung oder underfitting etc
ich verwendet habe
knn.cv(modeldata[train, ], cl[train], k =2, use.all = TRUE)
Aber Hilfe dieses Befehls sagt, es wird wieder NA, wenn Modell verwirrt ist. Bitte führen Sie
Ich bin mit "Klasse" Paket für KNN: Sie können caret für CV wie folgt aus (zB mit dem Iris-Datensatz) verwenden. Ich bin mir nicht sicher, ob es wegen der Anzahl der Spalten im Iris-Dataset für den Iris-Dataset funktioniert, aber nicht für meinen Dataset (der nur zwei Spalten hat). Wenn ich über Befehl gehe, bekomme ich unten Nachricht: Warnung in preProcess.default (thresh = 0,95, k = 5, Methode = c ("center",: Diese Variablen haben Null Varianzen: – Sourabh
Ich habe auch versucht, unten Aussagen aber bekommen Fehlermeldung:. knnFit1 <- train (Kategorie ~ Text, Daten = x, method = "knn", preProcess = NULL, trControl = trainControl (Methode = "cv", Nummer = 5,. classProbs = FALSE)) Fehlermeldung: Eine oder mehrere Faktorstufen im Ergebnis haben keine Daten, haben alle Faktoren berücksichtigt, aber keine Leer-/Leerwerte gefunden – Sourabh