Ich verwende h2o Version 3.10.4.8.Wie H2O Verwirrung Matrix interpretieren?
library(magrittr)
library(h2o)
h2o.init(nthreads = -1, max_mem_size = "6g")
data.url <- "https://raw.githubusercontent.com/DarrenCook/h2o/bk/datasets/"
iris.hex <- paste0(data.url, "iris_wheader.csv") %>%
h2o.importFile(destination_frame = "iris.hex")
y <- "class"
x <- setdiff(names(iris.hex), y)
model.glm <- h2o.glm(x, y, iris.hex, family = "multinomial")
preds <- h2o.predict(model.glm, iris.hex)
h2o.confusionMatrix(model.glm)
h2o.table(preds["predict"])
Dies ist die Ausgabe von h2o.confusionMatrix(model.glm)
:
Confusion Matrix: vertical: actual; across: predicted
Iris-setosa Iris-versicolor Iris-virginica Error Rate
Iris-setosa 50 0 0 0.0000 = 0/50
Iris-versicolor 0 48 2 0.0400 = 2/50
Iris-virginica 0 1 49 0.0200 = 1/50
Totals 50 49 51 0.0200 = 3/150
Da es über sagt: vorhergesagt, ich interpretieren dies, dass das Modell 50 bedeuten gemacht (0 + 48 + 2) Vorhersagen, die Iris- sind versicolor.
Dies ist die Ausgabe von h2o.table(preds["predict"])
:
predict Count
1 Iris-setosa 50
2 Iris-versicolor 49
3 Iris-virginica 51
Das sagt mir, dass das Modell 49 Vorhersagen gemacht, die Iris-versicolor sind.
Ist die Konfusionsmatrix falsch beschriftet oder habe ich einen Fehler bei der Interpretation der Ergebnisse gemacht?
es ist der andere Weg: tatsächliche Beschriftungen sind vertikal (Zeilennamen) und vorhergesagte Beschriftungen sind quer (Spaltennamen). Es ist ein bisschen verwirrend, aber schauen Sie sich die Fehlerrate an, es hat in der anderen Richtung keinen Sinn – HubertL