2016-03-19 4 views
0

mit habe ich eine XML-Datei PMML Funktion von PMML Bibliothek in R.Wie Vorhersagen machen eine PMML-Datei in R

adamodel_iOS=ada(label~.,data=train_iOS, iter=ntrees, verbose=TRUE, loss="ada", bag.frac=0.7, nu=0.1, control=defctrl, type="real") 
Ptrain_iOS = predict(adamodel_iOS,newdata=train_iOS, type="prob") 

library(pmml) 
adapmml_iOS=pmml(adamodel_iOS) 
saveXML(adapmml_iOS,"model_iOS.xml") 

save.image() 

Nach, Trainingsmodell in der ersten Zeile mit, ich habe die entsprechenden Wahrscheinlichkeiten für die gefunden Trainingsdaten.

Jetzt möchte ich diese XML-Datei verwenden, um Vorhersagen für eine Reihe von Daten zu generieren (im Grunde das Trainingssatz wieder). Wie mache ich das in R? Ich sehe, dass in Java und Funken, können wir XML-Datei laden, die von Pmml-Funktion generiert und dann gibt es Funktionen, die Vorhersagen machen können.

Grundsätzlich suche ich für eine Funktion in R, die diese XML-Datei als Eingabe nehmen und dann ein Objekt zurückgeben, was wiederum einige Datenpunkte als Eingabe und zurück, um ihre Wahrscheinlichkeiten mit Etikett 0 und 1.

fand ich einen Link: Can PMML models be read in R?

aber es hilft nicht

+0

Wenn Sie Modelle in R trainieren und Modelle in R konsumieren, warum brauchen Sie überhaupt PMML? Was ist falsch mit 'vorhersagen (adamodel_iOS)'? – user1808924

+0

Ich habe diese Frage erwartet. :) Mein Hauptzweck ist es, dieses Modell zu einem Funkencluster zu transportieren, um Vorhersagen über Millionen von Datenpunkten zu treffen. Deshalb dokumentiere ich das Modell im Pmml-Format. Es läuft aber alles schief, da die vom Adamodel generierten Werte nicht mit denen übereinstimmen, die der Spark-Code erzeugt. Also, zum Debuggen möchte ich sicherstellen, dass sich nichts im Laufe der Dokumentation des Modells in das Pmml-Format ändert. Deshalb möchte ich die Pmml-Datei in R laden und dann sehen, ob sie die gleichen Werte für Trainingsdaten vorhersagt wie die vom Adamodel ausgegebenen. – pasternak

+0

Die 'pmml.ada()' Funktion von Rs 'pmml' Paket exportiert defekte Modelle. Verschwende deine Zeit nicht damit, es zu debuggen. – user1808924

Antwort

0

prüfen diese link für die Liste der PMML Produzenten und Konsumenten. Wie Sie sehen können, ist R als Produzent und nicht als Verbraucher aufgeführt. Außerdem werden Algorithmen aufgelistet, für die R die entsprechenden PMML-Dateien erzeugen kann.

Das umfassendste Tool für PMML Validator, Converter und auch zum Scoring von Daten mit PMML-Modellen ist ADAPA, das nicht kostenlos ist.

KNIME ist ein Open Source Drag & Drop-Analyse-Tool, das sowohl den Import als auch den Export von PMML-Dateien unterstützt (nicht für alle Modelle und die Funktionen sind begrenzt). Es unterstützt auch R, Python und Java.

Verwandte Themen