2017-05-15 5 views
1

Ich habe Daten beschriftet, koppeln kategoriale Variablen und zwei binäre Zielvariablen.Export-Modell zu PMML

Header zum Beispiel;

column_1,column_2,column_3,column_4,target_1,target_1 

Wie kann ich es nach PMML exportieren? das einzige Beispiel, das ich gefunden habe, ist mit unbeaufsichtigten Daten

import pandas 

iris_df = pandas.read_csv("Iris.csv") 

from sklearn2pmml import PMMLPipeline 
from sklearn2pmml.decoration import ContinuousDomain 
from sklearn_pandas import DataFrameMapper 
from sklearn.decomposition import PCA 
from sklearn.feature_selection import SelectKBest 
from sklearn.preprocessing import Imputer 
from sklearn.linear_model import LogisticRegression 

iris_pipeline = PMMLPipeline([ 
    ("mapper", DataFrameMapper([ 
     (["Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width"], [ContinuousDomain(), Imputer()]) 
    ])), 
    ("pca", PCA(n_components = 3)), 
    ("selector", SelectKBest(k = 2)), 
    ("classifier", LogisticRegression()) 
]) 
iris_pipeline.fit(iris_df, iris_df["Species"]) 

from sklearn2pmml import sklearn2pmml 

sklearn2pmml(iris_pipeline, "LogisticRegressionIris.pmml", with_repr = True) 

Antwort

1

Das bereitgestellte Beispiel über classificication überwacht - das y Argument der Pipeline#fit(X, y) Methode ist das Etikett.

Ihr Fall würde wie folgt aussehen:

pipeline = PMMLPipeline(
    ("mapper", DataFrameMapper([ 
    (feature_column, LabelBinarizer()) for feature_column in ["column_1", "column_2", "column_3", "column_4"] 
    ])), 
    ("classifier", LogisticClassification()) 
) 
pipeline.fit(df, df["target_1"]) 
Verwandte Themen