2017-04-26 2 views
0

Ich habe immer noch ein Problem mit einem Deep-Learning-Modell. Ich habe ein Modell auf rrc Datenrahmen trainiert, und wenn ich das tue:Misalign-Vorhersagen und die Antwortsäule nach der Kreuzvalidierung in H2O (Deep Learning)

rrc['preds'] = dp.cross_validation_holdout_predictions().as_data_frame().predict Ich bekomme immer die Antwort Spalten und Vorhersagen fehlausgerichtet. An der Spitze des Datenrahmens sind sie ausgerichtet, aber an einem gewissen Punkt scheint es, dass sie falsch ausgerichtet sind und wenn ich eine Korrelation zwischen ihnen berechnen würde, ist sie sehr schlecht wegen dieser Fehlausrichtung. Ich habe versucht, dies für mehr als 3 Tage zu beheben, aber ich habe keine Ahnung, wie es geht.

Ich benutze H2O 3.10.4.5. Das Modell selbst:

dp = H2ODeepLearningEstimator(activation = "Tanh", hidden = [10, 10, 10], epochs = 10000, keep_cross_validation_predictions=True, ignored_columns = ['fn', 'pdb_id','pdb_id_chain', 'pdb_id_chain_source', 'source']) dp.train(x = list(set(rrch.col_names) - set(['rmsd_all'])), y ="rmsd_all", training_frame = rrch, fold_column="cv")

Edit: Ich denke, dass ich das Problem (Cell # 58) https://github.com/mmagnus/mmagnus.github.io/blob/master/mq-test.ipynb gefunden Wenn ich rrc3 = rrc3[rrc3.rmsd_all < 10] tun einige Zeilen zu entfernen, die rmsd_all (die Antwortspalte) Wert höher als 10 ist und dann Ich habe rrc3h = h2o.H2OFrame(rrc3) das Problem verursacht. Ich bin mir nicht sicher warum. Der Datensatz 40mb https://www.dropbox.com/s/1et38o3xx47jw1m/rasp_rnakb_cv2.csv?dl=0

+0

Es wäre viel schneller, dies zu debuggen, wenn Sie ein vollständig reproduzierbares Beispiel liefern würden. Kannst du eins hinzufügen? –

+0

Gelöst: 'rrc3.reset_index (inplace = True)' wird den Job erledigen! –

+0

Gut zu wissen. Können Sie dies als Antwort posten (und die Antwort akzeptieren), damit wir das Ticket schließen können? –

Antwort

0

Gelöst: rrc3.reset_index(inplace=True) wird die Arbeit tun!

Verwandte Themen