Ich habe meine Daten in ein Trainings- und Testing-Set aufgeteilt. Mein Plan ist es, ein lineares Regressionsmodell zu trainieren und in der Lage zu sein, mit meinem Test-Split zu überprüfen, wie die Leistung ist.Wie kann ich ein lineares Regressionsmodell aus einem geteilten Datensatz erstellen?
Mein aktueller Code ist:
import pandas as pd
import numpy as np
from sklearn import datasets, linear_model
import matplotlib.pyplot as plt
df = pd.read_csv('C:/Dataset.csv')
df['split'] = np.random.randn(df.shape[0], 1)
split = np.random.rand(len(df)) <= 0.75
training_set = df[split]
testing_set = df[~split]
Gibt es eine richtige Methode soll ich ein lineares Regressionsmodell aus einer externen Datei wie eine CSV zu zeichnen verwenden?
Ich erhalte einen Fehler, der mir sagt, dass x_vars (und deshalb nehme ich an, y_var) nicht definiert ist? – ReadySteadyMedi
Ja ... 'x_vars' sollte eine Liste Ihrer unabhängigen Variablen sein, und' y_var' sollte entweder eine Liste oder eine Zeichenfolge Ihrer abhängigen Variablen sein ... – blacksite