ich mit diesem Beispiel aus wikipedia logistischer Regression in Python mache. link to exampleverwirrende Ergebnisse mit logistischer Regression in Python
hier ist der Code, den ich habe:
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
Z = [[0.5], [0.75], [1.0], [1.25], [1.5], [1.75], [1.75], [2.0], [2.25], [2.5], [2.75], [3.0], [3.25], [3.5], [4.0], [4.25], [4.5], [4.75], [5.0], [5.5]] # number of hours spent studying
y = [0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1] # 0=failed, 1=pass
lr.fit(Z,y)
Ergebnisse hierfür sind
lr.coef_
array([[ 0.61126347]])
lr.intercept_
array([-1.36550178])
während sie Werte 1,5046 für Stunde Koeffizient und -4,0777 abfangen zu bekommen. Warum sind die Ergebnisse so unterschiedlich? ihre Voraussage für 1 Stunde der Studie ist Wahrscheinlichkeit 0.07 zu überschreiten, während ich 0.32 mit diesem Modell bekomme, sind diese drastisch unterschiedliche Ergebnisse.
Ich denke, das Problem mit der tatsächlichen Formel sein könnte, die für die Berechnung verwendet. Bitte geben Sie das Ergebnis einer Probenvorhersage einmal an. Ich werde versuchen, es zu testen. – Kishor