2017-09-08 7 views
1

nehmen wir an, wir folgende Daten mit binären Antwortausgabe (Coupon) habenVerständnis Ergebnis der logistischen Regression

enter image description here

jährlichen Ausgaben in 1000. Einheit gegeben, um mein Ziel zu schätzen ist, ob, wenn der Kunde mehr ausgeben 2000 dann und hat Simmons Karte, auch Gutschein hat, vor allem i Daten werden sortiert nach Antwortdaten, ich habe folgendes Bild

enter image description here

bei der nächsten Stufe i habe berechnet logit für jeden Datensatz, für den ursprünglich folgenden Koeffizienten i

B0 0.1 
B1 0.1 
B2 0.1 

wählen und i sind L berechnet sich nach der folgenden Formel

enter image description here

am nächsten Stufe i e^L berechnet (was in Excel kann leicht durch exp Funktion)

=EXP(D2) 

danach erfolgen i Wahrscheinlichkeit berechnet haben

=E2/(1+E2) 

enter image description here

und schließlich Formel enter image description here

i Log-Likelihood-Funktion

berechnet haben

dann habe ich berechnete Summe und unter Verwendung von Solver-i-Koeffizienten berechnet haben, dass diese Summe minimieren (bitte zahlen Achtung, dass Werte in negativen Wert angegeben werden), aber ich habe alle Koeffizienten

enter image description here

ich liege falsch? Oder bedeutet es, dass ich den Kauf eines Coupons auf Basis der jährlichen Ausgaben und des Besitzes der Simmons-Karte vorhersagen kann? Vielen Dank im Voraus

Antwort

1

Sie können den Kauf eines Gutscheins auf der Grundlage der jährlichen Ausgaben (und wissen, Simmons Karte hilft nicht) vorhersagen.

Zugegeben, ich habe es nicht in Excel gelöst, aber ich vermute, das Problem könnte sein, dass Ihre Optimierung nicht konvergierte (dh nicht die richtigen Koeffizienten durch den Prozess zu erreichen) - die richtigen Koeffizienten sind B0 = 5.63, B1 = -2.95 und B2 = 0. Ich habe eine Online-Referenz für das Excel-Logistische-Regression-Verfahren unter http://blog.excelmasterseries.com/2014/06/logistic-regression-performed-in-excel.html gefunden.

Ich lief die logistische Regression selbst und fand, dass die jährlichen Ausgaben signifikant sind (auf der 0,05-Ebene), während Simmons-Karte nicht ist. Wieder läuft das Modell mit Simmons-Karte entfernt, ergibt die folgenden Gleichungen:

L = 5.63 - 2.95 * Annual spending 
    P(1) = exp(L)/(1 + exp(L)) 
    If P(1) > 0.5 => coupon = 1 

Obwohl die Entropie Rsquare niedrig bei 0,39 ist, (und die Anzahl der Datenpunkte sehr gering ist), das Modell statistisch signifikant ist.

+0

danke mein Freund, ich reparierte Problem, danke für Ihre Hilfe –

+0

Mein Vergnügen - froh, dass es hilfreich war! – dmb

Verwandte Themen