2016-07-13 6 views
-1

Ich arbeitete an einem multiplen Regressionsmodell, das die Höhe der Versicherungsansprüche basierend auf bestimmten Faktoren prognostiziert. Ein solcher (kategorischer) Faktor ist der Zimmertyp, auf den die Person als Teil des Versicherungspakets Zugriff hat (z. B. VIP-Zimmer). Das Problem ist, dass einige Zimmertypen eine hohe Variabilität in Ansprüchen haben, was dazu führt, dass sie unbedeutende Prädiktoren sind (p-Wert so hoch wie 0,6 für diese Ebenen). Mein Vorschlag ist, zwei getrennte Modelle zu erstellen, eines mit Raumtyp als Prädiktor und eines ohne. Wenn eine Person Teil eines der Räume mit hoher Variabilität ist, sollte das Modell ohne Raumtyp als Prädiktor verwendet werden, andernfalls kann das Modell der besseren Anpassung verwendet werden (hat einen höheren eingestellten R^2).bestimmte Ebenen von kategorialen Variablen insignifikant

Meine Frage ist, gibt es etwas inkorrekt mit diesem Verfahren?

Vielen Dank.

Antwort

0

Ich weiß nicht, wie viele mögliche Arten von Räumen Sie dort haben, aber es kann sein, dass einige Kategorien ein sehr geringes Volumen im Vergleich zu den anderen haben. Wenn das der Fall ist, würde ich lieber versuchen, Typen mit ähnlichen Eigenschaften wie neue Kategorien zu kombinieren. Das kann das Volumen erhöhen und sie signifikant machen.

Es ist schwierig, Dinge vorzuschlagen, ohne die Daten zu sehen.

Verwandte Themen