Ich arbeitete an einem multiplen Regressionsmodell, das die Höhe der Versicherungsansprüche basierend auf bestimmten Faktoren prognostiziert. Ein solcher (kategorischer) Faktor ist der Zimmertyp, auf den die Person als Teil des Versicherungspakets Zugriff hat (z. B. VIP-Zimmer). Das Problem ist, dass einige Zimmertypen eine hohe Variabilität in Ansprüchen haben, was dazu führt, dass sie unbedeutende Prädiktoren sind (p-Wert so hoch wie 0,6 für diese Ebenen). Mein Vorschlag ist, zwei getrennte Modelle zu erstellen, eines mit Raumtyp als Prädiktor und eines ohne. Wenn eine Person Teil eines der Räume mit hoher Variabilität ist, sollte das Modell ohne Raumtyp als Prädiktor verwendet werden, andernfalls kann das Modell der besseren Anpassung verwendet werden (hat einen höheren eingestellten R^2).bestimmte Ebenen von kategorialen Variablen insignifikant
Meine Frage ist, gibt es etwas inkorrekt mit diesem Verfahren?
Vielen Dank.