Ich arbeite an Versicherungsbetrug Datensatz mit meist kategorischen Variablen wie Altersnachweis, Bildungsniveau, Beziehungsmanager Code.Wie werden kategoriale Variablen behandelt, während Anomalien erkannt werden?
Um Anomalien in diesem Datensatz zu erkennen, habe ich auf Basis der Häufigkeitszählung kategorisch in numerische umgewandelt und den Anteil der Ebenen berechnet.
Ist das der richtige Weg? Wenn nicht, dann schlagen Sie bitte eine Möglichkeit vor, mit kategorialen Variablen umzugehen und Ausreißer zu erkennen.