In meinem Verständnis dachte ich, PCA kann nur für kontinuierliche Funktionen durchgeführt werden. Aber bei dem Versuch, den Unterschied zwischen onehot Codierung und Label-Codierung zu verstehen, kam durch einen Eintrag in dem folgenden Link:PCA Für kategoriale Funktionen?
When to use One Hot Encoding vs LabelEncoder vs DictVectorizor?
Es besagt, dass eine heiße Codierung gefolgt von PCA ist eine sehr gute Methode, die im Grunde bedeutet, PCA wird für kategoriale Merkmale angewendet. Daher verwirrt, bitte schlagen Sie mich auf dem gleichen.
Dank für die ausführliche Erklärung. Können Sie mir bitte vorschlagen, wie Sie die Ergebnisse eines Hot-Encoders in Ihrem Code darstellen können. – vikky
Wenn ich mich richtig erinnere, projiziert der PCA-Algorithmus die Merkmale auf einen anderen Raum, indem er nach den Eigenvektoren und Eigenwerten auflöst. Dann schaut es sich die oberen N (3 in diesem Fall) größten Eigenwerte an und nimmt diese Eigenvektorkomponenten. Die Idee besteht darin, die nützlichsten Daten in weniger Features zu kodieren. – AlexG
danke youuuuuuu – vikky