diesen Datenrahmen AnbetrachtR Ersetzen Stoppwörter in einer Spalte von Listen aus
test = data.frame(language=c("german", "english"), text=I(list(c("und das Beil", "wichtige Thematik der"), c("some useful information", "the most unuseful product"))))
Ich brauche die Stoppwörter in jedem Vektor der Spalte „Text“ nach, welche Sprache der Zeilen gehört zu löschen. Eigentlich brauche ich nur zwischen Deutsch und Englisch unterscheiden, so dachte ich an mit ifelse wie dies in Kombination anwenden mit:
test[2] = apply(test, 1, function(x) ifelse(x[1] == "german", lapply(x[2], function(y)removeWords(y, stopwords("de"))), lapply(x[2], function(y)removeWords(y, stopwords("en")))))
Aber dies nicht funktioniert .. Vielleicht gibt es sogar einen eleganteren Weg zu löse das?
Was ist die gewünschte Ausgabe für Ihre Testdaten? – mathdotrandom
Die Ausgabe sollte in der Form sein, dass ich die Spalte "Text" ersetzen kann. Es sollte ein Vektor (oder eine Liste?) Sein, in dem jeder Eintrag eine Liste ist. – WinterMensch