Mit tidytext, ich habe diesen Code:Entfernen Stoppwörter mit tidytext
data(stop_words)
tidy_documents <- tidy_documents %>%
anti_join(stop_words)
ich es die Stoppwörter in das Paket gebaut verwenden möchten einen Datenrahmen genannt tidy_documents in einen Datenrahmen mit dem gleichen Namen zu schreiben, aber mit den Wörtern entfernt, wenn sie in stop_words sind.
ich diesen Fehler:
Fehler: Keine gemeinsame Variablen. Bitte geben Sie by
param. Traceback:
1. tidy_documents %>% anti_join(stop_words)
2. withVisible(eval(quote(`_fseq`(`_lhs`)), env, env))
3. eval(quote(`_fseq`(`_lhs`)), env, env)
4. eval(expr, envir, enclos)
5. `_fseq`(`_lhs`)
6. freduce(value, `_function_list`)
7. withVisible(function_list[[k]](value))
8. function_list[[k]](value)
9. anti_join(., stop_words)
10. anti_join.tbl_df(., stop_words)
11. common_by(by, x, y)
12. stop("No common variables. Please specify `by` param.", call. = FALSE)
Klar 'tidy_documents' und' stop_words' keine Variablennamen teilen, so dass Sie die übereinstimmen müssen werde zwei Datasets mit dem Parameter 'by'. – Axeman
Die Spalte von 'stop_words' heißt' word', also benennen Sie entweder Ihre Spalte oder verwenden Sie den 'by' Parameter von' anti_join'. – alistaire
Wie lauten die Spaltennamen in 'tidy_documents'? Wir können Ihnen genau sagen, wie Sie den Join einrichten, wenn Sie ihn teilen. –