Verwenden Sie einfach readLines
und dann strsplit
jede Zeile von \\t+
.
file <- readLines("PATHTO/actorstest.txt", encoding = 'Latin-1')
# delete empty rows
file <- subset(file, !grepl('^\\s*$', file))
# split in two columns by one or more tabs
file <- strsplit(x = file, split = '\\t+')
# row bind all itms and create df
df <- data.frame(do.call(rbind, lapply(file, unlist)))
df
was in
X1 X2
1 Aa, Brynjar Adj¯ solidaritet (1985) [P¯nker] <40>
2 Aa, Henk Cuby + Blizzards: 40 jaar de blues (2006) (V) [Himself]
3 Aa, Henk van der "De slimste mens ter wereld" (2012) {(#5.10)} [Himself] <4>
4 "De slimste mens ter wereld" (2012) {(#5.11)} [Himself] <3>
5 "De slimste mens ter wereld" (2012) {(#5.8)} [Himself] <3>
6 "De slimste mens ter wereld" (2012) {(#5.9)} [Himself] <4>
7 Aab, Vanessa (I) Frollein FrappÈ (2014) [Greta]
8 Nach einem Traum (2014) [Elke]
9 Aabear, Jim Paradise Recovered (2010) [Richard] <8>
10 Senses (2009) [Mr. Cohen]
11 Aabed, Essam Abu Omar (2013) [Omar's Boss] <10>
12 Aabedlaoui, El Hassan La vache (2016) [Aissaoui 2] <80>
13 Aabeel Czeski Friends (2004) (V)
14 Aabel, Anders Kontakt! (1956) <7>
Beachten Sie, dass einige Akteure mehrere Einträge in Spalte zwei. Ich überlasse es dir.
Dies könnte Ihnen helfen https://github.com/hadley/data-movies –
Danke - das ist etwas, das ich vor ein paar Wochen ausprobiert habe, als ich anfing, aber leider scheint es, dass der Schöpfer das Projekt aufgegeben hat bevor es vollständig war. Das Endergebnis davon ist ein Datenrahmen mit allen Filmen, aber nur einige der Variablen (Genre, Bewertung, Stimmen, aber keine Schauspieler, etc.) – tsouchlarakis
Aber der Code führt Sie zu den Lösungen. Siehe meine Antwort. –