2016-10-19 12 views
0


Ich bin derzeit Sentiment Analysis in r Lernen,

i teilweise steckengeblieben, wie man richtig lesen und die Daten in meinen Fall importieren,

ich mag wissen, wie die Daten unter Verwendung von Scan lesen() in r,
aber wie machen, dass es würde den weißen Raum zu zwischen Zeichenfolge in einer Zeile aus der txt lesen
Scan TXT-Datei mit dem weißen Raum halten zwischen Charakter

Fall:

beispielsweise

positive.txt enthalten:

Not Strong 


* die obige Zeichenfolge ohne Semikolon getrennt innerhalb txt Datei geschrieben oder Komma, Leerzeichen gerade Linie \ n


so, las ich, dass txt formatierte Datei mit diesem in r unter Verwendung von:

positive -> Scan ('positive.txt', was = '', sep = "\ n")

es gibt keine Fehler,

aber nachdem ich überprüfe,
das Hauptproblem wird durch die Verwendung Scan die importierte Datei lesen() den Leerraum zwischen Zeichen,
so vom Eingang positive.txt Datei lesen:

1) nicht stark

das Ergebnis unter Verwendung von Scan() in positive.txt Datei in r so enden wird:
1) Nicht
2) Strong

Was ich erwartet habe, ist:
wie man scan() Datei in r halten halten Leerraum von Zeichen innerhalb positive.txt:
1) nicht stark

das Ergebnis i erwartet noch:
1) nicht stark

* Anmerkung, die Nummer 1 ist nur ein Leitfaden wie eine Art Index, um diese Probleme zu verstehen.

+1

Ich denke, Sie möchten stattdessen 'readLines' – rawr

Antwort

0
$ cat /tmp/file.txt 
this is line 1 
this is line 2 
this is line 3 

in R:

file.contents <- readLines('/tmp/file.txt') 

file.contents 

# [1] "this is line 1" "this is line 2" "this is line 3" 

Viel Glück mit Sentiment Analysis, es ist ein großes Thema!

Verwandte Themen