2017-11-28 3 views
6

Ich benutze twitter API, um Gefühle zu erzeugen. Ich versuche eine Wortwolke basierend auf Tweets zu generieren.Wordcloud schneidet Text

Hier ist mein Code eine Wordcloud

wordcloud(clean.tweets, random.order=F,max.words=80, col=rainbow(50), scale=c(3.5,1)) 

Ergebnis für diese zu erzeugen:

für diese
pal <- brewer.pal(8,"Dark2") 

wordcloud(clean.tweets,min.freq = 125,max.words = Inf,random.order = TRUE,colors = pal) 

Ergebnis:

enter image description here

ich auch schon versucht, diese

enter image description here

Fehle ich etwas? Diese

ist, wie ich erhalte und Reinigung Tweets:

#downloading tweets 
tweets <- searchTwitter("#hanshtag",n = 5000, lang = "en",resultType = "recent") 
# removing re tweets 
no_retweets <- strip_retweets(tweets , strip_manual = TRUE) 

#converts to data frame 
df <- do.call("rbind", lapply(no_retweets , as.data.frame)) 

#remove odd characters 
df$text <- sapply(df$text,function(row) iconv(row, "latin1", "ASCII", sub="")) #remove emoticon 
df$text = gsub("(f|ht)tp(s?)://(.*)[.][a-z]+", "", df$text) #remove URL 
sample <- df$text 


    # Cleaning Tweets 
    sum_txt1 <- gsub("(RT|via)((?:\\b\\w*@\\w+)+)","",sample) 
    sum_txt2 <- gsub("http[^[:blank:]]+","",sum_txt1) 
    sum_tx3 <- gsub("@\\w+","",sum_txt2) 
    sum_tx4 <- gsub("[[:punct:]]"," ", sum_tx3) 
    sum_tex5 <- gsub("[^[:alnum:]]", " ", sum_tx4) 
    sum_tx6 <- gsub("RT ","", sum_tex5) 

    # WordCloud 

    # data frame is not good for text convert it corpus 
    corpus <- Corpus(VectorSource(sum_tx6)) 
    clean.tweets<- tm_map(corpus , content_transformer(tolower)) #converting everything to lower cases 
    clean.tweets<- tm_map(guj_clean,removeWords, stopwords("english")) #stopword are words like of, the, a, as.. 
    clean.tweets<- tm_map(guj_clean, removeNumbers) 
    clean.tweets<- tm_map(guj_clean, stripWhitespace) 

Vielen Dank im Voraus!

+0

Können Sie den Code teilen, den Sie zum Erstellen des clean.tweet-Objekts verwendet haben? Ich habe keine Pblm, die auf meinem Rechner eine Wordcloud erzeugt. Gibt es eine Chance, dass Sie vorher eine 'par()' Option angegeben haben? –

+0

@ColinFAY überprüfen Sie bitte die aktualisierte Frage. Ich verwende nicht Par() in meinem Code –

Antwort

0

Versuchen Sie, die Skala auf Ihrer Wordcloud von c (3.5,1) zu c (3.5,0.25) zu ändern.

wordcloud(clean.tweets, random.order=F,max.words=80, col=rainbow(50), scale=c(3.5,0.25))