2
Durch R
, kann ich einfach einen Datenrahmen mit den Frequenzen bestimmter Zeichenfolge Muster aus String-Listen machen.Anzahl Vorkommen von Strings in einem Datenrahmen
library(stringr)
library(tm)
library(dplyr)
text = c('i am so hhappy happy now','you look ssad','sad day today','noway')
dat = sapply(c('happy', 'sad'), function(i) str_count(text, i))
dat = data.frame(dat)
dat = dat %>% mutate(Sentiment = (happy)-(sad))
Als Ergebnis kann ich ein Datenrahmen haben wie diese
happy sad Sentiment
1 2 0 2
2 0 1 -1
3 0 1 -1
4 0 0 0
In Python, ich
import pandas as pd
text = ['i am so hhappy happy now','you look ssad','sad day today','noway']
????
dat = pd.DataFrame(dat)
dat['Sentiment'] = dat.apply(lambda c: c.happy - c.sad)
Rest Codes außer
sapply()
Was würde davon ausgehen kann ????
sein?
Und nur für noch mehr Details, können Sie bauen, dass 'df' oben aus Ihrer' Text' Liste, indem Sie 'df = pd.DataFrame ([[Satz] für Satz im Text], Spalten = ['Text']) ' – Paul
@Paul Es gibt einen einfacheren Weg. ;-) –
Ahh, tatsächlich gibt es! Ich hätte wahrscheinlich daran denken sollen. Danke, dass du es hinzugefügt hast. – Paul