Ich habe diesen Code zu berechnen doppelt in einem Datenrahmen mit Kosinus-Ähnlichkeit durch erstens: erste Schleife (nrow) mal in jedes Mal einen Tweet dann vergleicht die Cosinus-Ähnlichkeit Ergebnisse zu diesem Tweet mit andere Tweets mit der zweiten Schleife.verschachtelte For-Schleife in R-Sprache
Hier ist mein Code:
for (i in 1:nrow(temp)) {
dup=0
one_Tweets = tweets$Tweet[i]
cos_similarity = data.frame("v1"=NULL) # NULL So that don't write previous value
cos_similarity=data.frame(sim <- round(sim.strings(AllTweets,one_Tweets), digits = 3))
names(cos_similarity) = c("v1")
for (b in i+1:nrow(temp)) {
Tweet_cos=cos_similarity$v1[b]
if (Tweet_cos >= 0.900) {
count = count+1
tweets$flag[b]= 1
}else { #if (Tweet_cos <0.900) {
tweets$flag[b]= 2
}
Tweet_cos=0
}
dup=tweets$duplicate[i]= tweets$duplicate[i]+count
count = 0
}
ich ein Problem in der ersten Schleife haben, trat eine Zeit, obwohl die Anzahl von Tweets in Datenrahmen 10000 Tweets.
und ich bekomme die Fehlermeldung:
Error in if (Tweet_cos >= 0.9) { : missing value where TRUE/FALSE needed
Versuch 'Zusammenfassung (temp) replizieren', um zu sehen, ob Sie 'NA' Werte im Tweet_cos – Bulat
in Umwelt Tweet_cos Wert = NA_real_, nach dem Gebrauch Zusammenfassung (temp) ich sehe Werte – user3588494
siehe Ergebnis: 'Zusammenfassung (Tweet_cos) min. 1. Qu. Mittlerer Mittelwert 3rd Qu. Max. NA's NA NA NA NaN NA NA ' – user3588494