Ich habe eine Datei und unten ist ein Ausschnitt davon, wie es aussieht. Ich habe diese Wörter mit einer zugehörigen Punktzahl. Wie kann ich die Duplikate entfernen, die eine niedrigere Punktzahl haben? Ich meine "frisch" hat zwei Punkte (7.781 und 5.750), ich versuche "frische" und andere doppelte Begriffe mit der niedrigeren Punktzahl zu entfernen. Ist es möglich, so?Wie entferne ich doppelte Begriffe mit Bewertungen aus einer Textdatei?
['norwegian', 7.781341354126479]
['rp', 7.7802465301013]
['fresh', 7.7721646246757885]
['tick', 7.7721646246757885]
['wood', 7.7721646246757885]
['fresh', 5.750711529372451]
['tick', 4.750711529372451]
Ich habe versucht, das folgende zu tun, um die Datei zu einem Wörterbuch zu setzen und die Wörter und die Kerben zu trennen.
from collections import defaultdict
d={}
last_seen=set()
with open("scored.txt","r") as filer:
for line in filer:
term, score= line.strip().split(",",1)
if line not in last_seen:
last_seen.add(line)
Wo ist Ihr Code? – Vader
Enthält Ihre Datei tatsächlich die Klammern und Kommata? Bitte schreiben Sie auch den Code, den Sie ausprobiert haben. – mhawke
Hinzugefügt. Ja, die Datei hat genau das oben gezeigte Format. – minks