Ich habe ein Datenframe mit einer Spalte namens "Äußerungen", die Strings enthält (z. B .: "Ich möchte ein Bier haben" ist die erste Zeile). Was ich brauche ist, einen neuen Datenrahmen zu erstellen, der die Nummer jedes Buchstabens jeder Zeile von "Äußerungen" im Alphabet enthalten wird. Dies bedeutet, dass zum Beispiel im Falle von "Ich möchte ein Bier haben", ich die folgende Zeile bekommen muss: 9 23114141 81225 1 25518, da "I" der 9. Buchstabe des Alphabets ist, "W" der 23. und bald. Beachten Sie, dass die Leerzeichen "" beibehalten werden sollen. Was ich bisher getan haben ist folgende:Python - Erstellen von Datenrahmen durch Abrufen der Nummern von Buchstaben
for word in df2[['Utterances']]:
for character in word:
new.append(ord(character.lower())-96)
str1 = ''.join(str(e) for e in new)
Die oben kehrt die verkettete Zeichenfolge. Die obige Schleife iteriert jedoch nur einmal und die von str1 zurückgegebene Zeichenfolge weist nicht die erforderlichen Leerzeichen ("") auf. Und natürlich kann ich keine Möglichkeit finden, diese Zeilen in einen neuen Datenrahmen einzufügen.
Jede Hilfe würde sehr geschätzt werden. Danke.
OMG 6 Minuten früher? – Dark