Ich bin relativ neu in Python. Ich habe eine Spalte mit Daten mit Zahlen und Text z.B.Extract Vektor von Zahlen aus einem String-Vektor
import pandas as pd
mycolumn=pd.Series(["I w0n 1200$ in poker and got 1050$ on my b111rthday",
"another month was b4d, I only earned 150$",
"d4d gave 2200, lost 0420$ in poker in 10570 Berlin"])
Ich möchte alle Werte nehmen über 1000, so dass:
result=pd.Series([[1200,1050],[],[2200,10570]])
Das Ergebnis muss nicht Pandas Serie sein. Irgendein anderes Format, in dem ich später leere Zellen oder etw verwenden kann, um den Rest meiner Daten zu unterteilen, reicht aus.
'\ d {4, } aber ja. –
Dies entspricht z. B. "0999", obwohl dies möglicherweise kein erwarteter Wert ist. –
Sie können sich an die Regex halten und '[1-9] \ d {3,}' machen, glaube ich. –