my dataframe df:
index url
1 [{'url': 'http://bhandarkarscollegekdp.org/'}]
2 [{'url': 'http://cateringinyourhome.com/'}]
3 NaN
4 [{'url': 'http://muddyjunction.com/'}]
5 [{'url': 'http://ecskouhou.jp/'}]
6 [{'url': 'http://andersrice.com/'}]
7 [{'url': 'http://durager.cz/'}, {'url': 'http:andersrice.com'}]
8 [{'url': 'http://milenijum-osiguranje.rs/'}]
9 [{'url': 'http://form-kind.org/'}, {'url': 'https://osiguranje'},{'url': 'http://beseka.com.tr'}]
Ich möchte die Zeilen auszuwählen, wenn der letzte Eintrag in der Liste der Reihe von URL-Spalte ‚https‘ enthält, während das Überspringen fehlt Werte.Python Pandas überprüfen, ob das letzte Element einer Liste in einer Zelle bestimmte Zeichenfolge enthält
Meine aktuelle Skript
df[df['url'].str[-1].str.contains('https',na=False)]
Falsch zurück Werte für alle Zeilen, während einige von ihnen tatsächlich https enthält.
Kann jemand damit helfen?
Was ist 'print (Typ (df.ix [1, 'url']))'? – jezrael
@jezrael es ist Liste – UserYmY
als Ihr dtype Liste müssen Sie 'apply' verwenden:' df ['url']. Apply (Lambda x: 'https' in x [-1]) ' – EdChum