2017-06-21 8 views
0

enter image description hereWie zählen, wie viele verschiedene Urls es

mit Pandas sind Wie kann ich trennen und wie viele unverwechselbare com.XXXXX.XXX zählen. Oder wie würde ich dies in einen lesbaren Datenrahmen mit allen möglichen com.XXXXX.XXX wie die Kopf- und wenn es keinen Eintrag gibt, dann repräsentiert sie als 0

jetzt die txt ist in diesem Format enter image description here

Antwort

0

Ich bin mir nicht sicher, dass ich dich verstehe. Sie möchten zuerst URLs in der Form com.XXXX.XXX von anderen trennen und dann zählen, wie viele verschiedene Sie haben? Ein Einzeiler sollte ausreichen, etwa so, wenn man annimmt, dass der Name der Urlsäule urls ist:

len(trainN_df[trainN_df["url"].str.contains("^com\.")].replace("^com\.","",regex=True).drop_duplicates()) 
Verwandte Themen