2017-10-31 5 views
0

Ich versuche zu tun, diese Tabelle als CSV für alle 7 Seiten von jeweils 100 Zeilen in einem Python-Skript zu exportieren, aber eine in diesen Fehler unterhalb des Skripts läuft.Python: Keine Tabellen gefunden Muster '. +'

"http://www.nhl.com/stats/player?aggregate=1&gameType=2&report=points&pos=S&reportType=game&startDate=2017-10-19&endDate=2017-10-29&filter=gamesPlayed,gte,1&sort=points,goals"

import pandas as pd 

dfs = pd.read_html('http://www.nhl.com/stats/player?aggregate=1&gameType=2&report=skatersummary&pos=S&reportType=game&startDate=2017-10-19&endDate=2017-10-29&filter=gamesPlayed,gte,1&sort=points,goals,assists') 
df = pd.concat(dfs, ignore_index=True) 
df.to_csv("1019_1029.csv", index=False) 
print(df) 

Valueerror: Keine Tabellen Übereinstimmungsmuster gefunden '+'

+0

Aus dem Code sollten Sie Fehler von Undefined '' 'df''' erhalten, weil Sie es nicht vor einer Verwendung zuweisen. Verwenden Sie Jupyter Notebook zum Bearbeiten und Starten Ihres Codes? Denken Sie daran - es speichert den globalen Zustand, bis Sie "Kernel-Neustart" durchführen. –

+0

Ich wollte nicht auskommentieren. Ich habe etwas versucht und es versehentlich verlassen. Ich benutze nur Python Shell. –

Antwort

1

Diese Seite wird nicht mit pandas.read_html arbeiten. Nach pandas documentation:

This function searches for <table> elements and only for <tr> and <th> rows and <td> elements within each <tr> or <th> element in the table. <td> stands for “table data”.

Aber Website Sie versuchen, Anwendungen < div> Elemente für die Strukturierung von Daten in die Tabelle zu analysieren: Source code of reffered page

Daher müssen Sie benutzerdefinierte Lösung Parsen von Daten aus diesen lesen Seite? ˅.

+2

Mit den Klassennamen können Sie diesen HTML-Code in '

', '', '' usw. konvertieren. Sie können eine HTML-Parser-Bibliothek wie beautifulsoup verwenden, um sie zu konvertieren und dann die Ausgabe an 'pandas.read_html' zu übergeben. https://stackoverflow.com/questions/5289189/how-to-change-tag-name-with-beautifulsoup –

+0

Wie würde das in diesem Szenario genau Haken aussehen? –