2017-05-06 3 views
0

Ich versuche, in Namespace alle Seitentitel in Wikipedia zu erhalten mit der API, wie folgend: weiterWikipedia Titel Get API endlos sieht

https://en.wikipedia.org/w/api.php?action=query&format=xml&list=allpages&apnamespace=0&apfilterredir=nonredirects&aplimit=max&continue=-||&apcontinue=BASE_PAGE_TITLE 

Ich halte anfordernden diese URL und die Überprüfung der Antwort, wenn enthält Etikett. Wenn ja, dann verwende ich dieselbe Anfrage, aber ändere das BASE_PAGE_TITLE auf den Wert in einem fortlaufenden Attribut in der Antwort.
Meine Anwendungen wurden seit 3 ​​Tagen ausgeführt und die abgerufene Anzahl überschreitet 30M, während es in den Dumps etwa 13M ist.
keine Idee?

Antwort

0

Sie verwenden $ in Ihrer Abfrage anstelle von &. Es sollte sein:

https://en.wikipedia.org/w/api.php?action=query&format=xml&list=allpages&apnamespace=0&apfilterredir=nonredirects&aplimit=max&continue=-||&apcontinue=BASE_PAGE_TITLE 
+0

Vielen Dank für Ihre Kommentare. Es ist ein Tippfehler. Habe gerade meinen Code überprüft und ich benutze & –

+0

Du hast noch ein '$' da gelassen. – svick