2016-09-05 3 views
-1

Ich versuche die ersten und letzten 1000 Zeilen mit "prettify" von BeautifulSoup auszudrucken. Ich habe Kafkas The Metamorphosis auf meine Festplatte heruntergeladen und ich habe erfolgreich ein BeautifulSoup Objekt erstellt:Wie man die ersten und letzten 1000 Zeilen mit schöner Suppe ausdruckt

Aufgrund captcha Probleme mit der Gutenberg-Website, sparte ich eine Kopie des Dokuments auf meiner Festplatte

page = open('meta.htm', 'r').read() 
soup = BeautifulSoup(page, "lxml") 

Wie verwende ich soup.prettify() die erste und die letzten 1000 auszudrucken. Zeilen des Dokuments?

Antwort

1

Nur Scheibe sie:

result = soup.prettify().splitlines() 
print('\n'.join(result[:1000] + result[-1000:])) 
+0

Das hat super funktioniert. Vielen Dank! Wie würde ich diesen Code ändern müssen, wenn ich nur die ersten 1000 Zeichen anstelle der ersten 1000 Zeilen des Dokuments ausdrucken wollte? – James

+0

@James sicher, mach einfach das 'print ('\ n'.join (result [: 1000]))' für die ersten 1000 und 'print (' \ n'.join (result [-1000:]))' für die letzten 1000. – alecxe

Verwandte Themen