wenn ich die Hauptdatei von meinem Crawler ausführen Ich bekomme diese 'UTF-8' Codec kann Byte 0x8b in Position 1 nicht dekodieren: ungültiges Start-Byte . Ich würde Code schreiben, aber es ist ein großes Programm und ich bin unsicher, wo oder was das Problem ist. Die Seite ist hardcore verschlüsselt, könnte dies das Problem sein?Web-Crawler kann keine Links aus https://steemit.com/trending
1
A
Antwort
0
Wie andere bereits erwähnt haben, wäre ein Beispiel von immenser Hilfe.
Aber wenn ich einen gebildeten Stab im Dunkeln nehmen musste ... ist das spezifische Problem, das Sie haben, dass die Seite, die Sie scrapen, wahrscheinlich einige Unicode-Zeichen hat, die nicht gespeichert werden können, ohne verschlüsselt zu werden. Also ... versuchen Sie, die Daten wie folgt zu kodieren:
item['title'] = however_you_got_title.encode('utf-8')
+0
krank geben es einen Schuss –
Verwandte Themen
- 1. Richtlinien für gute Webcrawler "Etikette"
- 2. Webcrawler überspringen URLs
- 3. Webcrawler mehrere Seite Iteration
- 4. Erkennt der Webcrawler Cookies?
- 5. Kein Typ Objekt hat keine Attribut Fehler in Webcrawler Python
- 6. XPath wählen Sie Links, aber keine Bilder
- 7. R WebCrawler - XML-Inhalt scheint nicht XML zu sein:
- 8. Wie kann ein Perl-Webcrawler einem ASP.NET-Postback folgen?
- 9. UITextView keine Links erkennen
- 10. Gute Webseiten zum Testen von Webcrawler auf
- 11. Oracle verbinden links keine Zeilen
- 12. Links aus dem Text entfernen
- 13. dirPagination - zeigt keine Paging-Links?
- 14. Kann keine Verbindung aus Anwendungs
- 15. Das Extrahieren von Ankerlinks zusammen mit zugehörigem Text von einer Site mit webcrawler gibt nichts aus.
- 16. nsis Deinstallationsprogramm entfernt keine Links
- 17. Mysql Links Join keine Nullwerte
- 18. Ich kann keine Links zum Drucken mit BeautifulSoup bekommen
- 19. Python kann keine Links von der Webseite bekommen
- 20. Xamarin iOS Universal Links - Kontrollkästchen kann keine verknüpften Domänen aktivieren
- 21. Webscraping - Python - Kann keine Links in HTML finden
- 22. Python - Kann keine Links anderer Sprachen mit os.walk erkennen
- 23. Rails relative_url passt keine Links an
- 24. Symbolleiste - Keine Schubladenansicht mit Schwerkraft gefunden LINKS
- 25. Ionic 2 InAppBrowser lädt keine eingefügten Links
- 26. Keine Route stimmt überein [POST] "/ Links/Neu"
- 27. MariaDB: LINKS OUTER JOIN gibt keine Zeile
- 28. Docker-compose Lauf setzt keine Links
- 29. Bootstrap Dropdown-Button öffnet keine Links
- 30. schöne Suppe Parser finden keine Links
Vielleicht möchten Sie [ask] und [mcve] lesen. – boardrider
Warum ist das sehr klar und ich habe das gelesen? –
Wenn ich wüsste, wo der Fehler war, würde ich es einfach nur sehen wollen, was ein anderer denkt. –