Kennt jemand, wie ich Websites abschaben kann, lesen Sie die URL-Liste IE aus einer TXT und schreiben Sie dann jedes URL-Ergebnis in eine TXT mit dem Namen eines aus einer TXT. So wird es die URL- und Namen-Dateien geben, aus denen der Code liest und den Body mit der entsprechenden Zeile aus der .txt-Datei schreibt. Der nächste, den ich gefunden habe, ist unter dem Code, aber das speichert alles in der einen .txt-Datei, die ein fester Name ist, keine Variable; und es liest die URLs aus einer Liste. Ich vermute, eine Schleife wäre der beste Weg, aber ich habe Code oder viel Hilfe für diese Art von Aufgabe nicht gesehen.Python-Website-Scraping mit Variablen aus Textdateien
import requests
from bs4 import BeautifulSoup
from collections import Counter
urls = ["http://en.wikipedia.org/wiki/Wolfgang_Amadeus_Mozart","http://en.wikipedia.org/wiki/Golf"]
with open('thisisanew.txt', 'w', encoding='utf-8') as outfile:
for url in urls:
website = requests.get(url)
soup = BeautifulSoup(website.content)
text = [''.join(s.findAll(text=True))for s in soup.findAll('p')]
for item in text:
print(item ,file=outfile,)
Vielen Dank für Ihre Hilfe im Voraus!
So haben Sie nicht versucht, sich einen Code zu schreiben, und suchen nur für jemand, der es für dich macht? –
Go google python lesen TXT-Datei Zeile für Zeile; Python schreibt Daten in eine Datei. – Bobby
Lesen 1. [fragen] 2. [mcve] – MYGz