Ich bin neu in Web-scraping.I Daten von einer Website ist Schaben, wo ich erste Seite href gekratzt und ich gehe dann zu jedem href und finden Sie den ‚p-Tag‘ in der Klasse ‚adress data'.i will eine URL speichern, 'P-Tag' Daten in einer Zeile und zweite URL 'P-Tag' Tag in der zweiten Zeile.Meine Daten sind in 'myUrl'anhängig. Ich möchte Daten in CSV-Datei zB Adresse, LongitudeLatitude, Telefon, E-Mail, dann neue Zeile beginnt.Wie kann ich Scrap-Daten in der CSV-Datei hinzufügen?
hier ist mein Code:
from bs4 import BeautifulSoup
import requests
import csv
myUrl=[]
urls = ["http://www.shaditayari.pk/s&category=326&location=266&a=true&paged{}".format(i) for i in range(1, 10)] # make a url list and iterate over it
for url in urls:
r = requests.get(url)
print('idr1')
soup = BeautifulSoup(r.text, "html.parser")
for link in soup.find_all('a', {'main-link'}):
iurl=link.get('href')
r = requests.get(iurl)
print(iurl)
soup = BeautifulSoup(r.content, "lxml")
with open ('lhr.cv','wb') as file:
divs = soup.find_all('div',attrs={"class":"address-data"})
for div in divs:
myUrl.append(div.find('p').text)
#print(myUrl)
with open ('lhr.cv','w') as file:
writer=csv.writer(file)
for row in myUrl:
writer.writerow(row)
erwartete Ausgabe:
9 Fane Road، Lahore 54000, Pakistan|1.561381309140028|74.31484723624567|042-37363901-9|[email protected]/[email protected]/ [email protected]
1/E-3, Main Boulevard Gulberg III, Lahore|31.525700029363|74.34930089283|0305-2960614|https://www.facebook.com/pages/Zauk-Banquet-Hall/204612846290857
Öffnen Sie die CSV ** vor ** Sie 'supp.find_all'. Sie möchten eine Datei öffnen und ** dann ** die Daten schreiben. –
@ cricket_007 ich habe es geöffnet. –
Könnten Sie bitte ein Beispiel für eine URL nennen, die Sie ohne Python-Code/Formatierung abkratzen möchten? – cstaff91