Ich versuche, this website mit BeautifulSoup und Regex zu kratzen. Dabei stieß ich auf eine Frage, die "doppelte Anführungszeichen" hatte, und ich wollte die "doppelten Anführungszeichen" ersetzen und es als TXT-Datei speichern. Aber es ersetzt nicht die "doppelten Anführungszeichen". Wir haben versucht, .replace() -Methode, aber ich habe es versäumt. Der Code ist wie folgt:Python Schöne Suppe und Regex - doppelte Anführungszeichen nicht ersetzt
url = 'http://www.sanfoundry.com/operating-system-mcqs-process-scheduling-queue/'
r = requests.get(url)
soup = bs(r.content)
data = soup.find_all('div', {'class':'entry-content'})
data1 = data[0].text
pattern = r'^\d{1,2}[\.|\)]([\s|\S].*)|(^[a-z]\)\s.*)|^View Answer\s?(Answer:.*)'
#pattern = r'^\d{1,2}[\.|\)]\s*(.*)|(^[a-z]\)\s.*)|^View Answer\s?(Answer:.*)'
reg = re.compile(pattern)
#with open(r'C:\Users\dhvani\Google Drive\Python\Data Scraping\byb.txt', 'a') as f:
with open(r'C:\Users\Jeri_Dabba\Google Drive\Python\Data Scraping\byb.txt', 'a') as f:
for i in data1.split('\n'):
if reg.search(i).group(1):
y = reg.search(i).group(1)
y = y.replace('"', '')
f.write(y + "\n")
Als ich die TXT-Datei überprüft wurde die "doppelte Anführungszeichen" nicht ersetzt. Was könnte das Problem sein?
Ich bin neu in Python.
Wenn Sie bereits habe einfachen Text, auf dem du die Regex ablegst, bitte poste es hier. –