Ich versuche, ein Programm (für die Praxis) zu machen, die zählen, wie viele Kapitel und Verse in jedem Buch der Bibel .... Also sagen wir mal wenn ich es wissen will Gesamt Kapitel oder Verse in Buch 1, dann wird es mir die Gesamtzahl geben. Wenn ich nur die Anzahl der Vers in Kapitel 4 in Buch 2 wissen möchte, dann gibt es mir nur die Anzahl der Verse in diesem bestimmten Kapitel. Gleiches gilt für die Kapitel.Wie man zählt, wie viele Seiten auf einer Webseite mit Python
So, das war meine Logik sucht nach font class: tk4l
(der einzigartige Schriftgröße für den Körper des Kontextes ist) von dieser Website:
http://www.holybible.or.kr/B_NIV/cgi/bibleftxt.php?VR=NIV&VL=1&CN=1&CV=99
und wenn es die Schriftklasse findet dann 1 in der meine Anzahl der Kapitel und wenn nicht die Schriftklasse Bewegung auf das nächste Buch (book += 1
) und das gleiche tun finden ..
ich verwenden würde:
import requests
from bs4 import BeautifulSoup
import operator
def read_chapters(max_books, max_chapters):
book=1
chapter=1
while chapter <= max_chapters:
url = 'http://www.holybible.or.kr/B_NIV/cgi/bibleftxt.php?VR=NIV&VL={}&CN={}&CV=99'.format(book, chapter)
source_code = requests.get(url).text
soup = BeautifulSoup(source_code, "html.parser")
for bible_text in soup.findAll('font', {'class': 'tk4l'}):
und so weiter ...
Meine Frage ist ...
1) Wie kann ich das Kapitel Zählung drucken ?? 2) Ich habe keine Ahnung, wie ich die Anzahl der Strophen zählen sollte.
Ich habe gerade angefangen, Python zu studieren. Bitte helfen Sie mir dabei. T.T
können Sie mir bitte über die Seite Variable erklären? wie du teilst und was es bedeutet [0] ad [1] –
@YunTaeHwang Die Seitennummerierung auf der Webseite wird von zwei Pfeilen auf dieser Seite umschlossen. Wenn page.content als String verwendet wird, haben wir den gesamten Inhalt der Webseite als eine riesige Zeichenfolge. Da die Paginierungselemente alle durch & nbsp enden, können wir einfach über die ganze Zeichenfolge iterieren, in der Tat wird das Entfernen von allem, was mit .split beginnt, das gleiche Ergebnis ergeben. Aber manchmal möchten Sie vielleicht die Daten reduzieren, die Sie analysieren. Durch Aufspalten der Paginierungs-Gifs erhalten wir eine Liste. Mit der Indexierung habe ich genau den Teil der Seitenkette extrahiert, der die Kapitelnummern enthält. – Tristan
Es tut mir so leid, aber kannst du bitte etwas über die for-Schleife erklären, die du geschrieben hast .. wie Verse [i] == "> '?? hmmmmm wenn du nichts dagegen hast ... bitte –