Ich verwende Python pattern.web-Modul, um einige grundlegende Web-Mining-Aufgaben durchzuführen. Ich versuche, nur die ersten 15 Schlüsselwörter zu extrahieren und jedes Schlüsselwort mit einem Komma ","
anzufügen. Also, meine resultierende Datei enthält eine Liste von Schlüsselwörtern, die wie folgt aussieht: JetztDOM Parsing eines Dokuments: Hinzufügen und Entfernen von Komma basierend auf Bedingung
scallops, scallop shells, sea scallops, scallop shell, how to cook scallops, scallop shells for sale, frozen scallops, fresh scallops, dry scallops, cooking scallops, baptism shell, scallop recipe, large scallop shells, diver scallops, bay scallops,
, ich will nicht das Komma ","
nach dem 15./letzte Stichwort "bay scallops,"
Ich brauche ein wenig Hilfe mein Code ändern unten, so dass Bei der 15. Iteration fügt der Code das Komma nicht hinzu. Wenn es eine einfache for-Schleife wäre, die ein Array iteriert, könnte ich iteritems()
verwenden, um Schlüssel und Wert zu extrahieren und eine if-Bedingung hinzuzufügen, aber hier kann ich nicht herausfinden, wie es geht.
from pattern.web import URL, DOM, plaintext, extension
folder = '../some_folder'
dom = DOM(content)
print "traversing ... "
for e in dom('td.spgb-f')[:15]:
for a in e('span.sptc-e'):
File = open(os.path.join(folder, "meta_keywords.html"), mode="a")
print ('adding %s' %(plaintext(a.content)))
File.write(plaintext(a.content) + ", ")
File.close()
Sorry, ich habe Ihre Antwort nicht sehen, bevor ich gepostet habe. Meins ist im Wesentlichen das Gleiche. :) –