Ich bin ein beginnender Programmierer, der versucht, eine HTML-Datei in einer Processing-Skizze zu analysieren. (Übrigens, wenn Sie Processing nicht kennen, kompiliert es nach Java und verwendet die gleichen Regex-Funktionen). Ich habe die HTML-Datei korrekt als einen einzelnen String mit SimpleML erfasst. Die Daten, die ich zu erfassen bin versucht, kommt aus einer Tabelle, wie so:Hilfe mit Regex in einer Verarbeitungsskizze?
<th>Name</th>
<th>John F. Kennedy</th>
<th>Lyndon Johnson</th>
<th>Richard Nixon</th>
usw.
Ich möchte die Namen der Kandidaten in einem Array parsen (Fallenlassen der „Name“).
Also versuchte ich zuerst
candidates = match(rawString,"<th>.*</th>");
, die die ganze Liste zurückgegeben.
Dann habe ich versucht
candidates = match(rawString,"<th>.{1,50}</th>");
die Dokumentation nur
<th>Name</th>
Die Verarbeitung kehrt sagt:
Wenn es Gruppen (durch Sätze von Klammern angegeben) in der regexp, dann wird der Inhalt jedes einzelnen im Array zurückgegeben. Das Element [0] einer regexp-Übereinstimmung gibt die gesamte übereinstimmende Zeichenfolge zurück, und die Übereinstimmungsgruppen beginnen bei Element [1] (die erste Gruppe ist [1], die zweite [2] usw.).
So, jetzt verschiedene Kombinationen von Gruppen und quantifiers versucht, ich habe, wie:
candidates = match(rawString,"(<th>.{1,50}</th>)*");
Aber es muss ein konzeptionelles Stück, das ich immer bin nicht sein, weil nichts funktioniert. Scheint so, als sollte das einfach sein, oder?
Verstrebungen für anti-regex-and-html Menge –