Ich fange an, Python zu lernen und möchte BeautifulSoup verwenden, um die Elemente in den unten aufgeführten HTML zu extrahieren.So extrahieren Sie Elemente aus HTML mit BeautifulSoup
Diese html von einem Sprachaufzeichnungssystem genommen wird, die die Zeit und das Datum in Ortszeit protokolliert, UTC, Gesprächsdauer, angerufene Nummer, Name, Rufnummer, Name, etc
Es gibt in der Regel Hunderte dieser Einträge.
Ich versuche, die Elemente zu extrahieren und sie in einer Zeile in ein Komma-getrenntes Format zu drucken, um mit Anrufdetailaufzeichnungen von Anrufmanager zu vergleichen. Dies hilft zu überprüfen, ob alle Anrufe aufgezeichnet wurden und nicht verpasst wurden.
Ich glaube BeautifulSoup ist das richtige Werkzeug, um dies zu tun.
Kann mir jemand in die richtige Richtung zeigen?
<tbody>
<tr class="formRowLight">
<td class="formRowLight" >24/10/16<br>16:24:47</td>
<td class="formRowLight" >24/10/16 07:24:47</td>
<td class="formRowLight" >00:45</td>
<td class="formRowLight" >31301</td>
<td class="formRowLight" >Joe Smith</td>
<td class="formRowLight" >31111</td>
<td class="formRowLight" >Jane Doe</td>
<td class="formRowLight" >N/A</td>
<td class="formRowLight" >1432875648934</td>
<td align="center" class"formRowLight"> </td>
<tr class="formRowLight">
<td class="formRowLight" >24/10/16<br>17:33:02</td>
<td class="formRowLight" >24/10/16 08:33:02</td>
<td class="formRowLight" >00:58</td>
<td class="formRowLight" >35664</td>
<td class="formRowLight" >Billy Bob</td>
<td class="formRowLight" >227045665</td>
<td class="formRowLight" >James Dean</td>
<td class="formRowLight" >N/A</td>
<td class="formRowLight" >9934959586849</td>
<td align="center" class"formRowLight"> </td>
</tr>
</tbody>
https://www.crummy.com/software/BeautifulSoup/bs4/doc/ –
Ja, bs4 ist ein gutes Werkzeug zu erreichen, um diese Aufgabe zu erledigen. Wenn Sie sagen, drucken Sie sie in einer Zeile aus Meinst du, du willst *** alle *** der Informationen in einer einzigen Zeile gedruckt?Nur der Text in jedem Tag? Möchten Sie Zeilen trennen oder haben Sie einfach alle Daten zusammen? Etwas mehr Klarheit über die erwartete Leistung wäre hilfreich. Außerdem: Was hast du bisher versucht? – sytech
Ich suche etwas wie dieses: 24/10/16 17:33:02, 24/10/16 08:33:02, 00:58, 35664, Billy Bob, 227045665, James Dean, N/A, 9934959586849 Ich habe bei der Arbeit etwas Code ausprobiert, aber ich habe die Ergebnisse, die ich gesucht habe, nicht erreicht. – cpnhowdy