2016-04-13 22 views
0

Ich bin auf der Suche nach einer Möglichkeit, bestimmte Informationen von einer Webseite mit Qt zu bekommen. Bisher habe ich die QNetworkAccessManager verwendet und es geschafft, die HTTP-Antwort zu erhalten, die alles auf der Seite enthält.Abrufen bestimmter Informationen von einer Webseite

Was ist jetzt der richtige Weg, diese Informationen zu filtern und das XML zu analysieren, um nur die relevanten Informationen zu erhalten? Wenn Sie beispielsweise Wikipedia nach Informationen abfragen möchten, wie würden Sie nur die Informationen und nicht den Quellcode für die Seite speichern?

Antwort

0

Sie können den Inhalt analysieren, nur die Informationen abrufen, die Sie benötigen, und sie dann speichern.

Qt gibt Ihnen einige Werkzeuge, die dabei helfen.

Die wiki hat mehr Informationen darüber.

Sie können die XML Handling classes verwenden, wenn es eine gültige XML ist, können Sie ein anderes Tool verwenden, um eine fehlerhafte HTML-HTML-Seite in eine gültige XML zu konvertieren, wie in der wiki angegeben.

Zur Validierung und Reparatur HTML-Dateien können Sie mit libTidy

Verwandte Themen