Ich habe eine site, die ich mit Unix wget
herunterladen möchte. Wenn Sie den Quellcode und den Inhalt der Datei betrachten, enthält sie den Abschnitt SUMMARY. jedoch nach einer wget Befehl wie folgt ausführen:Wie 'wget' aktivieren, um den gesamten Inhalt von HTML mit Javascript herunterladen
wget -O downdloadedtext.txt http://www.ncbi.nlm.nih.gov/IEB/Research/Acembly/av.cgi?db=mouse&c=gene&a=fiche&l=2610008E11Rik
Der Inhalt des downdloadedtext.txt
ist unvollständig und anders mit dem Quellcode dieser Site. Zum Beispiel enthält es keinen Abschnitt ZUSAMMENFASSUNG. Gibt es eine korrekte Methode, um den vollständigen Inhalt korrekt zu erhalten?
Der Grund, warum ich dies frage, weil ich den Download von verschiedenen Werten in diesem HTML automatisieren möchte.
Ich verstehe nicht. Welche Unterschiede gibt es im Quellcode? Und was hat Javascript damit zu tun? –
@Pekka: Der Körper, der Javascript enthält, wird nicht heruntergeladen. Bitte versuchen Sie es zu sehen. – neversaint
Ich habe jetzt nicht wget handy (auf einer Windows-Maschine). Ist der tatsächliche * body * anders oder werden die js-Dateien nicht heruntergeladen? –