2016-05-04 22 views
2

Ich versuche, Text aus mehreren Pubmed-Papieren mit wget zu bekommen, aber scheint NCBI-Website dies nicht zu erlauben. Irgendwelche Alternativen?Alternativen für wget gibt 'ERROR 403: Forbidden'

Bernardos-MacBook-Pro:pangenome_papers_pubmed_result bernardo$ wget -i ./url.txt 
--2016-05-04 10:49:34-- http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4560400/ 
Resolving www.ncbi.nlm.nih.gov... 130.14.29.110, 2607:f220:41e:4290::110 
Connecting to www.ncbi.nlm.nih.gov|130.14.29.110|:80... connected. 
HTTP request sent, awaiting response... 403 Forbidden 
2016-05-04 10:49:34 ERROR 403: Forbidden. 

--2016-05-04 10:49:34-- http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4547177/ 
Reusing existing connection to www.ncbi.nlm.nih.gov:80. 
HTTP request sent, awaiting response... 403 Forbidden 
2016-05-04 10:49:34 ERROR 403: Forbidden. 

Antwort

3

Set benutzerdefinierte User-Agent wie folgt aus:

wget --user-agent="Mozilla" http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4560400/ 
+0

Das funktionierte, aber warum? – sherrellbc