Ich versuche, Links in Paginierung von GitHub-Repositorys zu verschrotten Ich habe sie getrennt geschabt, aber was ich jetzt will, ist es mit einer Schleife zu optimieren. Irgendeine Idee, wie kann ich es tun? hier ist der CodeScraping mehrere Seiten mit jsoup
ComitUrl= "http://github.com/apple/turicreate/commits/master";
Document document2 = Jsoup.connect(ComitUrl).get();
Element pagination = document2.select("div.pagination a").get(0);
String Url1 = pagination.attr("href");
System.out.println("pagination-link1 = " + Url1);
Document document3 = Jsoup.connect(Url1).get();
Element pagination2 = document3.select("div.pagination a").get(1);
String Url2 = pagination2.attr("href");
System.out.println("pagination-link2 = " + Url2);
Document document4 = Jsoup.connect(Url2).get();
Element check = document4.select("span.disabled").first();
if (check.text().equals("Older")) {
System.out.println("No pagination link more");
}
else { Element pagination3 = document4.select("div.pagination a").get(1);
String Url3 = pagination3.attr("href");
System.out.println("pagination-link3 = " + Url3);
}
Hat Ihr Problem gelöst ist? sonst werde ich dir helfen. –