Reaktor noob hier.Reaktor 3.x (Java): für das Abstreifen des Netzes
Dies ist eher eine HowTo Frage.
Angenommen, ich habe eine Website, die ich mit einem seitenweisen Suchergebnis auskratzen möchte. Die Anzahl der Suchergebnisseiten ist unbekannt. Jede Suchseite hat einen Link zur nächsten Seite. Ich möchte alle Suchergebnisse von allen Seiten scrappen und jedes Suchergebnis verarbeiten.
Wie kann ich Reactor (Mono/Flux) verwenden, um dies in Java zu erreichen?
Ich möchte dies als "reaktiv" wie möglich tun.
Grundsätzlich ist der Reaktor (3.x) Version des folgenden Imperativ Pseudo-Code:
String url = "http://example.com/search/1";
Optional<Document> docOp = getNextPage(url); (1)
while (docOp.isPresent()) {
Document doc = docOp.get();
processDoc(doc); (2)
docOp = getNextPage(getNextUrl(doc)); (3)
}
// (1) Get the first page of search results
// (2) Process all the search results on this page asynchronously
// (3) Find the next page URL, and get that page