Ich versuche, eine Datei in PIG zu laden, die 2 Wörter mit Leerzeichen oder Tabs getrennt werden können (kann mir mehr als eins). Gibt es eine Möglichkeit, die Dateiladung mit einer Regex für Leerzeichen zu begrenzen? Oder gibt es einen anderen Weg, um das Folgende zu erreichen?Lade Datei in Schwein auf Whitespace
Eingang:
COUNTESS This young gentlewoman had a father,--O, that`
Ausgang:
COUNTESS
This
young
gentlewoman
had
a
father,--O,
that
Es wäre toll, auch ein Komma als Trennzeichen zu haben, aber das wäre es komplizierter zu machen. Fürs Erste sollte nur das Leerzeichenbegrenzer für mich funktionieren.