0
Ich habe eine txt, und dann lud ich Zeilen aus dem txt, mit diesem Skript:Wie kann ich Zeilen in Apache Pig filtern?
lines = LOAD '/user/hadoop/HDFS_File.txt' AS (line:chararray);
Ich brauche alle Linien zu filtern, mit einigen Worten. Ich meine:
wenn die Leitung:
'Hi, I'm lord Stark, how are you?'
Ich suche müssen: "how are you"
in der Linie für jede Zeile in einer txt und die Vorkommen zählen.
Ich habe versucht, mit:
sentences = FOREACH lines GENERATE (FILTER lines BY (f1 matches 'how are you')) AS sent;
Aber es funktioniert nicht. Bitte helfen Sie mir.