I PIG bin mit Gruppen von Tupeln zu erzeugen, wie folgt:PIG: Erhalten Sie alle Tupel aus einer gruppierten Tasche
a1, b1
a1, b2
a1, b3
...
->
a1, [b1, b2, b3]
...
Diese einfach ist und funktioniert. Aber mein Problem ist folgendes zu erhalten: Aus den erhaltenen Gruppen, würde Ich mag eine Menge aller Tupel in der Gruppe Tasche generieren:
a1, [b1, b2, b3]
->
b1,b2
b1,b3
b2,b3
Dies wäre einfach, wenn ich könnte Nest „foreach“ und zunächst Iterierte über jede Gruppe und dann über ihre Tasche.
Ich nehme an, dass ich das Konzept falsch verstehe, und ich werde Ihre Erklärung schätzen.
Danke.
Laurens ist direkt zu erzeugen. Dieses UDF macht genau das, was Sie brauchen, und es ist auch viel effizienter als eine reine Pig-basierte Lösung mit kartesischem Produkt. Die URL hat sich übrigens geändert: [UnorderedPairs] (http://datafu.incubator.apache.org/docs/datafu/1.2.0/datafu/pig/bags/UnorderedPairs.html) – matterhayes