2016-06-07 4 views

Antwort

1

Versuchen Sie, Duplikate im Fenster herauszufiltern? In diesem Fall, dass Sie eine bestimmte über ein Fenster von Abbildung Ihrer RDD zu einem Schlüssel-Wert-Paar, wo der Schlüssel ist eine Kopie des ursprünglichen Elements und der Wert ist nicht wichtig, sagen null emulieren können:

streamIDs 
    .mapToPair(lambda s : (s, null)) 
    .reduceByKeyAndWindow(lambda t1, t2 : t1, Duration(1000)) 
    .map(lambda (x, y) : x) 

Dieser Wille Erstellen Sie einen DStream mit unterschiedlichen Werten aus jedem gleitenden Fenster.

Falls Sie wollen auch die Anzahl der einzelnen Werte in jedem Fenster, gehen Sie wie folgt vor:

streamIDs 
    .mapToPair(lambda s : (s, 1)) 
    .reduceByKeyAndWindow(lambda t1, t2 : t1 + t2, Duration(1000)) 

Dies wird ein DSTREAM Wertzahl Paare schaffen, zum Beispiel ('A', 3), ('B', 5)...

Verwandte Themen