Wie Spark-Reihe aus der Liste der Schlüssel-Wert-Paare

Angenommen, ich habe habe eine Liste von Schlüssel-Wert-Paaren erstellen:Wie Spark-Reihe aus der Liste der Schlüssel-Wert-Paare

kvs = [('x', 0), ('a', 1)]

Jetzt habe ich mit der gleichen Reihenfolge einen Funken von kvs erstellen möchte von Schlüsseln wie in kvs.
Wie geht das in Python?

Quelle

2017-10-01 Michael

konvertieren ich zu dict und verwenden Row (** kvs) – Harry

Es behält nicht die Reihenfolge der Paare. – Michael

können Sie OrderedDict verwenden https://StackOverflow.com/Questions/38253385/building-a-row-from-a-dict-in-pyspark – Harry

Ich habe es noch nicht ausgeführt, aber können Sie überprüfen, sobald ich nach dem Ausführen bearbeiten werde, wenn fehlschlägt.

from pyspark.sql import Row 
kvs = [('x', 0), ('a', 1)] 
h = {} 
[h.update({k:v}) for k,v in kvs] 
row = Row(**h)

Quelle

2017-10-01 11:06:25 Harry

Danke, aber es behält nicht die Reihenfolge der Paare in 'kvs', – Michael

Überprüfen Sie, wie Sie die Bestellung mit OrderedDict https://StackOverflow.com/questions/38253385/building-a-row-from-a-dict-in-pypspark erhalten – Harry

Sie können:

from pyspark.sql import Row 

Row(*[k for k, _ in kvs])(*[v for _, v in kvs])

aber meiner Meinung nach ist es besser, haupt zu vermeiden. Abgesehen davon, dass es sich um eine praktische Klasse zur Darstellung lokaler Werte handelt, die vom JVM-Backend abgerufen werden, hat es in Spark keine besondere Bedeutung. In fast jedem Zusammenhang:

tuple(v for _, v in kvs)

ist tadellos gültiger Wiedereinbau für .

Quelle

2017-10-01 11:24:07 user6910411

Wie Spark-Reihe aus der Liste der Schlüssel-Wert-Paare

Antwort

Verwandte Themen