von einem pyspark SQL Datenrahmen wiepyspark, Funken:., Wie letzte Zeile auszuwählen und auch, wie pyspark Datenrahmen durch den Index
name age city
abc 20 A
def 30 B
Wie für den Zugriff auf die letzte Reihe bekommen (wie von df.limit (1) Ich kann die erste Zeile des Datenrahmens in einen neuen Datenrahmen bringen).
Und wie kann ich auf die Datenframezeilen per Index zugreifen.wie Zeilennr. 12 oder 200.
In Pandas kann ich
df.tail(1) # for last row
df.ix[rowno or index] # by index
df.loc[] or by df.iloc[]
ich nur neugierig bin tun, wie pyspark Datenrahmen in einer solchen Art und Weise oder alternative Möglichkeiten zuzugreifen.
Dank
Hallo mit erstellen, bin zur Handhabung i die letzte row by autoincrement ID Spalte hinzufügen Weg oder für kleine df, ich war mit toPandas(). Tail (1). Wie auch immer, danke für die Antwort. Und dieser Indexzugriff von Datenframes, die ich gefragt habe, ist wegen, manchmal muss ich einen Spaltenwert ersetzen (durch irgendeinen Col-Wert Gleichheitsbedingung und dazu tue ich Hilfe von einem udf). Aber wenn ich nur eine Instanz (bestimmte Index Nr. Zeile) ersetzen möchte, dann hatte ich keine Möglichkeiten, das zu tun. Jetzt kann ich "zipWithIndex" wie vorgeschlagen verwenden. Vielen Dank. – Satya