Möchten die letzten 50 Zeilen des folgenden Datenrahmens mit etwas wie dem tail function
unten durch Zeilenbereich mit Sparklyr, ohne arrange
oder collect
- einige meiner Frames sind groß und haben keine sequentiellen Spalten.Letzte Zeilen von einem Spark DataFrame (mit sparklyr & dplyr)
library(sparklyr)
library(dplyr)
library(Lahman)
spark_install(version = "2.0.0")
sc <- spark_connect(master = "local")
batting_tbl <- copy_to(sc, Lahman::Batting, "batting"); batting_tbl
batting_tbl %>% count # Number of rows
# n
# <dbl>
# 1 101332
batting_tbl %>% tail(., n = 50)
# Error: tail() is not supported by sql sources
Warum vor Rufname Sie nicht endgültig sortiert data.frame Schwanz? 'tail (namedData, n = 50)' – CCurtis
Ihr Vorschlag funktioniert bei der Sortierung nach Index und dann auf einem Spark DataFrame. – eyeOfTheStorm