2016-04-24 12 views

Antwort

0

können Sie registrieren die JavaRDD als Tabelle prdd und dann in SQL-Anweisungen

`Dataframe schemaPeople = sqlContext.createDataFrame (prdd, Person.class) verwendet wird; schemaPeople.registerTempTable ("Personen");

// SQL kann über RDDs ausgeführt werden, die als Tabellen registriert wurden.

Datenrahmen Jugendliche = sqlContext.sql ("SELECT sum (Alter), sum (Gehalt) FROM Menschen Gruppe von Namen)

// Die Ergebnisse von SQL-Abfragen sind Datenrahmen und unterstützen alle normalen RDD operations.`

Lesen sie mehr: http://spark.apache.org/docs/latest/sql-programming-guide.html#running-sql-queries-programmatically

+2

Bitte helfen sie mir zu verstehen, wenn ich diesen Code verwenden dann Datenrahmen ich verwende, aber ich will, es erreichen Dataset ich etwas fehlt bin.? – coder

Verwandte Themen