2016-05-19 6 views
0

ich in Scala kennen, können Sie in einer Parkett-Datei wie folgt lauten:Gibt es eine Möglichkeit, von Parkett-Dateien in hdfs in SqlContext von Mobius zu lesen?

//Create Spark Context 
val sparkConf = new SparkConf().setAppName(appName).setMaster(sparkMaster) 
val sc = new SparkContext(sparkConf) 
val sqlContext = new SQLContext(sc) 
import sqlContext.implicits._ 

val pf = 
     sqlContext.read.parquet(hdfsDataUri + "test.parquet") 
pf.registerTempTable("test") 

Gibt es eine Möglichkeit, dies mit Mobius (C# API für Spark) zu tun? Ich konnte nur eine Möglichkeit finden CSV-Dateien zu lesen. Ref: https://github.com/Microsoft/Mobius

Antwort

1

C# API for using Parquet in Apache Spark ist in Mobius verfügbar. Es folgt die C# -Implementierung der Apache Spark-Scala-Code in Ihrer Frage:

 var sparkConf = new SparkConf().SetAppName(appName).SetMaster(sparkMaster); 
     var sc = new SparkContext(sparkConf); 
     var sqlContext = new SqlContext(sc); 
     var pf = sqlContext.Read().Parquet(hdfsDataUri + "test.parquet"); 
     pf.RegisterTempTable("test"); 
+0

Vielen Dank lesen und schreiben! – user2608613

Verwandte Themen