0

Als mein Funkenjob bei aws-emr Ausführung bekam ich diese Fehlermeldung, wenn Avro-Datei von s3 Eimer zu lesen versuchen: Es ist mit Versionen passieren:Ausfallen avro von S3 Lesen mit Funken in emr

  • emr - 5.5 0,0
  • emr - 5.9.0

Dies ist der Code:

val files = 0 until numOfDaysToFetch map { i => 
    s"s3n://bravos/clicks/${fromDate.minusDays(i)}/*" 
} 
spark.read.format("com.databricks.spark.avro").load(files: _*) 

der ex nehmung:

java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: 1037330823653531755-2017-10-16T03:06:00.avro 
    at org.apache.hadoop.fs.Path.initialize(Path.java:205) 
    at org.apache.hadoop.fs.Path.<init>(Path.java:171) 
    at org.apache.hadoop.fs.Path.<init>(Path.java:93) 
    at org.apache.hadoop.fs.Globber.glob(Globber.java:241) 
    at org.apache.hadoop.fs.FileSystem.globStatus(FileSystem.java:1732) 
    at org.apache.hadoop.fs.FileSystem.globStatus(FileSystem.java:1713) 
    at com.amazon.ws.emr.hadoop.fs.EmrFileSystem.globStatus(EmrFileSystem.java:362) 
    at org.apache.spark.deploy.SparkHadoopUtil.globPath(SparkHadoopUtil.scala:237) 
    at org.apache.spark.deploy.SparkHadoopUtil.globPathIfNecessary(SparkHadoopUtil.scala:243) 
    at org.apache.spark.sql.execution.datasources.DataSource$$anonfun$14.apply(DataSource.scala:374) 
    at org.apache.spark.sql.execution.datasources.DataSource$$anonfun$14.apply(DataSource.scala:370) 
    at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241) 
    at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241) 
    at scala.collection.immutable.List.foreach(List.scala:381) 
    at scala.collection.TraversableLike$class.flatMap(TraversableLike.scala:241) 
    at scala.collection.immutable.List.flatMap(List.scala:344) 
    at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:370) 
    at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:152) 

`

+0

sie bitte Ihren Code-Block auf die Frage hinzufügen –

+0

bitte @.. ThiagoBaldim, ich füge es hinzu – LeonB

Antwort

0

Path Doppelpunkte nicht unterstützt. Es interpretiert 1037330823653531755-2017-10-16T03: als ein URI-Schema und dann unglücklich über jede fillowing "/" ... selbst wenn es so weit gekommen wäre, dann würde es auf "kein Dateisystem für Schema" 1037330823653531755-2017-10-16T03 scheitern "

Fix: verwenden sie nicht ":" in Dateinamen

0

ich die letzten entfernt * ab/* und es funktioniert nur

Verwandte Themen