einstellen Nachdem ich eine Datei (mit Spark-2.0) mit dem Schema abgeleitet lesen:Kraft spark.read() mit InferSchema = True numerische Spalten NULL-
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('foo').getOrCreate()
df = spark.read.csv('myData.csv', inferSchema=True)
alle Spalten, string
und numerisch, sind nullfähig.
Wenn ich jedoch die Datei mithilfe eines expliziten Schemas lese, sind nur die Spalten string
nullfähig.
Gibt es eine Möglichkeit, read()
mit inferSchema=True
zu erzwingen, Nullgültigkeit auf dieselbe Weise wie bei einem expliziten Schema festzulegen?