Ich versuche Spark zu lernen. Ich habe eine org.apache.spark.sql.Column
, die ich als DataFrame
einlesen. Und dann versuche ich es zu filtern, um eine Bedingung auf einer Spalte:Einen DataTypes.DateType definieren
val resultDataFrame = dataFrame.filter(col("DATECOL") >= date)
Die DATECOL
als DataTypes.DateType
in den Datenrahmen gelesen werden. date
ist eine Variable, die ich hardcodieren muss.
Was ich versuche, ist, herauszufinden, wie kann ich definieren date
das heißt, wie kann ich eine Instanz von DataTypes.DateType
oder konvertieren erstellen, um es von einem String
oder so, so dass ich den obigen Ausdruck ausgeführt werden kann. Ich habe versucht, eine String
und es gibt keinen Fehler, aber es gibt keine Ergebnisse, wo es sollte.
Ah, das Java Datum verwenden, dank dachte! – rgamber
Halt, ein 'String' funktioniert auch! Ich glaube, ich habe einen Fehler gemacht, als ich die Ergebnisse früher betrachtete. – rgamber
Hmm. Eine Reihe von Standardformaten funktioniert, dies ist nur für den Fall, dass Sie einige [Sonderfall] haben (http://stackoverflow.com/questions/41703517/create-a-new-column-based-on-date-checking) . – Psidom