Ich habe eine Datei voller Strings (ihre .nt-Datei mit URIs) und der Einfachheit halber möchte ich die String-Werte in numerische Werte ändern.Zuweisen von eindeutigen numerischen Werten zu Distanz-Strings (Spark)
Zwei Faktoren sollten berücksichtigt werden: Generieren Sie einen eindeutigen numerischen Wert für jede einzelne Zeichenfolge. Die Möglichkeit, die ursprüngliche Zeichenfolge aus der generierten Nummer wiederherzustellen.
Meine Absicht ist es, die Datei in numerische Werte zu konvertieren und dann eine bestimmte Berechnung durchzuführen (was schnell ist, wenn die Werte numerisch sind) und dann das Ergebnis von numerisch in Strings umkehren.
Ich versuchte HashCode(), aber es garantiert nicht die Einzigartigkeit und es ist nicht reversibel.
Gibt es eine Empfehlung? Mein Code wird unter Spark, Scala und Java ausgeführt.
Danke
könnten Sie bitte Ihren Punkt ein wenig klären. Ich habe bereits versucht, ZipWithIndex, aber es gibt mir keine eindeutige int – saad
val Tage = Array ("Sonntag", "Montag", "Dienstag", "Mittwoch", "Donnerstag", "Freitag", "Samstag") days.zipWithIndex.foreach { Fall (Tag, Anzahl) => println (s "$ count ist $ Tag") } – KrazyGautam