ich eine bigdata in Form einer Tabelle haben:Wie die identischen Zeilen zu finden, basierend auf einer Spalte und beschriften Sie sie in Gruppen
Filename A B
xxxxx 1 2
xxxxx 3 4
xxxxx 5 5
xxxxx 6 .
xxxxx . .
yyyyy . .
yyyyy
yyyyy
yyyyy
zzzzz
zzzzz
Ich brauche die erste Spalte für alle Zeilen zu scannen (10.000 Zeilen approach) und sehen Sie, wo sich der Dateiname ändert und erstellen Sie eine Bezeichnung für jeden eindeutigen Dateinamen. Auf diese Weise hätte ich eine andere Spalte mit den erzeugten Etiketten erstellt.
file filename A B
1 xxxxx
xxxxx
xxxxx
2 yyyyy
yyyyy
yyyyy
3 zzzzz
zzzzz
Auch ich muss den maximalen Wert in Spalte A für jede eindeutige Datei (Datei 1, Datei 2 ...) finden. Irgendwelche Vorschläge würden geschätzt werden. Dank
Es funktioniert perfekt !! Vielen Dank – DaphFab