In R kann ich dplyr::arrange
verwenden, um einen Datenrahmen durch eine temporäre Variable zu sortieren. Um zum Beispiel die NYC flights
Datensatz im nycflights13
Pakets kann ich durch Geschwindigkeit sortieren, indem die Berechnung dieses Wertes aus den distance
und air_time
Spalten:Werte in einem Pandas-Datenrahmen durch eine temporäre Variable sortieren
library(nycflights13)
arrange(flights, distance/air_time)
Ist es möglich, dies mit Pandas zu erreichen (ohne explizit eine neue zu schaffen Spalte, nach dieser Spalte sortieren und dann diese Spalte wieder entfernen)?
Nizza, das funktioniert! Hier ist die Syntax zum Sortieren des 'flights' Datenrahmens nach Geschwindigkeit:' flights.reindex ((flights.distance/flights.air_time) .sort_values (aufsteigend = False) .index) ' – cbrnr
Vielen Dank. Ich habe keine Beispieldaten (ich bin kein 'R' Benutzer, also erstelle ich Beispieldaten) – jezrael
Danke @jezrael - Ich habe die Daten auf GitHub gesetzt, falls Sie dieses spezifische Beispiel ausführen möchten: https: // github. com/cbrnr/py4ds/blob/master/flights.csv – cbrnr