Angenommen, ich habe einen Python Pandas Datenrahmen mit 10 Zeilen und 16 Spalten. Jede Zeile steht für ein Produkt. Die erste Spalte ist Produkt-ID. Weitere 15 Spalten sind Verkaufspreise fürBerechnen Durchschnitt für jedes Quartal gegeben Monat Spalten
2010/01,2010/02,2010/03,2010/05,2010/06,2010/07,2010/08,2010/10,2010/11,2010/12,2011/01,2011/02,2011/03,2011/04,2011/05.
(Der Spaltenname ist in Strings, nicht in dem Datumsformat) Jetzt habe ich den mittleren Verkaufspreis pro Quartal (1Q2010,2Q2010, ..., 2Q2011) berechnet werden soll, ich weiß nicht, wie zu tun damit. (Beachten Sie, dass für 2010/04, 2010/09 und 2011/06 ein Monat fehlt.)
Die obige Beschreibung ist nur ein Beispiel. Weil dieser Datensatz ziemlich klein ist. Es ist möglich, manuell zu loopen. Der wirkliche Datensatz, an dem ich arbeite, ist jedoch 10730 * 202. Daher kann ich nicht manuell überprüfen, welcher Monat tatsächlich fehlt oder die Quartale manuell abbilden. Ich frage mich, wie effizient ich mich hier bewerben kann.
Danke für die Hilfe!
Sie können Zeichenfolge in Datetime konvertieren und eine Groupby Abfrage anwenden. Ich habe es nicht ausprobiert. Es ist nur ein Vorschlag. – user1211