Ich habe zwei Eingabedatenrahmen, der erste heißt "Firms_Ind" und enthält 2 Spalten ("Firms", "Industry") mit mehreren Zeilen. Es gibt die Branchen-ID für jede Firma. Der andere heißt "ann_returns" und hat so viele Spalten wie "Firms_Ind" Zeilen und mehrere Zeilen hat. Es enthält die Rendite für jede der Firmen (Spalten) pro Jahr (Zeilen).Summenspalten zeilenweise basierend auf IDs in einem anderen Vektor
Ich möchte die jährliche mittlere Rendite pro Branche berechnen. Ich möchte also eine Ausgabematrix, die folgende Dimensionen hat: Anzahl der Spalten = Anzahl der Jahre und Anzahl der Zeilen = Anzahl der Jahre. Für jede Branche (Spalte) sollte die mittlere Rendite pro Jahr berechnet werden.
hier ist ein kleines Beispiel:
> Firms_Ind
Firms Industry
1 A 1
2 B 2
3 C 3
4 D 1
5 E 2
6 F 1
> ann_returns
A B C D E F
y1 0.20 0.11 0.13 0.30 0.24 0.03
y2 0.23 0.08 0.03 0.23 0.17 0.01
y3 0.28 0.19 0.11 0.21 0.19 0.07
> Industry_mean
1 2 3
y1_means 0.20 0.11 0.13
y2_means 0.23 0.08 0.03
y3_means 0.28 0.19 0.11
Haben Sie versucht, Umformen 'ann_returns' in Langform, dann verschmelzen' Firms_Ind' es, dann die Gruppe von der Industrie den Mittelwert zu berechnen? – coffeinjunky