Multiindex Datenrahmen zu Serie

Ich habe einen Multiindex Datenrahmen von:Multiindex Datenrahmen zu Serie

df.set_index(['Field1', 'Field2'], inplace=True)

Ist dies nicht ein Multiindex Datenrahmen ist mir bitte sagen, wie man machen.

Ich möchte:

Gruppe mit den gleichen Spalten, die
Aggregate eine Zählung jeder Gruppe
Dann schicken Sie das Ganze als Serie mit Field1 und Field2 als die im Index enthalten sind index

Wie gehe ich dabei vor?

ZUSÄTZLICHE INFORMATIONEN

Ich habe einen Multiindex Datenrahmen, der wie folgt aussieht:

Continent  Sector    Count  
Asia   1      4 
       2      1 
Australia  1      1 
Europe  1      1 
       2      3 
       3      2 
North America 1      1 
       5      1 
South America 5      1

Wie kann ich dies als eine Serie mit dem Index der Rückkehr [Kontinent, Sector]

Quelle

2016-12-13 Alex

Ich denke, Sie brauchen groupby mit Aggregat size:

df = pd.DataFrame({'Field1':[1,1,1], 
        'Field2':[4,4,6], 
        'C':[7,8,9], 
        'D':[1,3,5], 
        'E':[5,3,6], 
        'F':[7,4,3]}) 


df.set_index(['Field1', 'Field2'], inplace=True) 
print (df) 
       C D E F 
Field1 Field2    
1  4  7 1 5 7 
     4  8 3 3 4 
     6  9 5 6 3 

print (df.index) 
MultiIndex(levels=[[1], [4, 6]], 
      labels=[[0, 0, 0], [0, 0, 1]], 
      names=['Field1', 'Field2']) 

print (df.groupby(level=[0,1]).size()) 
Field1 Field2 
1  4   2 
     6   1 
dtype: int64

print (df.groupby(level=['Field1', 'Field2']).size()) 
Field1 Field2 
1  4   2 
     6   1 
dtype: int64

print (df.groupby(level=['Field1', 'Field2']).count()) 
       C D E F 
Field1 Field2    
1  4  2 2 2 2 
     6  1 1 1 1

What is the difference between size and count in pandas?

EDIT von Kommentar:

df.set_index(['Continent', 'Sector'], inplace=True) 
print (df) 
         Count 
Continent  Sector  
Asia   1   4 
       2   1 
Australia  1   1 
Europe  1   1 
       2   3 
       3   2 
North America 1   1 
       5   1 
South America 5   1 

print (df['Count']) 
Continent  Sector 
Asia   1   4 
       2   1 
Australia  1   1 
Europe   1   1 
       2   3 
       3   2 
North America 1   1 
       5   1 
South America 5   1 
Name: Count, dtype: int64

Oder:

print (df.squeeze()) 
Continent  Sector 
Asia   1   4 
       2   1 
Australia  1   1 
Europe   1   1 
       2   3 
       3   2 
North America 1   1 
       5   1 
South America 5   1 
Name: Count, dtype: int64

Alle zusammen mit set_index:

print (df) 
     Continent Sector Count 
0   Asia  1  4 
1   Asia  2  1 
2  Australia  1  1 
3   Europe  1  1 
4   Europe  2  3 
5   Europe  3  2 
6 North America  1  1 
7 North America  5  1 
8 South America  5  1 

print (df.set_index(['Continent', 'Sector'])['Count']) 
Continent  Sector 
Asia   1   4 
       2   1 
Australia  1   1 
Europe   1   1 
       2   3 
       3   2 
North America 1   1 
       5   1 
South America 5   1 
Name: Count, dtype: int64

Quelle

2016-12-13 06:27:40 jezrael

ich zusätzliche Informationen zu der – Alex

Frage hinzugefügt haben Ich bin stumm - versucht, sowohl Art und Weise und sie beide arbeiteten. Danke @jezrael – Alex

Multiindex Datenrahmen zu Serie

Antwort

Verwandte Themen