2010-02-12 28 views
15

Ich habe eine Liste von (Label, count) Tupel wie folgt aus:Gruppierung Python Tupel Liste

[('grape', 100), ('grape', 3), ('apple', 15), ('apple', 10), ('apple', 4), ('banana', 3)] 

Von dass ich will alle Werte mit dem gleichen Etikett (gleiche Etiketten immer benachbart) und gibt eine Liste zusammenzufassen in der gleichen Label Reihenfolge:

[('grape', 103), ('apple', 29), ('banana', 3)] 

ich weiß, ich es mit so etwas wie lösen könnte:

def group(l): 
    result = [] 
    if l: 
     this_label = l[0][0] 
     this_count = 0 
     for label, count in l: 
      if label != this_label: 
       result.append((this_label, this_count)) 
       this_label = label 
       this_count = 0 
      this_count += count 
     result.append((this_label, this_count)) 
    return result 

Aber gibt es einen mo re Pythonic/eleganter/effizienter Weg dies zu tun?

Antwort

23

itertools.groupby kann tun, was Sie wollen:

import itertools 
import operator 

L = [('grape', 100), ('grape', 3), ('apple', 15), ('apple', 10), 
    ('apple', 4), ('banana', 3)] 

def accumulate(l): 
    it = itertools.groupby(l, operator.itemgetter(0)) 
    for key, subiter in it: 
     yield key, sum(item[1] for item in subiter) 

>>> print list(accumulate(L)) 
[('grape', 103), ('apple', 29), ('banana', 3)] 
>>> 
+4

Ich mag die Verwendung von 'operator.itemgetter' anstelle von' Lambda'. – jathanism

+1

Dazu muss die Liste nach dem ersten Schlüssel sortiert werden. Wenn es nicht bereits sortiert ist, ist der Defaultdict-Ansatz von ghostdog74 eine viel bessere Lösung. –

5

itertools und Liste mit Comprehensions

import itertools 

[(key, sum(num for _, num in value)) 
    for key, value in itertools.groupby(l, lambda x: x[0])] 

Edit: als gnibbler wies darauf hin: wenn l nicht bereits sortiert sie ersetzen mit sorted(l).

+4

verwenden groupby Sie zuerst, dass die Sequenz (alle ‚Traube‘ benachbart, usw.) pregrouped wird sicherstellen müssen. Eine Möglichkeit, das zu tun, besteht darin, die Sequenz zuerst zu sortieren. –

+0

Das OP gab an, dass die Etiketten bereits gruppiert waren. –

+0

@Thomas Wouters, ja du hast Recht ("gleiche Labels sind immer nebeneinander") –

3
import collections 
d=collections.defaultdict(int) 
a=[] 
alist=[('grape', 100), ('banana', 3), ('apple', 10), ('apple', 4), ('grape', 3), ('apple', 15)] 
for fruit,number in alist: 
    if not fruit in a: a.append(fruit) 
    d[fruit]+=number 
for f in a: 
    print (f,d[f]) 

Ausgang

$ ./python.py 
('grape', 103) 
('banana', 3) 
('apple', 29) 
3
>>> from itertools import groupby 
>>> from operator import itemgetter 
>>> L=[('grape', 100), ('grape', 3), ('apple', 15), ('apple', 10), ('apple', 4), ('banana', 3)] 
>>> [(x,sum(map(itemgetter(1),y))) for x,y in groupby(L, itemgetter(0))] 
[('grape', 103), ('apple', 29), ('banana', 3)] 
0

Oder eine einfache lesbare Antwort (ohne itertools):

pairs = [('foo',1),('bar',2),('foo',2),('bar',3)] 

def sum_pairs(pairs): 
    sums = {} 
    for pair in pairs: 
    sums.setdefault(pair[0], 0) 
    sums[pair[0]] += pair[1] 
    return sums.items() 

print sum_pairs(pairs) 
1

meine Version ohne itertools
[(k, sum([y for (x,y) in l if x == k])) for k in dict(l).keys()]