需求:有一系列的字典或对象实例，需要根据某个特定的字段来分组迭代数据

In [2]:
# 分组逻辑：1.先按分组字段排序 2.再分组
from itertools import groupby
from operator import itemgetter

rows = [
    {'address': '5421 N CLARK', 'date': '07/01/2012'},
    {'address': '5148 N CLARK', 'date': '07/04/2012'},
    {'address': '5800 E 58TH', 'date': '07/02/2012'},
    {'address': '2122 N CLARK', 'date': '07/03/2012'},
    {'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'},
    {'address': '1060 W ADDISON', 'date': '07/02/2012'},
    {'address': '4801 N BROADWAY', 'date': '07/01/2012'},
    {'address': '1039 W GRANVILLE', 'date': '07/04/2012'}
]

# 按日期排序
rows.sort(key=itemgetter('date'))

# 迭代分组
for date, items in groupby(rows, key=itemgetter('date')):
    print(date)
    for i in items:
        print('', i)


07/01/2012
 {'address': '5421 N CLARK', 'date': '07/01/2012'}
 {'address': '4801 N BROADWAY', 'date': '07/01/2012'}
07/02/2012
 {'address': '5800 E 58TH', 'date': '07/02/2012'}
 {'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'}
 {'address': '1060 W ADDISON', 'date': '07/02/2012'}
07/03/2012
 {'address': '2122 N CLARK', 'date': '07/03/2012'}
07/04/2012
 {'address': '5148 N CLARK', 'date': '07/04/2012'}
 {'address': '1039 W GRANVILLE', 'date': '07/04/2012'}


`groupby()`返回的是迭代器。而每一次的迭代返回的是一个值(分组的值)和子迭代器(可产生该分组内具有该值得项)

如上面的例子`groupby(rows, key=itemgetter('date'))`生成的迭代器。转换成列表类型，结果如下：  

```
[('07.04/2012', <itertools._grouper at 0x1076806d8>),
 ('07/01/2012', <itertools._grouper at 0x107680828>),
 ('07/02/2012', <itertools._grouper at 0x107680320>),
 ('07/03/2012', <itertools._grouper at 0x1076808d0>),
 ('07/04/2012', <itertools._grouper at 0x107680630>)]
```

In [3]:
# 如果是简单的想实现根据日期将数据分组到一起。可以使用之前一键多值的方法处理

from collections import defaultdict
rows_by_date = defaultdict(list)
for row in rows:
    rows_by_date[row['date']].append(row)
print(rows_by_date)


defaultdict(<class 'list'>, {'07/01/2012': [{'address': '5421 N CLARK', 'date': '07/01/2012'}, {'address': '4801 N BROADWAY', 'date': '07/01/2012'}], '07/02/2012': [{'address': '5800 E 58TH', 'date': '07/02/2012'}, {'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'}, {'address': '1060 W ADDISON', 'date': '07/02/2012'}], '07/03/2012': [{'address': '2122 N CLARK', 'date': '07/03/2012'}], '07/04/2012': [{'address': '5148 N CLARK', 'date': '07/04/2012'}, {'address': '1039 W GRANVILLE', 'date': '07/04/2012'}]})


综述：如果不考虑内存问题，使用defaultdict分组会比groupby()迭代快