# Аггрегирование и гуппировка

Важным элементом анализа больших данных является эффективность суммирования: расчет аггрегаторов типа `sum()`, `mean()`, `median()`, `min()` и `max()`, в которых одно значение может дать информацию о природе потенциально большого набора данных. В данном разделе мы изучим аггрегирование в Pandas, начиная с простых операций, родственных тем, что мы видели в NumPy, и заканчивая более сложными операциями, базирующимися на концепте `groupby`. Для удобства мы будем использовать магическую функцию `display`, с которой работил ранее.

In [1]:
import numpy as np
import pandas as pd

class display(object):
    """Display HTML representation of multiple objects"""
    template = """<div style="float: left; padding: 10px;">
    <p style='font-family:"Courier New", Courier, monospace'>{0}</p>{1}
    </div>"""
    def __init__(self, *args):
        self.args = args
        
    def _repr_html_(self):
        return '\n'.join(self.template.format(a, eval(a)._repr_html_()) for a in self.args)
    
    def __repr__(self):
        return '\n\n'.join(a + '\n' + repr(eval(a)) for a in self.args)

## Данные по планетам

Здесь мы будем использовать данные по планетам, доступные из пакета [Seaborn](https://seaborn.pydata.org/). Он содержит информацию о планетах, которые астрономы обнаружили вокруг других звёзд (экзопланеты). Набор может быть загружен простой командой:

In [3]:
import seaborn as sns
planets = sns.load_dataset('planets')
planets.shape

(1035, 6)

In [8]:
planets.head()

Unnamed: 0,method,number,orbital_period,mass,distance,year
0,Radial Velocity,1,269.3,7.1,77.4,2006
1,Radial Velocity,1,874.774,2.21,56.95,2008
2,Radial Velocity,1,763.0,2.6,19.84,2011
3,Radial Velocity,1,326.03,19.4,110.62,2007
4,Radial Velocity,1,516.22,10.5,119.47,2009


## Простая аггрегация в Pandas

https://jakevdp.github.io/PythonDataScienceHandbook/03.08-aggregation-and-grouping.html#Simple-Aggregation-in-Pandas