[![imagenes/pythonista.png](imagenes/pythonista.png)](https://pythonista.io)

# Métodos ```groupby()```.

Tanto las seiers como los dataframes de *Pandas* cuentan con un método ```groupby()```.

* El método ```pd.DataFrame.groupby()``` regresa un objeto ```pd.core.groupby.generic.DataFrameGroupBy```.
* El método ```pd.Series.groupby()``` regresa un objeto ```pd.core.groupby.generic.SeriesGroupBy```.

En este capítulo se explorará el método ```pd.DataFrame.groupby()```, asumiendo que el método```pd.Series.groupby()``` se comporta de forma similar.

In [None]:
import pandas as pd

## El método ```pd.DataFrame.groupby()```.

El método regresa un objeto de tipo```pd.core.groupby.generic.DataFrameGroupBy```, el cual contiene 
```
<df>.groupby(by=<criterio>, axis=<eje>)
```

Regresa objetos de tipo:

* ```criterio``` corresponde al identificador o índice  agrupación que se aplicará.
* ```eje``` es el eje al que se aplicará el método.

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.groupby.html

**Ejemplo:**

* La siguiente celda creará al dataframe ```facturas``` con la estructura de columnas:

    * ```'folio'```.
    * ```'sucursal'```.
    * ```'monto'```.
    * ```'fecha'```.
    * ```'cliente'```.

In [None]:
facturas = pd.DataFrame({'folio':(15234, 
                      15235, 
                      15236, 
                      15237, 
                      15238, 
                      15239, 
                      15240,
                      15241,
                      15242),
             'sucursal':('CDMX01',
                         'MTY01',
                         'CDMX02',
                         'CDMX02',
                         'MTY01',
                         'GDL01',
                         'CDMX02',
                         'MTY01',
                         'GDL01'),
             'monto':(1420.00,
                     1532.00,
                     890.00,
                     1300.00,
                     3121.47,
                     1100.5,
                     12230,
                     230.85,
                     1569),
             'fecha':(pd.datetime(2019,3,11,17,24),
                     pd.datetime(2019,3,24,14,46),
                     pd.datetime(2019,3,25,17,58),
                     pd.datetime(2019,3,27,13,11),
                     pd.datetime(2019,3,31,10,25),
                     pd.datetime(2019,4,1,18,32),
                     pd.datetime(2019,4,3,11,43),
                     pd.datetime(2019,4,4,16,55),
                     pd.datetime(2019,4,5,12,59)),
            'cliente':(19234,
                       19232,
                       19235,
                       19233,
                       19236,
                       19237,
                       19232,
                       19233,
                       19232)
                        })

In [None]:
facturas

* La siguiente celda creará el dataframe ```gastos_por_cliente``` a partir del dataframe ```facturas``` con la estructura de columnas:

    * ```'monto'```.
    * ```'cliente'```.

In [None]:
gastos_por_cliente = facturas.filter(items=["monto", "cliente"])

In [None]:
gastos_por_cliente

* La siguiente celda agrupará aquellos elementos en los que el valor de la columna ```'cliente'``` sean iguales.

In [None]:
clientes = gastos_por_cliente.groupby("cliente")

* El objeto ```clientes``` es de tipo ```pd.core.groupby.generic.DataFrameGroupBy```.

In [None]:
clientes

## Los objetos ```core.groupby.generic.DataFrameGroupBy```.

Los objetos ```core.groupby.generic.DataFrameGroupBy``` son iteradores que contienen a objetos de tipo ```tuple``` resultantes de la agrupación.

Dichos objetos contiene diversos métodos capaces de procesar los datos de cada objeto ```tuple``` que contiene.

La documentación de los objetos ```core.groupby.generic.DataFrameGroupBy``` y ```core.groupby.generic.SeriesGroupBy``` está disponible en: 

```core.groupby.generic.DataFrameGroupBy```

**Ejemplo:**

* La siguiente celda desplegará las tuplas contenidas en ```clientes```.

In [None]:
for item in clientes:
    print(item)

In [None]:
dir(clientes)

* Las siguientes celdas mostrarán algunos métodos y atributos de los objetos ```core.groupby.generic.DataFrameGroupBy```.

In [None]:
clientes.size()

In [None]:
clientes.mean()

In [None]:
clientes.max()

In [None]:
clientes.min()

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2020.</p>