[![img/pythonista.png](img/pythonista.png)](https://www.pythonista.io)

# El método ```pd.DataFrame.filter()```.

In [None]:
import pandas as pd
from datetime import datetime

El método ```pd.DataFrame.filter()``` permite buscar coincidencias mediante ciertos argumentos de búsqueda sobre los índices del dataframe de origen. El resultado es un dataframe nuevo con las coincidencias de la búsqueda.

```
<dataframe>.filter(<argumeto>, axis=<eje>)
```

Donde:

* ```<dataframe>``` es un dataframe de *Pandas*.
* ```<eje>``` es el eje sibre el que se ejecutará la búsqueda de los índices.
* ```<argumento>``` es un argumento que define los cirterios de búsqueda. Los parámetros disponibles para los argumentos de este método son:
    * ```items``` en el que se definen los encabezados a buscar dentro de un objeto iterable.
    * ```like``` en el que se define una cadena de caracteres que debe coincidir con el identificador de algún índice.
    * ```regex``` define un patrón mediante una expresión regular.


https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.filter.html

**Ejemplos:**

* La siguente celda definirá al dataframe ```facturas``` con los identificadores de columnas:
    * ```'folio'```.
    * ```'sucursal'```.
    * ```'monto'```.
    * ```'fecha'```.
    * ```'cliente'```.

In [None]:
facturas = pd.DataFrame({'folio':(15234, 
                      15235, 
                      15236, 
                      15237, 
                      15238, 
                      15239, 
                      15240,
                      15241,
                      15242),
             'sucursal':('CDMX01',
                         'MTY01',
                         'CDMX02',
                         'CDMX02',
                         'MTY01',
                         'GDL01',
                         'CDMX02',
                         'MTY01',
                         'GDL01'),
             'monto':(1420.00,
                     1532.00,
                     890.00,
                     1300.00,
                     3121.47,
                     1100.5,
                     12230,
                     230.85,
                     1569),
             'fecha':(datetime(2019,3,11,17,24),
                     datetime(2019,3,24,14,46),
                     datetime(2019,3,25,17,58),
                     datetime(2019,3,27,13,11),
                     datetime(2019,3,31,10,25),
                     datetime(2019,4,1,18,32),
                     datetime(2019,4,3,11,43),
                     datetime(2019,4,4,16,55),
                     datetime(2019,4,5,12,59)),
            'cliente':(19234,
                       19232,
                       19235,
                       19233,
                       19236,
                       19237,
                       19232,
                       19233,
                       19232)
                        })

In [None]:
facturas

* La siguiente celda regresará un dataframe cuyos identificadores de columna sean exactamente ```'cliente'``` o ```'sucursal'```.

In [None]:
facturas.filter(items=['cliente','sucursal', 'RFC'])

* La siguiente celda regresará un dataframe cuyos identificadores de columna que incluyan la cadena ```'mon'```.

In [None]:
facturas.filter(like="mon")

* La siguiente celda regresará un dataframe cuyos identificadores de columna que incluyan la cadena ```'o'```.

In [None]:
facturas.filter(like="o")

* La siguiente celda regresará un dataframe cuyos identificadores de índice que incluyan la cadena ```'1'```.

In [None]:
facturas.filter(like="1", axis=0)

* La siguiente celda regresará un dataframe cuyos identificadores de columna cumplan con la expresi;on regular ```r"sal$"```.

In [None]:
facturas.filter(regex=r"sal$")

## Ejemplo con ```pd.DataFrame.filter()``` y ```pd.DataFrame.merge().```

* La siguiente celda creará al dataframe ```clientes``` con la estructura de columnas: 
    * ```'ident'```.
    * ```'nombre'```.
    * ```'primer_apellido'```.
    * ```'suc_origen'```.

In [None]:
clientes = pd.DataFrame({'ident':(19232, 
                             19233, 
                             19234, 
                             19235, 
                             19236),
                       'nombre':('Adriana',
                               'Marcos',
                               'Rubén',
                               'Samuel',
                               'Martha'),
                       'primer_apellido':('Sánchez',
                                        'García',
                                        'Rincón',
                                        'Oliva',
                                         'Martínez'),
                        'suc_origen':('CDMX01',
                                      'CDMX02',
                                      'CDMX02',
                                      'CDMX01',
                                      'CDMX03')
                        })

In [None]:
clientes

In [None]:
clientes.filter(items=['ident', 
                       'nombre', 
                       'primer_apellido']).merge(facturas,
                                                left_on='ident',
                                                right_on='cliente')

* La siguiente celda combinará los métodos ```filter()``` y ```merge()``` que resultarán en un dataframe con una estructura de columnas:

* ```'folio'```.
* ```'nombre```.
* ```'primer_apellido'```.
* ```'monto'```.

El contenido corresponde a una relación de facturas con el cliente comprador.

In [None]:
clientes.filter(items=['ident', 
                       'nombre', 
                       'primer_apellido']).\
         merge(facturas,
               left_on='ident',
               right_on='cliente').\
         filter(items=['folio', 
                       'nombre', 
                       'primer_apellido', 
                       'monto'])

In [None]:
reporte = clientes.filter(items=['ident', 
                       'nombre', 
                       'primer_apellido']).\
merge(facturas,
      left_on='ident',
      right_on='cliente').\
filter(items=['folio', 'nombre', 'primer_apellido', 'monto'])

In [None]:
reporte

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2021.</p>