[![img/pythonista.png](img/pythonista.png)](https://www.pythonista.io)

# El método ```pd.DataFrame.filter()```.

In [None]:
import pandas as pd
from datetime import datetime

El método ```pd.DataFrame.filter()``` permite buscar coincidencias mediante ciertos argumentos de búsqueda sobre los índices de un *dataframe*. El resultado es un *dataframe* nuevo con los elementos coincidentes de la búsqueda.

```
df.filter(<arg>, axis=<eje>)
```

Donde:

* ```<arg>``` es un argumento que define los cirterios de búsqueda. Los parámetros disponibles para los argumentos de este método son:
    * ```items``` en el que se definen los encabezados a buscar dentro de un objeto iterable.
    * ```like``` en el que se define una cadena de caracteres que debe coincidir con el identificador de algún índice.
    * ```regex``` define un patrón mediante una expresión regular.
* ```<eje>``` puede ser:
    * ```0``` para realizar la búsqueda en los índices de los renglones.
    * ```1``` para realizar la búsqueda en los índices de lass columnas. Este es el valor por defecto. 


https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.filter.html

**Ejemplos:**

* La siguente celda definirá al *dataframe* ```facturas``` con los identificadores de columnas:
    * ```'folio'```.
    * ```'sucursal'```.
    * ```'monto'```.
    * ```'fecha'```.
    * ```'cliente'```.

In [None]:
facturas = pd.DataFrame({'folio':(15234, 
                      15235, 
                      15236, 
                      15237, 
                      15238, 
                      15239, 
                      15240,
                      15241,
                      15242),
             'sucursal':('CDMX01',
                         'MTY01',
                         'CDMX02',
                         'CDMX02',
                         'MTY01',
                         'GDL01',
                         'CDMX02',
                         'MTY01',
                         'GDL01'),
             'monto':(1420.00,
                     1532.00,
                     890.00,
                     1300.00,
                     3121.47,
                     1100.5,
                     12230,
                     230.85,
                     1569),
             'fecha':(datetime(2019,3,11,17,24),
                     datetime(2019,3,24,14,46),
                     datetime(2019,3,25,17,58),
                     datetime(2019,3,27,13,11),
                     datetime(2019,3,31,10,25),
                     datetime(2019,4,1,18,32),
                     datetime(2019,4,3,11,43),
                     datetime(2019,4,4,16,55),
                     datetime(2019,4,5,12,59)),
            'id_cliente':(19234,
                          19232,
                          19235,
                          19233,
                          19236,
                          19237,
                          19232,
                          19233,
                          19232)
                        })

In [None]:
facturas

* La siguiente celda regresará un *dataframe* cuyos identificadores de columna sean exactamente ```'id_cliente'``` o ```'sucursal'```.

In [None]:
facturas.filter(items=['id_cliente','sucursal'])

* La siguiente celda regresará un *dataframe* cuyos identificadores de columna que incluyan la cadena ```'mon'```.

In [None]:
facturas.filter(like="mon")

* La siguiente celda regresará un *dataframe* cuyos identificadores de columna que incluyan la cadena ```'o'```.

In [None]:
facturas.filter(like="o")

* La siguiente celda regresará un *dataframe* cuyos identificadores de índice que incluyan la cadena ```'1'```.

In [None]:
facturas.filter(like="1", axis=0)

* La siguiente celda regresará un *dataframe* cuyos identificadores de columna cumplan con la expresión regular ```r"sal$"```.

In [None]:
facturas.filter(regex=r"sal$")

## Ejemplo de  ```pd.DataFrame.filter()``` y ```pd.DataFrame.merge().```

* La siguiente celda creará al *dataframe* ```clientes``` con la estructura de columnas: 
    * ```'id'```.
    * ```'nombre'```.
    * ```'apellido'```.
    * ```'suc_origen'```.

In [None]:
clientes = pd.DataFrame({'id':(19232, 
                             19233, 
                             19234, 
                             19235, 
                             19236),
                       'nombre':('Adriana',
                               'Marcos',
                               'Rubén',
                               'Samuel',
                               'Martha'),
                       'apellido':('Sánchez',
                                   'García',
                                   'Rincón',
                                   'Oliva',
                                   'Martínez'),
                        'suc_origen':('CDMX01',
                                      'CDMX02',
                                      'CDMX02',
                                      'CDMX01',
                                      'CDMX03')
                        })

In [None]:
clientes

* La siguiente celda combinará los métodos ```filter()``` y ```merge()``` que resultarán en un *dataframe* con una estructura de columnas:
    * Su utilizará el método ```clientes.merge()``` para identificar coincidencias entre los elementos  de ```clientes['id']``` y ```facturas['id_cliente']```.
    * Al *dataframe* resultante se le aplicará el método ```filter()```para regresar únicamente las columnas: 
        * ```'folio'```. 
        * ```'nombre```. 
        * ```'apellido'```.
        * ```'monto'```.

In [None]:
clientes.merge(facturas,
               left_on='id',
               right_on='id_cliente')

In [None]:
clientes.filter(items=['folio', 
                        'nombre', 
                        'apellido', 
                        'monto'])

In [None]:
clientes.merge(facturas,
               left_on='id',
               right_on='id_cliente').filter(items=['folio',
                                                    'nombre', 
                                                    'apellido',
                                                    'monto'])

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2022.</p>