## Importar librerías

In [6]:
import pandas as pd

## Datos de prueba

In [2]:
df = pd.DataFrame.from_dict(
    data = {
        "a": list("asdfasdfas"),
        "b": range(0, 10)
    }
)

df.iloc[2:5, 0] = None
df.iloc[6:7, 1] = None

df

Unnamed: 0,a,b
0,a,0.0
1,s,1.0
2,,2.0
3,,3.0
4,,4.0
5,s,5.0
6,d,
7,f,7.0
8,a,8.0
9,s,9.0


In [3]:
df.a.str

<pandas.core.strings.accessor.StringMethods at 0x7f6741e6a8e0>

In [14]:
df.missing

<__main__.MissingMethods at 0x7f6764b1c940>

## Crear una nueva clase para extender pandas

In [16]:
@pd.api.extensions.register_dataframe_accessor('missing')
class MissingMethods:

    def __init__(self, pandas_obj):

        self._df = pandas_obj
    
    def number_missing(self):
        return self._df.isna().sum().sum()

    def number_complete(self):
        return self._df.size - self._df.missing.number_missing()

    def proportion_missing(self):
        pass

  class MissingMethods:


Explicación:

La línea @pd.api.extensions.register_dataframe_accessor("missing") es un decorador que registra una extensión personalizada para DataFrame de pandas. En este caso, estamos registrando la clase MissingMethods bajo el nombre "missing", lo que nos permite acceder a los métodos de esta clase directamente a través de un DataFrame de pandas utilizando df.missing.

MissingMethods es una clase que define dos métodos: number_missing() y number_complete(). Estos métodos permiten contar el número de datos faltantes y completos, respectivamente, en el DataFrame que se pasa al constructor de la clase.

self._df = pandas_obj guarda el DataFrame que se pasa al constructor en una variable de instancia. Esta variable de instancia se puede utilizar luego en los métodos de la clase.

number_missing() devuelve el número total de valores faltantes en el DataFrame. isna().sum().sum() se usa para contar el número total de valores faltantes.

number_complete() devuelve el número total de valores completos (no faltantes) en el DataFrame. Esto se hace restando el número de valores faltantes (obtenido usando self.number_missing()) del tamaño total del DataFrame (self._df.size).

## Probar uso

In [10]:
df = pd.DataFrame(df)


In [11]:
df.missing

<__main__.MissingMethods at 0x7f6764b1c940>

In [12]:
df.missing.number_missing()

4

In [13]:
df.missing.number_complete()

16

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=88617571-4eed-4d7c-be16-1047c6187bb4' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>