## ⚡ Analítica Turbo con Polars: Fundamentos que todo Analista Moderno debe conocer 🐻‍❄️

---

👨‍💻 Autor: Brayan Neciosup  
📍 Portafolio: [brayanneciosup](https://bryanneciosup626.wixsite.com/brayandataanalitics)  
🔗 LinkedIn: [linkedin.com/brayanneciosup](https://www.linkedin.com/in/brayan-rafael-neciosup-bola%C3%B1os-407a59246/)  
💻 GitHub: [github.com/BrayanR03](https://github.com/BrayanR03)  
📚 Serie: Fundamentos de Pandas y Polars


In [2]:
# Instalar librería de polars: pip install polars
# Importamos la librería
import polars as pl

### 📌 Series en Polars: Rendimiento y Simplicidad en una dimensión

####  ✅DEFINICIÓN DE UNA SERIE EN POLARS 🐻‍❄️

Sintaxis: 

serie = pl.Series(name = NombreColumnaSerie, values = ValoresSerie, dtype = pl.TipoDatoSegúnValores)

**Importante: A diferencia de Pandas, Polars ya no trabaja con índices en sus Series y se define
              el tipo de dato que tendrá la serie (int,str,object, entre otros..)
              Sin embargo, al tener diferentes tipos de datos en la serie, y no definir mediante "dtype"
              que tipo de datos se almacenarán, saldrá un error al imprimir la serie.

In [13]:
# Serie - Ejemplo 1 (Un solo tipo de dato):
data_1=[1,2,3,4,5]
serie_1=pl.Series(name="Valores",values=data_1,dtype=pl.Int64)
print("==== SERIE 1 - UN SOLO TIPO DE DATO") 
print(serie_1)
                                                # 💡💡➡️SIEMPRE DEFINIR EL TIPO DE DATO EN LA SERIE
# Serie - Ejemplo 2 (Varios tipos de datos):
data_2=[1,2,True,2.5,"Hola"]
serie_2=pl.Series(name="Valores2",values=data_2,dtype=pl.Object)
print("==== SERIE 2 - VARIOS TIPOS DE DATOS") 
print(serie_2)

# # Serie - Ejemplo 3 (Sin definir tipo de dato - error ❌):
# data_3=[1,2,True,2.5,"Hola"]
# serie_3=pl.Series(name="Valores3",values=data_3)
# print("==== SERIE 3 - VARIOS TIPOS DE DATOS ❌") 
# print(serie_3)


==== SERIE 1 - UN SOLO TIPO DE DATO
shape: (5,)
Series: 'Valores' [i64]
[
	1
	2
	3
	4
	5
]
==== SERIE 2 - VARIOS TIPOS DE DATOS
shape: (5,)
Series: 'Valores2' [o][object]
[
	1
	2
	True
	2.5
	Hola
]


#### ✅ OPERACIONES CON SERIES EN POLARS 🐻‍❄️

In [44]:
serie_example = pl.Series(name="Valores",values=[10,15,35,2,82,15,13],dtype=pl.Int64) # ⬅️ Trabajaremos con un solo tipo de dato (Int64) 
serie_example

Valores
i64
10
15
35
2
82
15
13


In [16]:
# a). Obtener un valor por el índice establecido
print(serie_example[5]) # ⬅️ Accedemos el elemento del índice 5


15


In [None]:
# b). Filtrar valores: Para realizar el filtrado debemos llamar al método .filter() y aplicar la condición.
# Sintaxis: serie_nombre.filter(serie_nombre + condición) ⬅️ condiciones usando operadores lógicos: > | < | = | >= | <= | !=
# Ejemplo : 
print(serie_example.filter(serie_example>18))  # ( Valores de la serie mayores a 18 )

shape: (2,)
Series: 'Valores' [i64]
[
	35
	82
]


In [18]:
# c). Realizar operaciones aritméticas básicas:
# Sintaxis: 
# operacion_serie = nombre_serie + | - | / | * 

# Estas operaciones a realizar, devuelven una estructura "ambigua" en Polars. Por ello, si queremos convertirla a
# un formato mas legible, realizamos los pasos para definir la serie.

# new_serie = pl.Series(name=NombreColumna,values=new_serie,dtype=pl.Int64)

# Ejemplo:
aumentar_serie = serie_example + 10  # ( Aumentar en 10, cada valor de la serie )
# print(aumentar_serie) # ⬅️ Formato "ambiguo"
new_serie = pl.Series(name="ValorNuevo",values=aumentar_serie,dtype=pl.Int64)
new_serie # ⬅️✅Formato mas legible
 

ValorNuevo
i64
20
25
45
12
92
25
23


In [68]:
# d). Reemplazar valores de series: 
# Las series al ser mutables, debemos almacenarlas en nuevas variables para que se reemplace.
# Además, si deseamos realizar condiciones para el reemplazo de valores, usaremos numpy.
# Sintaxis:
# new_serie = serie.replace({ValorAntiguoEnSerie:ValorNuevoAReemplazar}) ⬅️ método .replace() solo para valores individuales
# serie_condicionada = np.where(serie_example>30,100,serie_example) ⬅️ usando np.where() de numpy para condiciones de valores múltiples

# Ejemplo 1: Usando numpy - Instalar librería de numpy: pip install numpy
import numpy as np
serie_condicionada = np.where(serie_example>30,100,serie_example) # ⬅️ Condiciones de varios valores usando np.where()
new_serie_1 = pl.Series(values=serie_condicionada,name="Valores") # ⬅️ Formateamos a una serie el array devuelto por numpy.
print(new_serie_1)
# Ejemplo 2:
new_serie_2 = serie_example.replace({35:100}) # ⬅️ Reemplazamos valores individuales sin condición (30 por 100)
print(new_serie_2)

shape: (7,)
Series: 'Valores' [i64]
[
	10
	15
	100
	2
	100
	15
	13
]
shape: (7,)
Series: 'Valores' [i64]
[
	10
	15
	100
	2
	82
	15
	13
]


### 📌 Dataframes en Polars: ...

####  ✅DEFINICIÓN DE UN DATAFRAME EN POLARS 🐻‍❄️

Son estructuras de datos bidimensionales, que permiten almacenar información en forma de una matriz (FilasxColumnas),
las cuáles, deben estar de acorde al tipo de dato definido en la columna. Sin embargo, a diferencia de Pandas, Polars
presenta una optimización en la manipulación de la informació, debido que distribuye la lectura de los diversos
orígenes de datos en todos los núcleos del procesador.

SINTAXIS:

        dataframe_nombre = pl.DataFrame(data=DatosDataframe,schema=NombreColumnasPreviamenteDefinidas,orient= row[usado] | col)

In [None]:
# DEFINIR UN DATAFRAME MEDIANTE UN DICCIONARIO
"""
📝 Nota: Si queremos definir un dataframe desde un diccionario, las claves del diccionario se convertirán
         en las columnas del dataframe y los valores serán la información almacenada bidireccionalmente
         por cada columna del dataframe.
"""
diccionario_example = {
    "Nombre":["Brayan","Rafael","Pepito"],
    "Edad": [25,27,20],
    "Nota":[15,10,16]
}
dict_to_df = pl.DataFrame(diccionario_example)
dict_to_df.head() # ⬅️ Función básica que permite ver los 5 primeros registros de un dataframe. 
### 💡 Adicionalmente, Polars muestra el tipo de dato de las columnas del dataframe

Nombre,Edad,Nota
str,i64,i64
"""Brayan""",25,15
"""Rafael""",27,10
"""Pepito""",20,16


In [None]:
# DEFINIR UN DATAFRAME DESDE CERO
dataframe = pl.DataFrame(data=[["Brayan",25,15],["Rafael",27,10],["Pepito",20,16]],
                         schema=["Nombre","Edad","Nota"],orient="row") # ⬅️ Establecemos row para que los datos sean asignado como filas

dataframe.head()

"""
💡 Importante: Al definir las columnas para el Dataframe debemos tener en cuenta que
               se deben tener la misma cantidad de elementos de acuerdo a la cantidad de columnas,
               caso contrario, generará un error porque ciertas filas, no tienen la misma cantidad
               de elementos que la  columnas.
"""

# dataframe_valores_faltantes = pl.DataFrame(data=[["Brayan",15],["Rafael",15],["Pepito",20]],
#                                 schema=["Nombre","Edad","Nota"])
# dataframe_valores_faltantes.head() # ❌ Genera error porque los datos solo tiene 2 elementos y el dataframe presenta 3 columnas.


Nombre,Edad,Nota
str,i64,i64
"""Brayan""",25,15
"""Rafael""",27,10
"""Pepito""",20,16


In [None]:
# DEFINIR UN DATAFRAME COLUMNA POR COLUMNA

dataframe_columna_a_columna = pl.DataFrame() # ⬅️ Inicializamos un dataframe vacío (Así como cuando inicializamos un objeto vacío en programación)
dataframe_columna_a_columna.head()

"""
    📝Nota: Para poder definir columnas en un dataframe de Polars, debemos hacer referencia al dataframe, para poder
            definir sus nuevas columnas y otros cambios que querramos realizar. Asimismo, podemos inicializar un dataframe vacío, 
            e ir llenandolo poco a poco (según sea la casuística).
            
            También, podemos mezclar el uso de series en los Dataframes, porque, las Series son <<columnas>>.
"""


dataframe_columna_a_columna = dataframe_columna_a_columna.with_columns( # ⬅️ Función que permite trabajar sobre o crear nuevas  columnas en un dataframe.
        pl.Series(values=["Brayan","Rafael","Pepito"],name="ColumnaNombre",dtype=pl.String),  #⬅️ Definimos una columna con una serie.
        pl.Series(values=[21,45,19],name="ColumnaEdad",dtype=pl.Int64),  #⬅️ Definimos una columna con una serie.        
)
dataframe_columna_a_columna = dataframe_columna_a_columna.with_columns(
        (pl.col("ColumnaEdad")+10).alias("ColumnasEdad+10") 
        # ✅ Función pl.col(NombreColumna) nos permite acceder a una columna en base a su nombre
        # ✅ Función .alias(NuevoNombreColumna) nos permite renombrar una columna
)
dataframe_columna_a_columna.head()

"""
    💡Importante: Al definir columna por columna un dataframe en Polars debemos si o sí colocar
                  la misma cantidad de datos entre cada columna.                  
"""
# dataframe_valores_faltantes = pl.DataFrame()
# dataframe_valores_faltantes = dataframe_valores_faltantes.with_columns( # ⬅️ Función que permite trabajar sobre o crear nuevas  columnas en un dataframe.
#         pl.Series(values=["Brayan","Rafael"],name="ColumnaNombre",dtype=pl.String),  #⬅️ Definimos una columna con una serie.
#         pl.Series(values=[21,45,19],name="ColumnaEdad",dtype=pl.Int64),  #⬅️ Definimos una columna con una serie.        
# )
# dataframe_valores_faltantes.head()


ColumnaNombre,ColumnaEdad,ColumnasEdad+10
str,i64,i64
"""Brayan""",21,31
"""Rafael""",45,55
"""Pepito""",19,29


#### ✅ OPERACIONES CON DATAFRAMES EN POLARS 🐻‍❄️

In [3]:
df_example = pl.DataFrame(data=[["BRAYAN",15,13],["RAFAEL",25,19],["PEPITO",20,10]],
                          schema=["Nombre","Edad","Nota"],orient="row")
df_example.head()

Nombre,Edad,Nota
str,i64,i64
"""BRAYAN""",15,13
"""RAFAEL""",25,19
"""PEPITO""",20,10


In [None]:
# A). OBTENER EL VALOR O VALORES DE LA COLUMNA DE UN DATAFRAME MEDIANTE SU NOMBRE.

"""
    📝 SINTAXIS: 
    
        dataframe_nombre[NombreColumna] ⬅️ Llamamos al dataframe directamente o
        print(dataframe_nombre[NombreColumna]) ⬅️ Usamos print()
        
        **Importante: Cuando llamamos con solo un par de corchetes "[]", muestra los resultados,
                      
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables. 
"""
# 💡 EJEMPLO 1: Obtener valores de una columna
# df_example["Nota"]

# 💡 EJEMPLO 2: Obtener valores de varias columnas
df_example[["Nota","Nombre"]]

Nota,Nombre
i64,str
13,"""BRAYAN"""
19,"""RAFAEL"""
10,"""PEPITO"""


In [14]:
# B). OBTENER UNA FILA DE VALORES ESPECÍFICAS DEL DATAFRAME

"""
    📝 SINTAXIS:
    
        dataframe_nombre[NumeroIndice] ⬅️ Recordemos que el indice empieza en 0.
    
    💡 Importante: Tener en cuenta que el índice o número a ingresar, no debe superar 
                    el tamaño de valores.    
        
    ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""

# 💡 EJEMPLO 1: NÚMERO DE ÍNDICE CORRECTO ✅ 
df_example[0] # ⬅️ Número de indice: 2 (Retorna todos los registros de la fila 1, índice 0).

## 💡 EJEMPLO 2: NÚMERO DE ÍNDICE INCORRECTO ❌ 

## df_example[3] # ⬅️ Número de indice: 3.
## ❌ Error: Índice fuera de los límites

Nombre,Edad,Nota
str,i64,i64
"""BRAYAN""",15,13


In [17]:
# C). OBTENER UN VALOR ESPECÍFICO DE UN REGISTRO, BASADO EN SU NÚMERO DE ÍNDICE
#     Y EL NOMBRE DE UNA COLUMNA.
"""
    📝 SINTAXIS: 
    
        dataframe_nombre[NumeroIndice,NombreColumna] ⬅️ De esta manera accederemos solo a valores específicos.
        
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""
# 💡 EJEMPLO: 
# df_example[1,"Nota"] # ⬅️ Accedemos a la fila con índice 1 y la columna de nombre Nota.
print(df_example[1,"Nota"]) # ⬅️ Accedemos a la fila con índice 1 y la columna de nombre Nota.

19


In [None]:
# D). FILTRAR VALORES EN UN DATAFRAME:

""" 
    Para realizar el filtro de valores nos basaremos en condiciones que la o las columnas
    deben cumplir. Por ende, ya no utilizaremos el método .query() o el filtrado a través []
    como en Pandas, sino mediante su propia función .filter().
    
   💡 Importante: Para poder acceder a una columna y realizar el filtro correspondiente,
       utilizaremos pl.col() que crea una expresión de la columna verificando su existencia.
    
    📝 SINTAXIS:
     
        dataframe_nombre.filter( ⬅️ Método filter() para realizar filtrado.
                pl.col(NombreColumna) |CondicionColumna|        ⬅️ Filtramos por una columna.
                (pl.col(NombreColumna1) |CondicionColumna1| ) & 
                (pl.col(NombreColumna2) |CondicionColumna2| )   ⬅️ Filtramos por varias columnas.
        )
        
        ( > || < || >= || <= || != ) ⬅️ Operadores lógicos 
        
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""
# 💡 EJEMPLO 1: USANDO OPERADORES LÓGICOS (EN UNA COLUMNA)

# df_example.filter(pl.col("Nota")>15) # ⬅️ Notas mayores a 15
# df_example.filter(pl.col("Nombre")!='RAFAEL') # ⬅️ Todos los nombre diferentes a RAFAEL

# 💡 EJEMPLO 2: USANDO OPERADORES LÓGICOS (EN MÁS DE UNA COLUMNA)

# df_example.filter((pl.col("Edad")==20) & (pl.col("Nota")==10)) # ⬅️ Edad igual a 20 y Nota 10. (2 columnas)
## ➡️ Cada condición de filtro, la debemos separar mediante paréntesis ().

# 💡 EJEMPLO 3:

df_filtrado = df_example.filter((pl.col("Edad")==20) | (pl.col("Nota")==19)) # Filtrando por dos columnas (Usamos or)
df_filtrado.head()

Nombre,Edad,Nota
str,i64,i64
"""RAFAEL""",25,19
"""PEPITO""",20,10


In [None]:
# E). AGREGAR UNA O VARIAS COLUMNAS AL DATAFRAME:

"""
    Para poder agregar una nueva columna en Polars, a diferencia de Pandas que donde se definía
    entre [] una nueva columna, en Polars, usamos metodos directamente al dataframe, este método
    es .with_columns(), donde podemos crear columnas nuevas a raíz del cálculo de otras columnas.
    
    📝 SINTAXIS:

        dataframe_nombre = dataframe_nombre.with_columns(
            pl.col(NombreColumna).alias("NombreNuevaColumna")  ⬅️ Primera forma de crear una nueva columna (recomendada).
            NombreNuevaColumna = pl.col(NombreColumnaCalculo)  ⬅️ Segunda forma de crear una nueva columna.
            pl.Series(values=[Valores],name="NombreNuevaColumna",dtype=TipoDato) ⬅️ Tercera forma de crear una nueva columna (serie).
        )
        
    ### ⚠️ Tengamos en cuenta que para realizar cambios al dataframe, debemos llamar al dataframe otra vez.
"""

# 💡 EJERCICIO 1: NUEVA COLUMNA CON INFORMACIÓN

df_example = df_example.with_columns(
    pl.Series(values=[1,2,3],name="Puntaje",dtype=pl.Int64) 
    # ⬅️ Recodemos que para esta forma de agregar información
    #    debe contener la misma cantidad de datos que 
    #    el total de registros.
)
# df_example.head()

# 💡 EJERCICIO 2: NUEVA COLUMNA CALCULADA v1.
df_example = df_example.with_columns(
    (pl.col("Nota")*pl.col("Puntaje")).alias("Ranking")
)                                                    #    a las columnas a través de los corchetes [].
# df_example.head()


# 💡 EJERCICIO 3: NUEVA COLUMNA CALCULADA v2.
df_example = df_example.with_columns(
    Extra = (pl.col("Nota")/pl.col("Puntaje")) 
)
df_example.head()

Nombre,Edad,Nota,Puntaje,Ranking,Extra
str,i64,i64,i64,i64,f64
"""BRAYAN""",15,13,1,13,13.0
"""RAFAEL""",25,19,2,38,9.5
"""PEPITO""",20,10,3,30,3.333333


In [None]:
# F). ELIMINAR COLUMNAS DEL DATAFRAME:

"""
   A diferencia de Pandas donde llamamos directamente a la funcion con el dataset y realizamos la operación.
   En Polars debemos llamar al mismo dataframe y/o asignarlo a una nueva variable para poder visualizar
   los cambios de la eliminación.
    
    
    📝 SINTAXIS:
    
        dataframe_nombre = dataframe_nombre.drop([NombreColumna1,NombreColumna2],strict=True | False [EvaluaExistenciaDeColumnas])

    ### 🧠 En este caso, debemos almacenar en una variable los cambios a realizar en el dataframe

    ### ⚠️ Debemos tener en cuenta que si volvemos a ejecutar el código de eliminar columnas
           la columna especificada como ya no existe, lanzará error.

"""

# 💡 EJEMPLO 1:
# df_example = df_example.drop("Ranking",strict=True) # ⬅️ Establecemos True en strict ✅
# df_example.head() # ⬅️ Verificamos que si se elimino correctamente la columna

# 💡 EJEMPLO 2:
# df_copia = df_example # ⬅️ Método .copy() que permite copiar el dataframe a otra variable.
# df_copia = df_copia.drop(["Nota","Puntaje"],strict=True) # ⬅️ Establecemos True en strict ✅
# df_copia.head() # ⬅️ Verificamos que si se elimino correctamente las columnas


Nombre,Edad,Extra
str,i64,f64
"""BRAYAN""",15,13.0
"""RAFAEL""",25,9.5
"""PEPITO""",20,3.333333


In [45]:
# G). ORDERNAR LOS DATOS DEL DATAFRAME POR UNA O VARIAS COLUMNAS

"""
    📝 SINTAXIS: 

        dataframe_nombre = dataframe_nombre.sort(by=NombreColumna,descending=True | False) 
        
    💡 Importante: Al establecer el valor de descending en True, los datos se ordenan
                   de mayor a menor por la columna que especifiquemos. Sin embargo, sino 
                   llamamos a la propiedad descending o por el contrario, se establece el valor en False,
                   los datos se ordenan de menor a mayor.
                   
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""
# 💡 EJEMPLO 1: ➡️ Ordenamos Alfabéticamente (A-Z)

# df_example.sort(by="Nombre",descending=False).head()

# 💡 EJEMPLO 2: ➡️ Ordenamos Alfabéticamente (Z-A)

# df_example.sort(by="Nombre",descending=True).head()

# 💡 EJEMPLO 3: ➡️ Ordenamos por columna Numérica (De menor a mayor)

# df_example.sort(by="Edad",descending=False).head()

# 💡 EJEMPLO 4: ➡️ Ordenamos por columna Numérica (De mayor a menor)

df_example.sort(by="Edad",descending=True).head()


Nombre,Edad,Nota,Puntaje,Extra
str,i64,i64,i64,f64
"""RAFAEL""",25,19,2,9.5
"""PEPITO""",20,10,3,3.333333
"""BRAYAN""",15,13,1,13.0


#### ✅ RANGO INTERQUARTIL EN POLARS 🐻‍❄️

El rango interquartil (IQR) es una métrica estadística utilizada para identificar valores atípicos en un conjunto de datos. Su uso es esencial en procesos de limpieza y validación, debido que permite evaluar la integridad del dataset al detectar registros que se desvían significativamente del comportamiento general. En proyectos de Machine Learning, una correcta identificación de outliers a través del IQR permite mejorar la calidad de los datos de entrada, lo que impacta directamente en el rendimiento y generalización de los modelos. Para perfiles como Data Analysts y Data Engineers, el IQR se convierte en una herramienta clave en la etapa de preprocesamiento de datos.

In [12]:
# ESTADÍSTICA BÁSICA EN POLARS: Mediante la función .describe()
"""
    📝 SINTAXIS:
    
        dataframe_nombre.describe() ⬅️ Esta función devuelve: cantidad_valores||media||desviación_estándar||
                                                               valor_mínimo||valor_máximo||quartil_(1,2,3) ⬅️ Quartiles con.desribe()
    
    ### 💡 Importante: Esta función devuelve para las columnas con datos numéricos y Strings.
"""
""" ✅ PARA LOS EJEMPLOS DE IQR, USAREMOS UN DATASET DE LA CARPETA datasets: titanic.csv"""

df_titanic = pl.read_csv("../datasets/titanic.csv",separator=",") # ⬅️ Lo explicaremos en próximos temas
# df_titanic.head()

# 💡 EJEMPLO 1 : 

# df_titanic.describe() # ⬅️ Verificamos las estadísticas básicas descriptivas del dataset

""" 
    QUARTILES:

    Los quartiles hacen referencia a las partes iguales divididas en 4 de todo el conjunto de datos.
    Q1 (25% de los datos) - Q2 (50% de los datos) - Q3 (75% de los datos) y Q4 (100% de los datos).
    
    📝 SINTAXIS:

    valor_quartil = np.percentile(ColumnaDeDataframeOSerie,CantidadCuartil)
    
    ### 🧠 Para los valores atípico solo usaremos los quartiles 1 y 3.
"""

# 💡 EJEMPLO 2: RANGO INTERQUARTIL (Columna "fare")

q1_fare = df_titanic.select(pl.col("fare").quantile(0.25)).item() # Percentil o Quartil 1
q3_fare = df_titanic.select(pl.col("fare").quantile(0.75)).item() # Percentil o Quartil 3

range_iqr_fare = q3_fare - q1_fare # Cálculo del rango interquartil 

# Límite inferior
lower_bound_fare  = q1_fare - 1.5 * range_iqr_fare # Formula para hallar valores no atípicos, es decir, valores normales.
# Límite superior
upper_bound_fare  = q3_fare + 1.5 * range_iqr_fare # Formula para hallar valores atípicos, es decir, valores no normales.

df_titanic_atipicos = df_titanic.filter(
    (pl.col("fare")<lower_bound_fare) |
    (pl.col("fare")>upper_bound_fare) 
)
# df_titanic_atipicos.head()


df_titanic_normales = df_titanic.filter(
    (pl.col("fare")>=lower_bound_fare) &
    (pl.col("fare")<=upper_bound_fare) 
)
df_titanic_normales.head()

print(f"Cantidad de datos inicial: {df_titanic.shape[0]}")
print(f"Cantidad de datos atípicos: {df_titanic_atipicos.shape[0]}")
print(f"Cantidad de datos normales: {df_titanic_normales.shape[0]}")

Cantidad de datos inicial: 891
Cantidad de datos atípicos: 116
Cantidad de datos normales: 775
