## ⚡ Analítica Turbo con Polars: Fundamentos que todo Analista Moderno debe conocer 🐻‍❄️

---

👨‍💻 Autor: Brayan Neciosup  
📍 Portafolio: [brayanneciosup](https://bryanneciosup626.wixsite.com/brayandataanalitics)  
🔗 LinkedIn: [linkedin.com/brayanneciosup](https://www.linkedin.com/in/brayan-rafael-neciosup-bola%C3%B1os-407a59246/)  
💻 GitHub: [github.com/BrayanR03](https://github.com/BrayanR03)  
📚 Serie: Fundamentos de Pandas y Polars


In [1]:
# Instalar librería de polars: pip install polars
# Importamos la librería
import polars as pl

#### ✅LAZYFRAMES EN POLARS 🐻‍❄️

Los LazyFrames en Polars permiten construir transformaciones de datos sin ejecutarlas de inmediato,
por ende, en lugar de procesar paso a paso como los DataFrames tradicionales, acumulan las operaciones
en un plan lógico que se ejecuta solo cuando se llama a .collect(). Permitiendo mejorar el rendimiento,
reducir el uso de memoria y hacer más eficiente el procesamiento de grandes volúmenes de datos.

In [None]:
"""
    📝 SINTAXIS:
    
        lz = pl.LazyFrame(data=[[DatosColumna1],[DatosColumnaN]], ⬅️ Información que estará en el Lazyframe
                          schema={Columna1:pl.TipoDatoColumna1,ColumnaN:pl.TipoDatoColumnaN}) ⬅️ Columnas del LazyFrame    
"""

In [2]:

# DEFINIR UN LAZYFRAME MEDIANTE UN DICCIONARIO
"""
📝 Nota: Si queremos definir un lazyframe desde un diccionario, las claves del diccionario se convertirán
         en las columnas del lazyframe y los valores serán la información almacenada bidireccionalmente
         por cada columna del lazyframe.
"""
diccionario_example = {
    "Nombre":["Brayan","Rafael","Pepito"],
    "Edad": [25,27,20],
    "Nota":[15,10,16]
}
dict_to_lz = pl.LazyFrame(diccionario_example)
dict_to_lz.collect() # ⬅️ Función que permite ejecutar el plan lógico del LazyFrame. 
### 💡 Adicionalmente, Polars muestra el tipo de dato de las columnas del LazyFrame

Nombre,Edad,Nota
str,i64,i64
"""Brayan""",25,15
"""Rafael""",27,10
"""Pepito""",20,16


In [None]:
# DEFINIR UN LAZYFRAME DESDE CERO
lazyframe = pl.LazyFrame(data=[["Brayan","Rafel","Pepito"],[22,27,25],[14,20,16]],
                         schema={"Nombre":pl.String,"Edad":pl.Int64,"Nota":pl.Int64}) # ⬅️ Establecemos el tipo de dato en la columna.

lazyframe.collect()

"""
💡 Importante: Al definir las columnas para el lazyframe debemos tener en cuenta que
               se deben tener la misma cantidad de elementos de acuerdo a la cantidad de columnas,
               caso contrario, generará un error porque ciertas filas, no tienen la misma cantidad
               de elementos que la  columnas. Además, cada lista de datos llenará toda una sola columna
               en el lazyframe.
"""

# lazyframe_valores_faltantes = pl.LazyFrame(data=[["Brayan","Rafael"],[16,15]],
#                                 schema=["Nombre","Edad","Nota"])
# lazyframe_valores_faltantes.collect() # ❌ Genera error porque los datos son solo de 2 columnas 
#                                             y el lazyframe presenta 3 columnas.


Nombre,Edad,Nota
str,i64,i64
"""Brayan""",22,14
"""Rafel""",27,20
"""Pepito""",25,16


In [4]:
"""
💡Importante: Las operaciones a realizar sobre los LazyFrames son iguales
              que los dataframes (mismas funciones, cálculos, entre otros).
              Sin embargo, en vez de llamar a .head(), llamaremos a **.collect()**
"""
# 💡 CONVERTIR UN DATAFRAME A UN LAZYFRAME:

# 1️⃣ DEFINIMOS EL DATAFRAME
df = pl.DataFrame({
    "nombre": ["Ana", "Luis", "María"],
    "edad": [25, 30, 35],
    "ciudad": ["Madrid", "Barcelona", "Valencia"]
})
# df.head()

# 2️⃣ CONVERTIMOS A LAZYFRAME: .lazy()

lz = df.lazy()
lz.collect()



nombre,edad,ciudad
str,i64,str
"""Ana""",25,"""Madrid"""
"""Luis""",30,"""Barcelona"""
"""María""",35,"""Valencia"""
