# Análisis de datos eficiente con Python

## Introducción

En este tutorial, exploraremos Polars, un paquete de Python para el análisis de datos eficiente. Aprenderemos cómo cargar datos, realizar manipulaciones, análisis exploratorio y operaciones avanzadas utilizando Polars.

## Índice
1) Instalación de Polars
2) Carga de datos
3) Manipulación de datos
4) Análisis exploratorio de datos
5) Rendimiento y optimización
6) Casos de uso
7) Conclusiones y recursos adicionales

## 1.Instalación Polars
Para empezar, asegúrate de tener Polars instalado en tu entorno. Puedes hacerlo ejecutando el siguiente comando en tu terminal

In [5]:
! pip install polars




### Importar Polars
Una vez que hayas instalado Polars, puedes importarlo en tu notebook ejecutando la siguiente celda de código:


In [7]:
import polars as pl

## 2.Cargar datos
Para esta tarea crearemos un data frame como ejemplo y como manejar algunos datos

In [8]:
data = {
    'nombre': ['ismael', 'mario', 'diego', 'francisco'],
    'edad': [20, 19, 21, 30],
    'carrera': ['Informática', 'ing.sistemas', 'Física', 'Química']
}

df = pl.DataFrame(data)


### Explorar el DataFrame
Ahora que tenemos nuestro DataFrame, podemos explorar sus datos. Para mostrar el DataFrame en Jupyter Notebook, simplemente escribimos su nombre en una celda y lo ejecutamos:

In [9]:
df

nombre,edad,carrera
str,i64,str
"""ismael""",20,"""Informática"""
"""mario""",19,"""ing.sistemas"""
"""diego""",21,"""Física"""
"""francisco""",30,"""Química"""


## 3. Manipulación de datos
Polars proporciona una amplia gama de funciones para manipular y transformar datos. Veamos algunos ejemplos:

Selección de columnas:


In [11]:

# Seleccionar una columna
df.select("nombre")

# Seleccionar múltiples columnas
df.select(["nombre", "edad"])

nombre,edad
str,i64
"""ismael""",20
"""mario""",19
"""diego""",21
"""francisco""",30


### filtro de datos

In [None]:
# Filtrar por condición
df.filter(pl.col("columna1") > 10)

### Agregación y resumen de datos

In [None]:
# Calcular suma, promedio y conteo
df.select(pl.sum("columna1"), pl.avg("columna2"), pl.count("columna3"))

### Manejo de valores nulos:

In [None]:
# Filtrar filas con valores nulos
df.filter(pl.col("columna1").is_null())

# Rellenar valores nulos con un valor específico
df.fill_nulls(0)

## 4. Análisis exploratorio de datos
Polars nos permite realizar análisis exploratorio de datos de manera sencilla. Veamos algunos ejemplos:

-Estadísticas descriptivas
-Visualización de datos utilizando bibliotecas externas
-Creación de gráficos utilizando Polars:
-Ordenación y clasificación de datos:


