<a href="https://colab.research.google.com/github/financieras/pyCourse/blob/main/jupyter/calisto3/0400_polars.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Comenzando con Polars
- [Getting started](https://docs.pola.rs/user-guide/getting-started/)
- Es una librería competidora de Pandas.
- Resulta ser más rápida con grandes volúmenes de datos.

<img src="https://github.com/financieras/pyCourse/blob/main/jupyter/img/polars.jpg?raw=1" alt="logo polars" width="320">

[Polars Benchmark](https://duckdb.org/2023/04/14/h2oai.html#results)

<img src="https://github.com/financieras/pyCourse/blob/main/jupyter/img/polars_benchmark.png?raw=1" alt="polars benchmark" width="480">


## Instalación de Polars

In [None]:
pip install polars



## Lectura y escritura
*Polars* admite la lectura y escritura de formatos de archivos comunes (p. ej., csv, json, parquet), almacenamiento en la nube (S3, Azure Blob, BigQuery) y bases de datos (p. ej., postgres, mysql). A continuación, creamos un pequeño marco de datos y mostramos cómo escribirlo en el disco y volver a leerlo.

In [None]:
import polars as pl
import datetime as dt

df = pl.DataFrame(
    {
        "name": ["Alice Archer", "Ben Brown", "Chloe Cooper", "Daniel Donovan"],
        "birthdate": [
            dt.date(1997, 1, 10),
            dt.date(1985, 2, 15),
            dt.date(1983, 3, 22),
            dt.date(1981, 4, 30),
        ],
        "weight": [57.9, 72.5, 53.6, 83.1],  # (kg)
        "height": [1.56, 1.77, 1.65, 1.75],  # (m)
    }
)

print(df)

shape: (4, 4)
┌────────────────┬────────────┬────────┬────────┐
│ name           ┆ birthdate  ┆ weight ┆ height │
│ ---            ┆ ---        ┆ ---    ┆ ---    │
│ str            ┆ date       ┆ f64    ┆ f64    │
╞════════════════╪════════════╪════════╪════════╡
│ Alice Archer   ┆ 1997-01-10 ┆ 57.9   ┆ 1.56   │
│ Ben Brown      ┆ 1985-02-15 ┆ 72.5   ┆ 1.77   │
│ Chloe Cooper   ┆ 1983-03-22 ┆ 53.6   ┆ 1.65   │
│ Daniel Donovan ┆ 1981-04-30 ┆ 83.1   ┆ 1.75   │
└────────────────┴────────────┴────────┴────────┘


In [None]:
df.write_csv("output.csv")
df_csv = pl.read_csv("output.csv", try_parse_dates=True)
print(df_csv)

shape: (4, 4)
┌────────────────┬────────────┬────────┬────────┐
│ name           ┆ birthdate  ┆ weight ┆ height │
│ ---            ┆ ---        ┆ ---    ┆ ---    │
│ str            ┆ date       ┆ f64    ┆ f64    │
╞════════════════╪════════════╪════════╪════════╡
│ Alice Archer   ┆ 1997-01-10 ┆ 57.9   ┆ 1.56   │
│ Ben Brown      ┆ 1985-02-15 ┆ 72.5   ┆ 1.77   │
│ Chloe Cooper   ┆ 1983-03-22 ┆ 53.6   ┆ 1.65   │
│ Daniel Donovan ┆ 1981-04-30 ┆ 83.1   ┆ 1.75   │
└────────────────┴────────────┴────────┴────────┘
