# Lectura 50: Funciones de conversión

In [None]:
import pyarrow.parquet as pq

tabla_vuelos = pq.read_table('./data/vuelos/')

tabla_vuelos

## Crear un DataFrame de Polars desde una tabla de Arrow

La función `from_arrow` permite crear un DataFrame de Polars a partir de una tabla Arrow. Esta operación no creará copias en su mayor parte. Los tipos que no son compatibles con Polars se pueden convertir al tipo compatible más cercano.

In [None]:
import polars as pl

vuelos_df = pl.from_arrow(tabla_vuelos)

print(vuelos_df)

## Crear un DataFrame de Polars desde un Pandas DataFrame

La función `from_pandas` permite crear un DataFrame de Polars a partir de un Pandas DataFrame. Esta operación clona los datos. Además, requiere que `pandas` y `pyarrow` estén instalados.

In [None]:
vuelos_pd = tabla_vuelos.to_pandas()

vuelos_pd

In [None]:
vuelos_df = pl.from_pandas(vuelos_pd)

print(vuelos_df)

## Crear un DataFrame de Polars desde un NumPy ndarray

La función `from_numpy` permite crear un DataFrame de Polars a partir de un NumPy ndarray. Esta operación clona los datos. Tenga en cuenta que esta operación pude ser un poco lenta en algunos casos.

In [None]:
vuelos_np = vuelos_pd.to_numpy()

type(vuelos_np)

In [None]:
vuelos_np

In [None]:
vuelos_df = pl.from_numpy(vuelos_np)

print(vuelos_df)

## Crear un DataFrame de Polars desde una lista y un diccionario

Las funciones `from_records` y `from_dict` nos permiten crear un DataFrame de Polars desde un lista o un diccionario respectivamente.

In [None]:
valores = [['a', 'b', 'c'], [1,2,3]]

df_valores = pl.from_records(valores, schema=['letra', 'id'])

print(df_valores)

In [None]:
diccionario = {'id': [1,2,3], 'letra': ['x', 'y', 'z']}

df_diccionario = pl.from_dict(diccionario)

print(df_diccionario)

## Crear un DataFrame de Polars desde su representación String

La función `from_repr` permite crear un DataFrame de Polars a partir de su representación string.

Para este ejemplo tomaremos el DataFrame que hemos imprimido en la celda anterior y se lo proporcionaremos como parámetro a la función `from_repr`.

In [None]:
df_str = pl.from_repr(
    """
    shape: (3, 2)
┌─────┬───────┐
│ id  ┆ letra │
│ --- ┆ ---   │
│ i64 ┆ str   │
╞═════╪═══════╡
│ 1   ┆ x     │
│ 2   ┆ y     │
│ 3   ┆ z     │
└─────┴───────┘
    """
)

In [None]:
print(df_str)