# Manual do Polars

## Introdução ao Polars

- O que é o Polars e por que é útil

Polars é uma biblioteca de processamento de dados de alto desempenho e escalabilidade para a linguagem Rust. Ele oferece uma alternativa de código aberto e livre de licença a outras bibliotecas populares, como o Pandas e Dask, para processar grandes quantidades de dados de maneira rápida e eficiente.

Polars é especialmente útil quando se lida com dados grandes o suficiente para exigir o uso de computação distribuída. Ele usa a linguagem funcional Rust para fornecer um desempenho aprimorado em comparação com outras bibliotecas de processamento de dados e oferece recursos avançados de particionamento, indexação e compressão de dados para melhorar a escalabilidade.

- Recursos do Polars e vantagens em relação a outras bibliotecas de processamento de dados


O Polars tem vários recursos que o tornam uma escolha atraente para processamento de dados, incluindo:

* Alto desempenho e escalabilidade com a linguagem funcional Rust.
* Suporte para tipos de dados complexos, como arrays e structs.
* Operações de agregação e transformação de dados para realizar tarefas de análise de dados comuns.
* Uso de expressões de linguagem funcional para criar pipelines de processamento de dados.
* Integração com outras ferramentas de visualização de dados para gerar gráficos e relatórios.
* Compatibilidade com vários formatos de arquivo de dados, como CSV, JSON e Parquet.

- Visão geral dos recursos do Polars a serem cobertos neste manual

Em resumo, o Polars é uma biblioteca de processamento de dados de alto desempenho e escalabilidade que oferece recursos avançados para análise e transformação de dados. Ele é uma alternativa de código aberto e livre de licença a outras bibliotecas populares de processamento de dados e é especialmente útil para lidar com grandes conjuntos de dados que exigem computação distribuída.

## Instalação e Configuração do Polars


- Opções de instalação para o Polars

In [5]:
# # executar no terminal
# conda install -c conda-forge polars
# pip install polars

- Configuração do ambiente de desenvolvimento para uso do Polars

In [None]:
import polars as pl

- Verificação da instalação e teste de funcionalidade básica do Polars


In [6]:
import polars as pl

# Criar um dataframe
df = pl.DataFrame({
    'col1': [1, 2, 3],
    'col2': ['a', 'b', 'c']
})

# Imprimir o dataframe na tela
print(df)


shape: (3, 2)
┌──────┬──────┐
│ col1 ┆ col2 │
│ ---  ┆ ---  │
│ i64  ┆ str  │
╞══════╪══════╡
│ 1    ┆ a    │
│ 2    ┆ b    │
│ 3    ┆ c    │
└──────┴──────┘


## Manipulação de dados com o Polars

- Criação de dataframes e manipulação de dados


In [11]:
import polars as pl

# Criar um dataframe
df = pl.DataFrame({
    'col1': [1, 2, 3],
    'col2': ['a', 'b', 'c']
})

# Selecionar uma coluna
col1 = df['col1']

# Filtrar linhas
filtered_df = df[pl.col('col1').]

# Adicionar colunas
df['col3'] = [4, 5, 6]

# Aplicar uma função a uma coluna
df['col4'] = df['col3'].apply(lambda x: x ** 2)



ValueError: Cannot __getitem__ on DataFrame with item: '[(col("col1")) > (1)]' of type: '<class 'polars.internals.expr.expr.Expr'>'.

- Seleção e filtragem de dados

- Operações de agregação e transformação

- Join de dataframes

- Ordenação de dados

## Tipos de dados suportados pelo Polars

- Tipos numéricos (inteiros e floats)

- Texto e dados categóricos

- Datas e horários

- Valores nulos (nulls)

- Tipos complexos (arrays e structs)

## Desempenho e escalabilidade do Polars

- Uso da biblioteca Rust para desempenho aprimorado

- Suporte para processamento em múltiplos núcleos

- Opções de particionamento e indexação

- Opções de compressão de dados para reduzir o uso de espaço em disco


## Expressões de linguagem funcional no Polars

- Compreensão de expressões funcionais e como elas funcionam no Polars


- Uso de expressões em pipelines de processamento de dados


## Exemplos práticos de uso do Polars

- Análise de dados financeiros

- Processamento de dados geoespaciais

- Análise de logs de servidor

- Análise de dados de ciência de dados e aprendizado de máquina

## Trabalhando com arquivos de dados

- Leitura e escrita de arquivos CSV, JSON, Parquet e outros formatos

- Trabalhando com dados em memória e em disco

- Compressão de dados para reduzir o uso de espaço em disco

## Visualização de dados com Polars

- Uso de bibliotecas de visualização de dados para gerar gráficos e relatórios

- Integração com outras ferramentas de visualização, como Matplotlib e Seaborn

## Polars e outras bibliotecas de processamento de dados

- Comparação do Polars com outras bibliotecas populares, como o Pandas e Dask

- Uso do Polars em conjunto com outras bibliotecas de processamento de dados


## Melhores práticas para uso do Polars

- Boas práticas de programação para trabalhar com o Polars

- Estratégias para melhorar o desempenho e escalabilidade do Polars

- Dicas para solução de problemas e depuração