In [1]:
import duckdb
import polars as pl

In [2]:
"""
. Usa in-memory database que eh armazenada globalmente dentro de um modulo python
. O resultado de uma query eh retornado como uma Relation, que eh uma representacao simbolica da query
. A query nao eh executada ate que o resultado seja buscado (fetched) ou requisitado para ser exibido na tela

"""
duckdb.sql("select 42").show()

┌───────┐
│  42   │
│ int32 │
├───────┤
│    42 │
└───────┘



In [3]:
"""
. Relations podem ser referenciadas em queries subsequentes atraves de seu armazenamento em variaveis, e usando elas como tabelas
"""
q1 = duckdb.sql("select 42 as i")
duckdb.sql("select i* 2 as k from q1").show()

┌───────┐
│   k   │
│ int32 │
├───────┤
│    84 │
└───────┘



In [None]:
"""
-> DATA INPUT
- DuckDB pode ingerir dados de uma ampla variedade de formatos, tanto em disco quanto em in-memory
. duckdb.read_csv("example.csv")
. duckdb.read_parquet("example.parquet")
. duckdb.read_json("example.json")

- Diretamente de arquivos
. duckdb.sql("select * from 'example.csv'")
. duckdb.sql("select * from 'example.parquet'")
. duckdb.sql("select * from 'example.json'")
"""

In [5]:
"""
-> DataFrames
- DuckDB pode realizar query diretamente em Pandas DFs, Polars DFs e Arrow tables.
- No entanto, essas queries so podem ser de leituras
"""

polars_df = pl.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})

duckdb.sql("select * from polars_df").show()

┌───────┬───────┐
│   a   │   b   │
│ int64 │ int64 │
├───────┼───────┤
│     1 │     4 │
│     2 │     5 │
│     3 │     6 │
└───────┴───────┘



In [None]:
"""
-> Data Output
- DuckDB pode converter querys eficientemente em diferentes formatos, como
duckdb.sql("SELECT 42").fetchall()   # Python objects
duckdb.sql("SELECT 42").df()         # Pandas DataFrame
duckdb.sql("SELECT 42").pl()         # Polars DataFrame
duckdb.sql("SELECT 42").arrow()      # Arrow Table
duckdb.sql("SELECT 42").fetchnumpy() # NumPy Arrays
"""

In [None]:
"""
-> Escrevendo dados no disco
- Usando metodos
duckdb.sql("SELECT 42").write_parquet("out.parquet") # Write to a Parquet file
duckdb.sql("SELECT 42").write_csv("out.csv")         # Write to a CSV file

- Usando SQl
duckdb.sql("COPY (SELECT 42) TO 'out.parquet'")      # Copy to a Parquet file
"""