In [1]:
import duckdb
import pandas as pd

In [2]:
# DataFrame do Pandas
df = pd.DataFrame({
    'user_id': [1, 2, 3, 4, 5],
    'name': ['John Doe', 'Jane Smith', 'Alice Johnson', 'Chris Evans', 'Emily Davis'],
    'age': [28, 34, 23, 45, 30],
    'purchase_amount': [250.75, 300.00, 120.50, 450.00, 80.00],
    'purchase_date': ['2024-08-01', '2024-08-02', '2024-08-03', '2024-08-04', '2024-08-05']
})

In [3]:
# Persistência no disco
con = duckdb.connect(database='db.duckdb')

In [4]:
# Criar uma tabela
con.register('my_df', df)
con.execute("CREATE TABLE clientes AS SELECT * FROM my_df")

<duckdb.duckdb.DuckDBPyConnection at 0x7fcda807d4f0>

In [5]:
# Consultas SQL 
result_df = con.sql("SELECT user_id, name, purchase_amount \
            FROM clientes WHERE purchase_amount > 100")
print("Resultados das consultas iniciais:")
print(result_df)

Resultados das consultas iniciais:
┌─────────┬───────────────┬─────────────────┐
│ user_id │     name      │ purchase_amount │
│  int64  │    varchar    │     double      │
├─────────┼───────────────┼─────────────────┤
│       1 │ John Doe      │          250.75 │
│       2 │ Jane Smith    │           300.0 │
│       3 │ Alice Johnson │           120.5 │
│       4 │ Chris Evans   │           450.0 │
└─────────┴───────────────┴─────────────────┘



In [6]:
# Fechar a conexão
con.close()

### Testar dados do arquivo

In [7]:
# Reabrir a conexão com banco de disco
con = duckdb.connect(database='db.duckdb')

In [8]:
loaded_df = con.sql("SELECT * FROM clientes")
print("\nDados carregados do disco:")
print(loaded_df)


Dados carregados do disco:
┌─────────┬───────────────┬───────┬─────────────────┬───────────────┐
│ user_id │     name      │  age  │ purchase_amount │ purchase_date │
│  int64  │    varchar    │ int64 │     double      │    varchar    │
├─────────┼───────────────┼───────┼─────────────────┼───────────────┤
│       1 │ John Doe      │    28 │          250.75 │ 2024-08-01    │
│       2 │ Jane Smith    │    34 │           300.0 │ 2024-08-02    │
│       3 │ Alice Johnson │    23 │           120.5 │ 2024-08-03    │
│       4 │ Chris Evans   │    45 │           450.0 │ 2024-08-04    │
│       5 │ Emily Davis   │    30 │            80.0 │ 2024-08-05    │
└─────────┴───────────────┴───────┴─────────────────┴───────────────┘



### Atualização

In [9]:
con.execute("UPDATE clientes SET purchase_amount = purchase_amount * 1.10")

<duckdb.duckdb.DuckDBPyConnection at 0x7fcda831b170>

In [10]:
updated_df = con.sql("SELECT * FROM clientes")
print("\nDados após as alterações:")
print(updated_df)


Dados após as alterações:
┌─────────┬───────────────┬───────┬────────────────────┬───────────────┐
│ user_id │     name      │  age  │  purchase_amount   │ purchase_date │
│  int64  │    varchar    │ int64 │       double       │    varchar    │
├─────────┼───────────────┼───────┼────────────────────┼───────────────┤
│       1 │ John Doe      │    28 │ 275.82500000000005 │ 2024-08-01    │
│       2 │ Jane Smith    │    34 │              330.0 │ 2024-08-02    │
│       3 │ Alice Johnson │    23 │             132.55 │ 2024-08-03    │
│       4 │ Chris Evans   │    45 │ 495.00000000000006 │ 2024-08-04    │
│       5 │ Emily Davis   │    30 │               88.0 │ 2024-08-05    │
└─────────┴───────────────┴───────┴────────────────────┴───────────────┘



In [11]:
con.close()