# Cap√≠tulo 01 - Introdu√ß√£o ao SQL com DuckDB

Este notebook apresenta os conceitos fundamentais de SQL usando DuckDB, um banco de dados anal√≠tico in-process de alta performance. Vamos explorar desde a instala√ß√£o at√© opera√ß√µes avan√ßadas como jun√ß√µes e agrega√ß√µes.

## T√≥picos Abordados:
1. Instala√ß√£o de Depend√™ncias
2. Imports e Configura√ß√£o Inicial
3. Cria√ß√£o de Tabelas e Estruturas
4. Inser√ß√£o de Dados (INSERT)
5. Consultas B√°sicas (SELECT)
6. Express√µes e C√°lculos
7. Filtros com WHERE
8. Ordena√ß√£o (ORDER BY)
9. Valores √önicos (DISTINCT)
10. Jun√ß√µes de Tabelas (JOINS)
11. Fun√ß√µes de Agrega√ß√£o
12. Agrupamento (GROUP BY)
13. Filtros em Grupos (HAVING)
14. Atualiza√ß√£o de Dados (UPDATE)
15. Exclus√£o de Dados (DELETE)

## 1. Instala√ß√£o de Depend√™ncias

Primeiro, vamos instalar o DuckDB. O `-q` suprime a sa√≠da detalhada da instala√ß√£o.

In [1]:
%pip install duckdb -q

Note: you may need to restart the kernel to use updated packages.


## 2. Imports e Configura√ß√£o Inicial

Importando as bibliotecas necess√°rias:
- `duckdb`: Biblioteca principal para trabalhar com DuckDB
- `os`: Para opera√ß√µes do sistema operacional (se necess√°rio)

In [2]:
# -*- coding: utf-8 -*-
import duckdb
import os

print("‚úì Bibliotecas importadas com sucesso!")
print(f"Vers√£o do DuckDB: {duckdb.__version__}")

‚úì Bibliotecas importadas com sucesso!
Vers√£o do DuckDB: 1.4.3


## 3. Cria√ß√£o de Tabelas e Estruturas

Vamos criar um banco de dados em mem√≥ria e duas tabelas de exemplo:
- **weather**: Armazena informa√ß√µes meteorol√≥gicas
- **cities**: Armazena informa√ß√µes de localiza√ß√£o das cidades

### Banco de Dados em Mem√≥ria
Usar `:memory:` cria um banco tempor√°rio que existe apenas durante a execu√ß√£o do programa.

In [3]:
# Conectar ao banco em mem√≥ria
con = duckdb.connect(database=':memory:')

# Criar tabelas
con.execute("""
CREATE TABLE weather (
    city VARCHAR,         -- Nome da cidade
    temp_lo INTEGER,      -- Temperatura m√≠nima
    temp_hi INTEGER,      -- Temperatura m√°xima
    prcp FLOAT,          -- Precipita√ß√£o
    date DATE            -- Data da medi√ß√£o
);

CREATE TABLE cities (
    name VARCHAR,        -- Nome da cidade
    lat DECIMAL,        -- Latitude
    lon DECIMAL         -- Longitude
);
""")

print("‚úì Tabelas 'weather' e 'cities' criadas com sucesso!")
print(con.fetchall())

‚úì Tabelas 'weather' e 'cities' criadas com sucesso!
[]


## 4. Inser√ß√£o de Dados (INSERT)

Existem diferentes formas de inserir dados em uma tabela:

### 4.1 Inser√ß√£o B√°sica
Valores na ordem exata das colunas da tabela.

In [4]:
# Inser√ß√£o b√°sica - valores na ordem das colunas
con.execute("""
INSERT INTO weather VALUES ('San Francisco', 46, 50, 0.25, '1994-11-27');
""")
print("‚úì Registro inserido (m√©todo b√°sico)")
print(con.fetchall())

‚úì Registro inserido (m√©todo b√°sico)
[(1,)]


### 4.2 Inser√ß√£o com Colunas Expl√≠citas
Especificando quais colunas estamos preenchendo (mais seguro e leg√≠vel).

In [5]:
# Inser√ß√£o com colunas expl√≠citas
con.execute("""
INSERT INTO weather (city, temp_lo, temp_hi, prcp, date)
VALUES ('San Francisco', 43, 57, 0.0, '1994-11-29');
""")
print("‚úì Registro inserido (colunas expl√≠citas)")
print(con.fetchall())

‚úì Registro inserido (colunas expl√≠citas)
[(1,)]


### 4.3 Inser√ß√£o Omitindo Colunas
Colunas n√£o especificadas recebem valor NULL.

In [6]:
# Inser√ß√£o omitindo colunas (valores ser√£o NULL)
con.execute("""
INSERT INTO weather (date, city, temp_hi, temp_lo)
VALUES ('1994-11-29', 'Hayward', 54, 37);
""")
print("‚úì Registro inserido (com valores NULL em prcp)")
print(con.fetchall())

‚úì Registro inserido (com valores NULL em prcp)
[(1,)]


### 4.4 Inserir Dados na Tabela Cities
Vamos adicionar algumas cidades para demonstrar jun√ß√µes posteriormente.

In [7]:
# Inserir dados de localiza√ß√£o das cidades
con.execute("""
INSERT INTO cities VALUES ('San Francisco', 37.7749, -122.4194);
INSERT INTO cities VALUES ('Hayward', 37.6688, -122.0808);
""")
print("‚úì Cidades inseridas na tabela 'cities'")
print(con.fetchall())

‚úì Cidades inseridas na tabela 'cities'
[(1,)]


## 5. Consultas B√°sicas (SELECT)

O comando SELECT √© usado para recuperar dados das tabelas.

### 5.1 Selecionar Todas as Colunas

In [8]:
# Selecionar todas as colunas usando *
resultado = con.execute("""
SELECT * FROM weather;
""")
print("Todos os registros de 'weather':")
print(resultado.fetchall())

Todos os registros de 'weather':
[('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27)), ('San Francisco', 43, 57, 0.0, datetime.date(1994, 11, 29)), ('Hayward', 37, 54, None, datetime.date(1994, 11, 29))]


### 5.2 Selecionar Colunas Espec√≠ficas
√â uma boa pr√°tica especificar apenas as colunas necess√°rias.

In [9]:
# Selecionar colunas espec√≠ficas
resultado = con.execute("""
SELECT city, temp_lo, temp_hi, prcp, date FROM weather;
""")
print("Colunas espec√≠ficas:")
print(resultado.fetchall())

Colunas espec√≠ficas:
[('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27)), ('San Francisco', 43, 57, 0.0, datetime.date(1994, 11, 29)), ('Hayward', 37, 54, None, datetime.date(1994, 11, 29))]


## 6. Express√µes e C√°lculos

Podemos realizar c√°lculos diretamente nas queries SQL.

### 6.1 Calcular Temperatura M√©dia
Usando operadores aritm√©ticos e alias (AS) para nomear colunas calculadas.

In [10]:
# Calcular temperatura m√©dia
resultado = con.execute("""
SELECT 
    city, 
    temp_lo,
    temp_hi,
    (temp_hi + temp_lo) / 2 AS temp_avg, 
    date
FROM weather;
""")
print("Temperatura m√©dia calculada:")
print(resultado.fetchall())

Temperatura m√©dia calculada:
[('San Francisco', 46, 50, 48.0, datetime.date(1994, 11, 27)), ('San Francisco', 43, 57, 50.0, datetime.date(1994, 11, 29)), ('Hayward', 37, 54, 45.5, datetime.date(1994, 11, 29))]


### 6.2 Outros C√°lculos
Exemplos adicionais de express√µes aritm√©ticas.

In [11]:
# Calcular amplitude t√©rmica (diferen√ßa entre max e min)
resultado = con.execute("""
SELECT 
    city,
    temp_hi,
    temp_lo,
    (temp_hi - temp_lo) AS amplitude,
    date
FROM weather;
""")
print("Amplitude t√©rmica:")
print(resultado.fetchall())

Amplitude t√©rmica:
[('San Francisco', 50, 46, 4, datetime.date(1994, 11, 27)), ('San Francisco', 57, 43, 14, datetime.date(1994, 11, 29)), ('Hayward', 54, 37, 17, datetime.date(1994, 11, 29))]


## 7. Filtros com WHERE

A cl√°usula WHERE permite filtrar resultados com base em condi√ß√µes.

### 7.1 Filtro Simples com AND

In [12]:
# Filtrar por cidade E precipita√ß√£o
resultado = con.execute("""
SELECT * FROM weather
WHERE city = 'San Francisco' AND prcp > 0.0;
""")
print("Dias chuvosos em San Francisco:")
print(resultado.fetchall())

Dias chuvosos em San Francisco:
[('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27))]


### 7.2 Filtros com Operadores de Compara√ß√£o

In [13]:
# Filtrar por temperatura
resultado = con.execute("""
SELECT city, temp_hi, date FROM weather
WHERE temp_hi >= 50;
""")
print("Dias com temperatura m√°xima >= 50¬∞F:")
print(resultado.fetchall())

Dias com temperatura m√°xima >= 50¬∞F:
[('San Francisco', 50, datetime.date(1994, 11, 27)), ('San Francisco', 57, datetime.date(1994, 11, 29)), ('Hayward', 54, datetime.date(1994, 11, 29))]


### 7.3 Filtros com OR

In [14]:
# Filtrar com OR
resultado = con.execute("""
SELECT * FROM weather
WHERE city = 'San Francisco' OR city = 'Hayward';
""")
print("Registros de San Francisco ou Hayward:")
print(resultado.fetchall())

Registros de San Francisco ou Hayward:
[('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27)), ('San Francisco', 43, 57, 0.0, datetime.date(1994, 11, 29)), ('Hayward', 37, 54, None, datetime.date(1994, 11, 29))]


## 8. Ordena√ß√£o (ORDER BY)

ORDER BY organiza os resultados em ordem crescente (ASC) ou decrescente (DESC).

### 8.1 Ordenar por Uma Coluna

In [15]:
# Ordenar por cidade (ordem alfab√©tica)
resultado = con.execute("""
SELECT * FROM weather ORDER BY city;
""")
print("Ordenado por cidade (ASC - padr√£o):")
print(resultado.fetchall())

Ordenado por cidade (ASC - padr√£o):
[('Hayward', 37, 54, None, datetime.date(1994, 11, 29)), ('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27)), ('San Francisco', 43, 57, 0.0, datetime.date(1994, 11, 29))]


### 8.2 Ordenar por M√∫ltiplas Colunas

In [16]:
# Ordenar por cidade e depois por temperatura m√≠nima
resultado = con.execute("""
SELECT * FROM weather ORDER BY city, temp_lo;
""")
print("Ordenado por cidade e temp_lo:")
print(resultado.fetchall())

Ordenado por cidade e temp_lo:
[('Hayward', 37, 54, None, datetime.date(1994, 11, 29)), ('San Francisco', 43, 57, 0.0, datetime.date(1994, 11, 29)), ('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27))]


### 8.3 Ordena√ß√£o Decrescente

In [17]:
# Ordenar por temperatura m√°xima em ordem decrescente
resultado = con.execute("""
SELECT city, temp_hi, date FROM weather 
ORDER BY temp_hi DESC;
""")
print("Ordenado por temp_hi (DESC):")
print(resultado.fetchall())

Ordenado por temp_hi (DESC):
[('San Francisco', 57, datetime.date(1994, 11, 29)), ('Hayward', 54, datetime.date(1994, 11, 29)), ('San Francisco', 50, datetime.date(1994, 11, 27))]


## 9. Valores √önicos (DISTINCT)

DISTINCT remove duplicatas dos resultados.

### 9.1 Obter Cidades √önicas

In [18]:
# Obter lista de cidades √∫nicas
resultado = con.execute("""
SELECT DISTINCT city FROM weather;
""")
print("Cidades √∫nicas:")
print(resultado.fetchall())

Cidades √∫nicas:
[('Hayward',), ('San Francisco',)]


### 9.2 DISTINCT com ORDER BY

In [19]:
# DISTINCT com ordena√ß√£o
resultado = con.execute("""
SELECT DISTINCT city FROM weather 
ORDER BY city;
""")
print("Cidades √∫nicas ordenadas:")
print(resultado.fetchall())

Cidades √∫nicas ordenadas:
[('Hayward',), ('San Francisco',)]


## 10. Jun√ß√µes de Tabelas (JOINS)

JOINS combinam dados de m√∫ltiplas tabelas.

### 10.1 Jun√ß√£o Impl√≠cita (Cross Join com WHERE)
M√©todo antigo, mas ainda funcional.

In [20]:
# Jun√ß√£o impl√≠cita
resultado = con.execute("""
SELECT * FROM weather, cities
WHERE city = name;
""")
print("Jun√ß√£o impl√≠cita (cross join + where):")
print(resultado.fetchall())

Jun√ß√£o impl√≠cita (cross join + where):
[('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27), 'San Francisco', Decimal('37.775'), Decimal('-122.419')), ('San Francisco', 43, 57, 0.0, datetime.date(1994, 11, 29), 'San Francisco', Decimal('37.775'), Decimal('-122.419')), ('Hayward', 37, 54, None, datetime.date(1994, 11, 29), 'Hayward', Decimal('37.669'), Decimal('-122.081'))]


### 10.2 Jun√ß√£o com Colunas Espec√≠ficas

In [21]:
# Especificando colunas na jun√ß√£o
resultado = con.execute("""
SELECT city, temp_lo, temp_hi, prcp, date, lon, lat
FROM weather, cities
WHERE city = name;
""")
print("Jun√ß√£o com colunas espec√≠ficas:")
print(resultado.fetchall())

Jun√ß√£o com colunas espec√≠ficas:
[('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27), Decimal('-122.419'), Decimal('37.775')), ('San Francisco', 43, 57, 0.0, datetime.date(1994, 11, 29), Decimal('-122.419'), Decimal('37.775')), ('Hayward', 37, 54, None, datetime.date(1994, 11, 29), Decimal('-122.081'), Decimal('37.669'))]


### 10.3 INNER JOIN
Retorna apenas registros que t√™m correspond√™ncia em ambas as tabelas.

In [22]:
# INNER JOIN expl√≠cito
resultado = con.execute("""
SELECT 
    weather.city,
    weather.temp_lo,
    weather.temp_hi,
    cities.lat,
    cities.lon
FROM weather
INNER JOIN cities ON weather.city = cities.name;
""")
print("INNER JOIN:")
print(resultado.fetchall())

INNER JOIN:
[('San Francisco', 46, 50, Decimal('37.775'), Decimal('-122.419')), ('San Francisco', 43, 57, Decimal('37.775'), Decimal('-122.419')), ('Hayward', 37, 54, Decimal('37.669'), Decimal('-122.081'))]


### 10.4 LEFT OUTER JOIN
Retorna todos os registros da tabela da esquerda, mesmo sem correspond√™ncia.

In [23]:
# LEFT OUTER JOIN
resultado = con.execute("""
SELECT 
    weather.city,
    weather.temp_lo,
    weather.temp_hi,
    cities.lat,
    cities.lon
FROM weather
LEFT OUTER JOIN cities ON weather.city = cities.name;
""")
print("LEFT OUTER JOIN (inclui registros sem match):")
print(resultado.fetchall())

LEFT OUTER JOIN (inclui registros sem match):
[('San Francisco', 46, 50, Decimal('37.775'), Decimal('-122.419')), ('San Francisco', 43, 57, Decimal('37.775'), Decimal('-122.419')), ('Hayward', 37, 54, Decimal('37.669'), Decimal('-122.081'))]


## 11. Fun√ß√µes de Agrega√ß√£o

Fun√ß√µes que calculam valores agregados de um conjunto de linhas.

### 11.1 MAX - Valor M√°ximo

In [24]:
# Encontrar o valor m√°ximo de temperatura m√≠nima
resultado = con.execute("""
SELECT max(temp_lo) AS max_temp_lo FROM weather;
""")
print("Temperatura m√≠nima mais alta:")
print(resultado.fetchall())

Temperatura m√≠nima mais alta:
[(46,)]


### 11.2 MIN - Valor M√≠nimo

In [25]:
# Encontrar o valor m√≠nimo de temperatura m√°xima
resultado = con.execute("""
SELECT min(temp_hi) AS min_temp_hi FROM weather;
""")
print("Temperatura m√°xima mais baixa:")
print(resultado.fetchall())

Temperatura m√°xima mais baixa:
[(50,)]


### 11.3 AVG - M√©dia

In [26]:
# Calcular m√©dia de temperatura
resultado = con.execute("""
SELECT 
    avg(temp_lo) AS avg_temp_lo,
    avg(temp_hi) AS avg_temp_hi
FROM weather;
""")
print("M√©dia das temperaturas:")
print(resultado.fetchall())

M√©dia das temperaturas:
[(42.0, 53.666666666666664)]


### 11.4 COUNT - Contar Registros

In [27]:
# Contar registros
resultado = con.execute("""
SELECT 
    count(*) AS total_registros,
    count(prcp) AS registros_com_prcp
FROM weather;
""")
print("Contagem de registros:")
print(resultado.fetchall())

Contagem de registros:
[(3, 2)]


### 11.5 Subconsulta com Agrega√ß√£o
Encontrar a cidade com a temperatura m√≠nima mais alta.

In [28]:
# Encontrar a cidade com a temperatura m√≠nima mais alta
resultado = con.execute("""
SELECT city, temp_lo, date FROM weather
WHERE temp_lo = (SELECT max(temp_lo) FROM weather);
""")
print("Cidade com temp_lo mais alta:")
print(resultado.fetchall())

Cidade com temp_lo mais alta:
[('San Francisco', 46, datetime.date(1994, 11, 27))]


## 12. Agrupamento (GROUP BY)

GROUP BY agrupa linhas que t√™m valores iguais em colunas espec√≠ficas.

### 12.1 Agrupar por Cidade

In [29]:
# Agrupar por cidade e calcular m√°ximo
resultado = con.execute("""
SELECT 
    city, 
    max(temp_lo) AS max_temp_lo
FROM weather 
GROUP BY city;
""")
print("Temperatura m√≠nima mais alta por cidade:")
print(resultado.fetchall())

Temperatura m√≠nima mais alta por cidade:
[('San Francisco', 46), ('Hayward', 37)]


### 12.2 M√∫ltiplas Agrega√ß√µes

In [30]:
# M√∫ltiplas fun√ß√µes de agrega√ß√£o
resultado = con.execute("""
SELECT 
    city,
    count(*) AS num_registros,
    min(temp_lo) AS min_temp_lo,
    max(temp_hi) AS max_temp_hi,
    avg((temp_hi + temp_lo) / 2) AS avg_temp
FROM weather
GROUP BY city;
""")
print("Estat√≠sticas por cidade:")
print(resultado.fetchall())

Estat√≠sticas por cidade:
[('San Francisco', 2, 43, 57, 49.0), ('Hayward', 1, 37, 54, 45.5)]


## 13. Filtros em Grupos (HAVING)

HAVING filtra grupos ap√≥s o GROUP BY (WHERE filtra antes).

### 13.1 Filtrar Grupos

In [31]:
# Filtrar grupos com HAVING
resultado = con.execute("""
SELECT city, max(temp_lo) AS max_temp_lo
FROM weather
GROUP BY city
HAVING max(temp_lo) < 40;
""")
print("Cidades com temp_lo m√°xima < 40:")
print(resultado.fetchall())

Cidades com temp_lo m√°xima < 40:
[('Hayward', 37)]


### 13.2 Combinando WHERE e HAVING
WHERE filtra linhas antes do agrupamento, HAVING filtra grupos.

In [32]:
# Combinar WHERE e HAVING
resultado = con.execute("""
SELECT city, max(temp_lo) AS max_temp_lo
FROM weather
WHERE city LIKE 'S%'  -- Filtro antes do agrupamento
GROUP BY city
HAVING max(temp_lo) < 50;  -- Filtro depois do agrupamento
""")
print("Cidades come√ßando com 'S' e temp_lo m√°xima < 50:")
print(resultado.fetchall())

Cidades come√ßando com 'S' e temp_lo m√°xima < 50:
[('San Francisco', 46)]


### 13.3 HAVING com M√∫ltiplas Condi√ß√µes

In [33]:
# HAVING com m√∫ltiplas condi√ß√µes
resultado = con.execute("""
SELECT 
    city,
    count(*) AS num_registros,
    avg(temp_hi) AS avg_temp_hi
FROM weather
GROUP BY city
HAVING count(*) >= 1 AND avg(temp_hi) > 50;
""")
print("Cidades com m√∫ltiplos registros e temp_hi m√©dia > 50:")
print(resultado.fetchall())

Cidades com m√∫ltiplos registros e temp_hi m√©dia > 50:
[('San Francisco', 2, 53.5), ('Hayward', 1, 54.0)]


## 14. Atualiza√ß√£o de Dados (UPDATE)

UPDATE modifica registros existentes.

### 14.1 Atualizar Uma Coluna
‚ö†Ô∏è **IMPORTANTE**: Sempre use WHERE para evitar atualizar todos os registros!

In [34]:
# Atualizar uma coluna espec√≠fica
con.execute("""
UPDATE weather
SET prcp = 0.0
WHERE prcp IS NULL;
""")
print("‚úì Valores NULL de prcp atualizados para 0.0")
print(con.fetchall())

# Verificar a atualiza√ß√£o
resultado = con.execute("SELECT * FROM weather;")
print("\nDados ap√≥s atualiza√ß√£o:")
print(resultado.fetchall())

‚úì Valores NULL de prcp atualizados para 0.0
[(1,)]

Dados ap√≥s atualiza√ß√£o:
[('San Francisco', 46, 50, 0.25, datetime.date(1994, 11, 27)), ('San Francisco', 43, 57, 0.0, datetime.date(1994, 11, 29)), ('Hayward', 37, 54, 0.0, datetime.date(1994, 11, 29))]


### 14.2 Atualizar M√∫ltiplas Colunas

In [35]:
# Atualizar m√∫ltiplas colunas
con.execute("""
UPDATE weather
SET temp_hi = temp_hi - 2, 
    temp_lo = temp_lo - 2
WHERE date > '1994-11-28';
""")
print("‚úì Temperaturas ajustadas para datas > '1994-11-28'")
print(con.fetchall())

# Verificar a atualiza√ß√£o
resultado = con.execute("SELECT * FROM weather WHERE date > '1994-11-28';")
print("\nRegistros atualizados:")
print(resultado.fetchall())

‚úì Temperaturas ajustadas para datas > '1994-11-28'
[(2,)]

Registros atualizados:
[('San Francisco', 41, 55, 0.0, datetime.date(1994, 11, 29)), ('Hayward', 35, 52, 0.0, datetime.date(1994, 11, 29))]


### 14.3 Atualiza√ß√£o com C√°lculo

In [36]:
# Atualiza√ß√£o usando c√°lculo baseado em valores existentes
con.execute("""
UPDATE weather
SET temp_hi = temp_hi + 5
WHERE city = 'San Francisco';
""")
print("‚úì Temperatura m√°xima aumentada em 5¬∞F para San Francisco")
print(con.fetchall())

# Verificar
resultado = con.execute("SELECT * FROM weather WHERE city = 'San Francisco';")
print("\nRegistros de San Francisco:")
print(resultado.fetchall())

‚úì Temperatura m√°xima aumentada em 5¬∞F para San Francisco
[(2,)]

Registros de San Francisco:
[('San Francisco', 46, 55, 0.25, datetime.date(1994, 11, 27)), ('San Francisco', 41, 60, 0.0, datetime.date(1994, 11, 29))]


## 15. Exclus√£o de Dados (DELETE)

DELETE remove registros das tabelas.

### 15.1 Deletar Linhas Espec√≠ficas
‚ö†Ô∏è **SEMPRE use WHERE** para especificar quais linhas deletar!

In [37]:
# Deletar linhas espec√≠ficas
con.execute("""
DELETE FROM weather 
WHERE city = 'Hayward';
""")
print("‚úì Registros de Hayward deletados")
print(con.fetchall())

# Verificar
resultado = con.execute("SELECT * FROM weather;")
print("\nRegistros restantes:")
print(resultado.fetchall())

‚úì Registros de Hayward deletados
[(1,)]

Registros restantes:
[('San Francisco', 46, 55, 0.25, datetime.date(1994, 11, 27)), ('San Francisco', 41, 60, 0.0, datetime.date(1994, 11, 29))]


### 15.2 Deletar com Condi√ß√µes M√∫ltiplas

In [38]:
# Deletar com m√∫ltiplas condi√ß√µes
con.execute("""
DELETE FROM weather
WHERE temp_hi < 50 AND prcp = 0.0;
""")
print("‚úì Deletados registros com temp_hi < 50 e sem precipita√ß√£o")
print(con.fetchall())

# Verificar
resultado = con.execute("SELECT * FROM weather;")
print("\nRegistros restantes:")
print(resultado.fetchall())

‚úì Deletados registros com temp_hi < 50 e sem precipita√ß√£o
[(0,)]

Registros restantes:
[('San Francisco', 46, 55, 0.25, datetime.date(1994, 11, 27)), ('San Francisco', 41, 60, 0.0, datetime.date(1994, 11, 29))]


### ‚ö†Ô∏è 15.3 CUIDADO: DELETE sem WHERE

**NUNCA execute DELETE sem WHERE em produ√ß√£o!**

Isso remove **TODAS** as linhas da tabela!

In [39]:
# ‚ö†Ô∏è PERIGO: Isso remove TODAS as linhas!
# Descomente apenas se tiver certeza:
# con.execute("DELETE FROM weather;")

print("‚ö†Ô∏è DELETE sem WHERE remove TODOS os registros!")
print("Execute com muito cuidado!")

# Verificar quantos registros temos
resultado = con.execute("SELECT count(*) FROM weather;")
print(f"\nRegistros atuais na tabela: {resultado.fetchall()}")

‚ö†Ô∏è DELETE sem WHERE remove TODOS os registros!
Execute com muito cuidado!

Registros atuais na tabela: [(2,)]


## üéØ Resumo do Cap√≠tulo

Neste cap√≠tulo, exploramos:

1. ‚úÖ **Instala√ß√£o** do DuckDB
2. ‚úÖ **Cria√ß√£o de tabelas** e estruturas
3. ‚úÖ **Inser√ß√£o de dados** (INSERT)
4. ‚úÖ **Consultas b√°sicas** (SELECT)
5. ‚úÖ **Express√µes e c√°lculos** em queries
6. ‚úÖ **Filtros** com WHERE
7. ‚úÖ **Ordena√ß√£o** com ORDER BY
8. ‚úÖ **Valores √∫nicos** com DISTINCT
9. ‚úÖ **Jun√ß√µes** (INNER JOIN, LEFT OUTER JOIN)
10. ‚úÖ **Fun√ß√µes de agrega√ß√£o** (MAX, MIN, AVG, COUNT)
11. ‚úÖ **Agrupamento** com GROUP BY
12. ‚úÖ **Filtros de grupos** com HAVING
13. ‚úÖ **Atualiza√ß√£o** de dados (UPDATE)
14. ‚úÖ **Exclus√£o** de dados (DELETE)

### Pr√≥ximos Passos
No pr√≥ximo cap√≠tulo, exploraremos instala√ß√£o e configura√ß√£o avan√ßada do DuckDB!

## üßπ Limpeza (Opcional)

Fechar a conex√£o quando terminar.

In [None]:
# Fechar conex√£o
#con.close()
print("‚úì Conex√£o fechada")

‚úì Conex√£o fechada


In [41]:
con.execute("""
-- Atualizar m√∫ltiplas colunas
UPDATE weather
SET temp_hi = temp_hi - 2, temp_lo = temp_lo - 2
WHERE date > '1994-11-28';
""")
print(con.fetchall())

ConnectionException: Connection Error: Connection already closed!

## 14. Atualiza√ß√£o de Dados (UPDATE)

Modificando registros existentes.

In [None]:
con.execute("""
-- Cidades que come√ßam com 'S'
SELECT city, max(temp_lo) FROM weather
WHERE city LIKE 'S%'
GROUP BY city
HAVING max(temp_lo) < 40;
""")
print(con.fetchall())

### Combinando WHERE e HAVING

In [None]:
con.execute("""
-- Filtrar grupos
SELECT city, max(temp_lo) FROM weather
GROUP BY city
HAVING max(temp_lo) < 40;
""")
print(con.fetchall())

## 13. Filtros em Grupos (HAVING)

Filtrando resultados ap√≥s agrupamento.

In [None]:
con.execute("""
-- Agrupar por cidade
SELECT city, max(temp_lo) FROM weather GROUP BY city;
""")
print(con.fetchall())

## 12. Agrupamento (GROUP BY)

Agrupando dados para c√°lculos agregados.

In [None]:
con.execute("""
-- Encontrar o valor m√°ximo
SELECT max(temp_lo) FROM weather;

-- Encontrar a cidade com a temperatura m√≠nima mais alta
SELECT city FROM weather
WHERE temp_lo = (SELECT max(temp_lo) FROM weather);
""")
print(con.fetchall())

## 11. Fun√ß√µes de Agrega√ß√£o

Fun√ß√µes para calcular valores agregados (MAX, MIN, AVG, etc.).

In [None]:
con.execute("""
SELECT * FROM weather
LEFT OUTER JOIN cities ON weather.city = cities.name;
""")
print(con.fetchall())

### LEFT OUTER JOIN

In [None]:
con.execute("""
SELECT * FROM weather
INNER JOIN cities ON weather.city = cities.name;
""")
print(con.fetchall())

### INNER JOIN

In [None]:
con.execute("""
-- Jun√ß√£o impl√≠cita
SELECT * FROM weather, cities
WHERE city = name;

-- Especificando colunas
SELECT city, temp_lo, temp_hi, prcp, date, lon, lat
FROM weather, cities
WHERE city = name;
""")
print(con.fetchall())

## 10. Jun√ß√µes de Tabelas (JOINS)

Combinando dados de m√∫ltiplas tabelas.

In [None]:
con.execute("""
-- Obter cidades √∫nicas
SELECT DISTINCT city FROM weather;

-- DISTINCT com ordena√ß√£o
SELECT DISTINCT city FROM weather ORDER BY city;
""")
print(con.fetchall())

## 9. Valores √önicos (DISTINCT)

Removendo duplicatas nos resultados.

In [None]:
con.execute("""
-- Ordenar por uma coluna
SELECT * FROM weather ORDER BY city;

-- Ordenar por m√∫ltiplas colunas
SELECT * FROM weather ORDER BY city, temp_lo;
""")
print(con.fetchall())

## 8. Ordena√ß√£o (ORDER BY)

Ordenando resultados.

In [None]:
con.execute("""
-- Filtro simples
SELECT * FROM weather
WHERE city = 'San Francisco' AND prcp > 0.0;
""")
print(con.fetchall())

## 7. Filtros com WHERE

Filtrando resultados com condi√ß√µes.

In [None]:
con.execute("""
-- Calcular temperatura m√©dia
SELECT city, (temp_hi + temp_lo) / 2 AS temp_avg, date
FROM weather;
""")
print(con.fetchall())

## 6. Express√µes e C√°lculos

Realizando c√°lculos em queries.

In [None]:
con.execute("""
-- Selecionar todas as colunas
SELECT * FROM weather;

-- Selecionar colunas espec√≠ficas
SELECT city, temp_lo, temp_hi, prcp, date FROM weather;
""")
print(con.fetchall())

## 5. Consultas B√°sicas (SELECT)

Selecionando dados das tabelas.

In [None]:
con.execute("""
-- Inser√ß√£o b√°sica
INSERT INTO weather VALUES ('San Francisco', 46, 50, 0.25, '1994-11-27');

-- Inser√ß√£o com colunas expl√≠citas
INSERT INTO weather (city, temp_lo, temp_hi, prcp, date)
VALUES ('San Francisco', 43, 57, 0.0, '1994-11-29');

-- Inser√ß√£o omitindo colunas (valores ser√£o NULL)
INSERT INTO weather (date, city, temp_hi, temp_lo)
VALUES ('1994-11-29', 'Hayward', 54, 37);
""")
print(con.fetchall())

## 4. Inser√ß√£o de Dados (INSERT)

Diferentes formas de inserir dados nas tabelas.

In [None]:
# Conectar ao banco em mem√≥ria
import duckdb
con = duckdb.connect(database=':memory:')

# Criar tabelas
con.execute("""
CREATE TABLE weather (
    city VARCHAR,
    temp_lo INTEGER,      -- temperatura m√≠nima
    temp_hi INTEGER,      -- temperatura m√°xima
    prcp FLOAT,
    date DATE
);

CREATE TABLE cities (
    name VARCHAR,
    lat DECIMAL,
    lon DECIMAL
);
""")
print(con.fetchall())

## 3. Cria√ß√£o de Tabelas e Estruturas

Criando tabelas de exemplo para demonstrar opera√ß√µes SQL.

## 2. Imports e Configura√ß√£o Inicial

Importando bibliotecas e criando conex√£o em mem√≥ria.

In [None]:
# Instala√ß√£o de depend√™ncias
%pip install duckdb -q

## 1. Instala√ß√£o de Depend√™ncias

Instalando o DuckDB para come√ßar.