# PostgreSQL básico para uso em projetos de ML/Back-end

**Conteúdo:**
- conexão via SQLAlchemy
- DDL (CREATE TABLE)
- DML (INSERT, SELECT, UPDATE, DELETE)
- filtros, ORDER BY, LIMIT
- agregações, GROUP BY, HAVING
- JOIN (INNER / LEFT)
- noções de transação

**Pré-requisitos:**
- PostgreSQL instalado
- banco criado (ex.: estudos_ml)
- `pip install sqlalchemy psycopg2-binary pandas`

In [12]:
!pip install sqlalchemy pandas psycopg2-binary



### 0. Criando o banco de dados

In [13]:
import psycopg2
from psycopg2 import sql

# Conexão ao servidor PostgreSQL (usando banco postgres padrão)
conn = psycopg2.connect(
    host="localhost",
    user="usuario",
    password="senha",
    port="5432",
    database="postgres"
)

conn.autocommit = True
cur = conn.cursor()

# Criar banco de dados
try:
    cur.execute(sql.SQL("CREATE DATABASE {}").format(
        sql.Identifier("estudos_ml")
    ))
    print("Banco de dados 'estudos_ml' criado com sucesso!")
except psycopg2.Error as e:
    print(f"Banco já existe ou erro: {e}")

cur.close()
conn.close()

Banco de dados 'estudos_ml' criado com sucesso!


In [14]:
import pandas as pd
from sqlalchemy import create_engine, text

conn_str = "postgresql://usuario:senha@localhost:5432/estudos_ml"
engine = create_engine(conn_str, echo=False)

### 1. Criando tabelas (DDL)

In [15]:
create_alunos_sql = text("""
CREATE TABLE IF NOT EXISTS alunos (
    id SERIAL PRIMARY KEY,
    nome           VARCHAR(100) NOT NULL,
    curso          VARCHAR(100) NOT NULL,
    nota_prova     NUMERIC(4,2),
    nota_trabalho  NUMERIC(4,2),
    faltas         INT DEFAULT 0
);
""")

create_cursos_sql = text("""
CREATE TABLE IF NOT EXISTS cursos (
    id SERIAL PRIMARY KEY,
    curso        VARCHAR(100) UNIQUE NOT NULL,
    departamento VARCHAR(100) NOT NULL
);
""")

with engine.begin() as conn:
    conn.execute(create_alunos_sql)
    conn.execute(create_cursos_sql)

print("Tabelas criadas (se não existiam).")

Tabelas criadas (se não existiam).


### 2. INSERT (DML) - Inserindo dados iniciais

In [16]:
insert_cursos = text("""
INSERT INTO cursos (curso, departamento)
VALUES
    ('Engenharia', 'Escola Politécnica'),
    ('Computação', 'Instituto de Computação')
ON CONFLICT (curso) DO NOTHING;
""")

insert_alunos = text("""
INSERT INTO alunos (nome, curso, nota_prova, nota_trabalho, faltas)
VALUES
    ('Ana',    'Engenharia', 7.5, 8.0, 2),
    ('Bruno',  'Computação', 8.0, 7.5, 0),
    ('Carla',  'Computação', 9.2, 9.0, 1),
    ('Diego',  'Engenharia', 6.8, 7.2, 5),
    ('Eva',    'Engenharia', 7.9, 8.5, 3),
    ('Felipe', 'Computação', 5.5, 6.0, 4)
ON CONFLICT DO NOTHING;
""")

with engine.begin() as conn:
    conn.execute(insert_cursos)
    conn.execute(insert_alunos)

print("Dados inseridos (se ainda não existiam).")

Dados inseridos (se ainda não existiam).


### 3. SELECT, WHERE, ORDER BY, LIMIT

In [17]:
with engine.begin() as conn:
    df_alunos = pd.read_sql(text("SELECT * FROM alunos;"), conn)

print("Todos os alunos:")
print(df_alunos)

Todos os alunos:
   id    nome       curso  nota_prova  nota_trabalho  faltas
0   1     Ana  Engenharia         7.5            8.0       2
1   2   Bruno  Computação         8.0            7.5       0
2   3   Carla  Computação         9.2            9.0       1
3   4   Diego  Engenharia         6.8            7.2       5
4   5     Eva  Engenharia         7.9            8.5       3
5   6  Felipe  Computação         5.5            6.0       4


In [18]:
# SELECT com filtro e ordenação
select_filtrado = text("""
SELECT id, nome, curso, nota_prova
FROM alunos
WHERE curso = 'Engenharia'
  AND nota_prova >= 7.0
ORDER BY nota_prova DESC
LIMIT 10;
""")

with engine.begin() as conn:
    df_eng = pd.read_sql(select_filtrado, conn)

print("\nEngenharia com nota_prova >= 7:")
print(df_eng)


Engenharia com nota_prova >= 7:
   id nome       curso  nota_prova
0   5  Eva  Engenharia         7.9
1   1  Ana  Engenharia         7.5


In [19]:
# Exemplo de parâmetros no WHERE
nota_min = 7.0
curso_param = "Computação"

select_param = text("""
SELECT nome, curso, nota_prova
FROM alunos
WHERE curso = :curso
  AND nota_prova >= :nota_min
ORDER BY nota_prova DESC;
""")

with engine.begin() as conn:
    df_param = pd.read_sql(select_param, conn,
                           params={"curso": curso_param,
                                   "nota_min": nota_min})

print("\nAlunos filtrados com parâmetros:")
print(df_param)


Alunos filtrados com parâmetros:
    nome       curso  nota_prova
0  Carla  Computação         9.2
1  Bruno  Computação         8.0


### 4. Funções de agregação, GROUP BY, HAVING

In [20]:
group_by_curso = text("""
SELECT
    curso,
    COUNT(*)        AS qtd_alunos,
    AVG(nota_prova) AS media_prova,
    AVG(nota_trabalho) AS media_trabalho,
    AVG(faltas)     AS media_faltas
FROM alunos
GROUP BY curso;
""")

with engine.begin() as conn:
    df_group = pd.read_sql(group_by_curso, conn)

print("\nMétricas agregadas por curso:")
print(df_group)


Métricas agregadas por curso:
        curso  qtd_alunos  media_prova  media_trabalho  media_faltas
0  Computação           3     7.566667             7.5      1.666667
1  Engenharia           3     7.400000             7.9      3.333333


In [21]:
# HAVING: filtrar após agregação
having_example = text("""
SELECT
    curso,
    COUNT(*) AS qtd_alunos,
    AVG(nota_prova) AS media_prova
FROM alunos
GROUP BY curso
HAVING AVG(nota_prova) >= 7.0;
""")

with engine.begin() as conn:
    df_having = pd.read_sql(having_example, conn)

print("\nCursos com média de prova >= 7:")
print(df_having)


Cursos com média de prova >= 7:
        curso  qtd_alunos  media_prova
0  Computação           3     7.566667
1  Engenharia           3     7.400000


### 5. UPDATE, DELETE

In [22]:
update_sql = text("""
UPDATE alunos
SET nota_prova = 8.5
WHERE nome = 'Diego';
""")

delete_sql = text("""
DELETE FROM alunos
WHERE nome = 'Felipe';
""")

with engine.begin() as conn:
    conn.execute(update_sql)
    conn.execute(delete_sql)

print("\nUPDATE e DELETE executados.")

with engine.begin() as conn:
    df_alunos2 = pd.read_sql(text("SELECT * FROM alunos;"), conn)

print("\nAlunos após UPDATE/DELETE:")
print(df_alunos2)


UPDATE e DELETE executados.

Alunos após UPDATE/DELETE:
   id   nome       curso  nota_prova  nota_trabalho  faltas
0   1    Ana  Engenharia         7.5            8.0       2
1   2  Bruno  Computação         8.0            7.5       0
2   3  Carla  Computação         9.2            9.0       1
3   5    Eva  Engenharia         7.9            8.5       3
4   4  Diego  Engenharia         8.5            7.2       5

Alunos após UPDATE/DELETE:
   id   nome       curso  nota_prova  nota_trabalho  faltas
0   1    Ana  Engenharia         7.5            8.0       2
1   2  Bruno  Computação         8.0            7.5       0
2   3  Carla  Computação         9.2            9.0       1
3   5    Eva  Engenharia         7.9            8.5       3
4   4  Diego  Engenharia         8.5            7.2       5


### 6. JOINs

In [23]:
join_inner = text("""
SELECT
    a.nome,
    a.curso,
    c.departamento,
    a.nota_prova,
    a.nota_trabalho
FROM alunos a
INNER JOIN cursos c ON a.curso = c.curso;
""")

with engine.begin() as conn:
    df_join_inner = pd.read_sql(join_inner, conn)

print("\nINNER JOIN alunos x cursos:")
print(df_join_inner)


INNER JOIN alunos x cursos:
    nome       curso             departamento  nota_prova  nota_trabalho
0    Ana  Engenharia       Escola Politécnica         7.5            8.0
1  Bruno  Computação  Instituto de Computação         8.0            7.5
2  Carla  Computação  Instituto de Computação         9.2            9.0
3    Eva  Engenharia       Escola Politécnica         7.9            8.5
4  Diego  Engenharia       Escola Politécnica         8.5            7.2
    nome       curso             departamento  nota_prova  nota_trabalho
0    Ana  Engenharia       Escola Politécnica         7.5            8.0
1  Bruno  Computação  Instituto de Computação         8.0            7.5
2  Carla  Computação  Instituto de Computação         9.2            9.0
3    Eva  Engenharia       Escola Politécnica         7.9            8.5
4  Diego  Engenharia       Escola Politécnica         8.5            7.2


In [24]:
join_left = text("""
SELECT
    a.nome,
    a.curso,
    c.departamento
FROM alunos a
LEFT JOIN cursos c ON a.curso = c.curso;
""")

with engine.begin() as conn:
    df_join_left = pd.read_sql(join_left, conn)

print("\nLEFT JOIN alunos x cursos:")
print(df_join_left)


LEFT JOIN alunos x cursos:
    nome       curso             departamento
0    Ana  Engenharia       Escola Politécnica
1  Bruno  Computação  Instituto de Computação
2  Carla  Computação  Instituto de Computação
3    Eva  Engenharia       Escola Politécnica
4  Diego  Engenharia       Escola Politécnica
    nome       curso             departamento
0    Ana  Engenharia       Escola Politécnica
1  Bruno  Computação  Instituto de Computação
2  Carla  Computação  Instituto de Computação
3    Eva  Engenharia       Escola Politécnica
4  Diego  Engenharia       Escola Politécnica


### 7. Noções de transação (BEGIN / COMMIT / ROLLBACK)

In [25]:
# Aqui vamos usar uma conexão sem context manager .begin()
conn = engine.connect()

try:
    # inicia transação
    trans = conn.begin()

    # exemplo de múltiplos comandos
    conn.execute(text("""
        INSERT INTO alunos (nome, curso, nota_prova, nota_trabalho, faltas)
        VALUES ('TesteTransacao', 'Engenharia', 10.0, 10.0, 0);
    """))

    # force um erro comentando/desccomentando essa linha para ver o rollback
    # conn.execute(text("COMANDO_INVALIDO"))

    # se tudo der certo
    trans.commit()
    print("\nTransação commitada.")

except Exception as e:
    print("Erro, fazendo rollback:", e)
    trans.rollback()
finally:
    conn.close()

with engine.begin() as conn:
    df_final = pd.read_sql(text("SELECT * FROM alunos;"), conn)

print("\nAlunos após transação:")
print(df_final)


Transação commitada.

Alunos após transação:
   id            nome       curso  nota_prova  nota_trabalho  faltas
0   1             Ana  Engenharia         7.5            8.0       2
1   2           Bruno  Computação         8.0            7.5       0
2   3           Carla  Computação         9.2            9.0       1
3   5             Eva  Engenharia         7.9            8.5       3
4   4           Diego  Engenharia         8.5            7.2       5
5   7  TesteTransacao  Engenharia        10.0           10.0       0
