# Fase  1

## Objetivo de la fase:
Que Python sea tu herramienta de trabajo para consultar, procesar y automatizar datos desde PostgreSQL, no solo “código que corre”.

No vamos a mezclar todavía web, Pandas ni dashboards.
Primero control total de la conexión, consultas y resultados.

# MÓDULO 1 – Python como herramienta de automatización (SQL + PostgreSQL)


1. Conectarte correctamente a PostgreSQL desde Python

2. Ejecutar múltiples consultas de forma segura

3. Procesar resultados (no solo imprimirlos)

4. Exportar resultados a archivos

5. Estructurar un script limpio y reutilizable

EJERCICIO 1 – Conexión y verificación (fundamental)
Objetivo

Confirmar que:

* La conexión es estable

* La base Pagila responde

* Sabemos exactamente qué base y esquema estamos usando

Lo que debes hacer (lógica, no código aún)

1. Crear una función que:

* Se conecte a PostgreSQL

* Devuelva la conexión

2. Ejecutar una consulta de verificación:

* Nombre de la base de datos

* Usuario conectado

* Versión de PostgreSQL

3. Resultado esperado:

* Texto claro en consola confirmando conexión

* Si falla, error controlado (no crash)

In [4]:
import pandas as pd
import psycopg2

In [5]:
# 1. Conexión a la base de datos PostgreSQL

def connect_db( ):
    try:
        conn = psycopg2.connect( # se conecta a la base de datos
            host="localhost",
            database= "pagila", # nombre de la base de datos
            user="postgres", # usuario Conectado
            password="123456789",   
            port="5432"
        )
        print("Conexión exitosa")
        return conn # retorna la conexión
    except Exception as e: # manejo de errores
        print("Error de conexión", e)
        return None



In [12]:
# consulta de prueba

conn = connect_db()
cur = conn.cursor()

query = "SELECT * FROM actor LIMIT 5;"
cur.execute(query)

df = cur.fetchall() # Obtiene los datos
# Ver el dataframe
dataframe = pd.DataFrame(df, columns=[desc[0] for desc in cur.description])
print(dataframe)



Conexión exitosa
   actor_id first_name     last_name               last_update
0         1   PENELOPE       GUINESS 2022-02-15 04:34:33-05:00
1         2       NICK      WAHLBERG 2022-02-15 04:34:33-05:00
2         3         ED         CHASE 2022-02-15 04:34:33-05:00
3         4   JENNIFER         DAVIS 2022-02-15 04:34:33-05:00
4         5     JOHNNY  LOLLOBRIGIDA 2022-02-15 04:34:33-05:00


### reutilizar la conexión en una función

In [14]:
# reutilizar lo anterior en una función
def run_query(query):
    conn = connect_db()
    if conn is None:
        return None
    cur = conn.cursor()
    try:
        cur.execute(query)
        results = cur.fetchall()
        return results
    except Exception as e:
        print("Error al ejecutar la consulta", e)
        return None
    finally:
        cur.close()
        conn.close()

In [None]:
query = "SELECT * FROM actor LIMIT 5;"
results = run_query(query) # con esto tenemos lo justo para obtener los datos, pero si queremos ver el DF (dataframe) entonces lo que podemos hacer es usar pandas y su función pd.dataframe
# en el agregamos el results y las columnas

df = pd.DataFrame(results, columns=[desc[0] for desc in cur.description])
print(df)

Conexión exitosa
   actor_id first_name     last_name               last_update
0         1   PENELOPE       GUINESS 2022-02-15 04:34:33-05:00
1         2       NICK      WAHLBERG 2022-02-15 04:34:33-05:00
2         3         ED         CHASE 2022-02-15 04:34:33-05:00
3         4   JENNIFER         DAVIS 2022-02-15 04:34:33-05:00
4         5     JOHNNY  LOLLOBRIGIDA 2022-02-15 04:34:33-05:00
