In [1]:
!pip install psycopg2-binary sqlalchemy

Defaulting to user installation because normal site-packages is not writeable
Collecting psycopg2-binary
  Downloading psycopg2_binary-2.9.11-cp310-cp310-manylinux2014_x86_64.manylinux_2_17_x86_64.whl (4.2 MB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m4.2/4.2 MB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0mm eta [36m0:00:01[0m[36m0:00:01[0mm
[?25hCollecting sqlalchemy
  Downloading sqlalchemy-2.0.45-cp310-cp310-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl (3.2 MB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m3.2/3.2 MB[0m [31m2.6 MB/s[0m eta [36m0:00:00[0mm eta [36m0:00:01[0m[36m0:00:01[0m
[?25hCollecting greenlet>=1
  Downloading greenlet-3.3.0-cp310-cp310-manylinux_2_24_x86_64.manylinux_2_28_x86_64.whl (586 kB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m586.9/586.9 KB[0m [31m4.7 MB/s[0m eta [36m0:00:00[0mm eta [36m0:00:01[0m[36m0:00:01[0m
Insta

In [4]:
import pandas as pd
from sqlalchemy import create_engine, text

## 1. CONEXIÓN A TU POSTGRESQL LOCAL (Linux)

In [33]:
# Formato: postgresql://usuario:password@localhost:puerto/nombre_db
# Asegúrate de poner la contraseña que definiste en el Paso 1
cadena_conexion = 'postgresql://practicante:12345@localhost:5432/clinica_db'

# Creamos el motor de conexión
try:
    engine = create_engine(cadena_conexion)
    conn = engine.connect()
    print(" ¡Conexión exitosa a PostgreSQL en Pop!_OS!")
except Exception as e:
    print(" Error de conexión:", e)

 ¡Conexión exitosa a PostgreSQL en Pop!_OS!


## 2. CREACIÓN DE TABLAS (DDL)

In [34]:
# En Postgres real, usamos 'engine' y la sintaxis cambia ligeramente
# Usamos 'text()' para que SQLAlchemy entienda que es código SQL puro.

# Limpiamos tablas si ya existen (para poder correr el script varias veces)
conn.execute(text("DROP TABLE IF EXISTS Citas CASCADE;"))
conn.execute(text("DROP TABLE IF EXISTS Medicos CASCADE;"))
conn.execute(text("DROP TABLE IF EXISTS Pacientes CASCADE;"))

# Tabla Médicos
conn.execute(text('''
CREATE TABLE Medicos (
    id_medico SERIAL PRIMARY KEY,  -- SERIAL es el autoincremental en Postgres
    nombre VARCHAR(100),
    especialidad VARCHAR(100),
    sede VARCHAR(50)
);
'''))

# Tabla Pacientes
conn.execute(text('''
CREATE TABLE Pacientes (
    id_paciente INTEGER PRIMARY KEY,
    nombre VARCHAR(100),
    edad INTEGER,
    distrito VARCHAR(50)
);
'''))

# Tabla Citas
conn.execute(text('''
CREATE TABLE Citas (
    id_cita SERIAL PRIMARY KEY,
    id_medico INTEGER,
    id_paciente INTEGER,
    fecha DATE,
    costo DECIMAL(10,2),
    CONSTRAINT fk_medico FOREIGN KEY(id_medico) REFERENCES Medicos(id_medico),
    CONSTRAINT fk_paciente FOREIGN KEY(id_paciente) REFERENCES Pacientes(id_paciente)
);
'''))
conn.commit() # Importante: Confirmar cambios en base de datos real

## 3. POBLAR DATOS (INSERT)

In [35]:
# Insertamos datos de ejemplo
# Nota: En Postgres las comillas simples '' son para texto.

# A. Insertamos MÉDICOS (7 doctores en total)
conn.execute(text('''
INSERT INTO Medicos (nombre, especialidad, sede) VALUES 
    ('Dr. Perez', 'Cardiología', 'Surco'),         -- ID 1
    ('Dra. Gomez', 'Pediatría', 'Surco'),           -- ID 2
    ('Dr. Soto', 'Ginecología', 'San Borja'),       -- ID 3
    ('Dra. Ruiz', 'Dermatología', 'Miraflores'),    -- ID 4
    ('Dr. Quispe', 'Medicina General', 'Surco'),    -- ID 5
    ('Dra. Mendoza', 'Neurología', 'San Borja'),    -- ID 6
    ('Dr. Castillo', 'Pediatría', 'Miraflores');    -- ID 7
'''))

# B. Insertamos PACIENTES (10 pacientes)
conn.execute(text('''
INSERT INTO Pacientes (id_paciente, nombre, edad, distrito) VALUES 
    (100, 'Juan Silva', 30, 'Surco'),
    (101, 'Maria Lopez', 25, 'Miraflores'),
    (102, 'Carlos Ruiz', 50, 'Surco'),
    (103, 'Ana Diaz', 7, 'San Borja'),
    (104, 'Luis Vera', 45, 'Surco'),
    (105, 'Elena Torres', 28, 'San Isidro'),
    (106, 'Pedro Castillo', 60, 'Lima'),
    (107, 'Sofia Vargas', 5, 'Miraflores'),
    (108, 'Jorge Lima', 35, 'Surco'),
    (109, 'Valeria Maza', 22, 'San Borja');
'''))

# C. Insertamos CITAS (Datos transaccionales - ¡Aquí está la riqueza!)
# Diseñado para que:
# - Juan Silva (100) tenga 3 visitas.
# - Maria Lopez (101) tenga 3 visitas.
# - Dr. Perez (1) tenga mucha demanda.
conn.execute(text('''
INSERT INTO Citas (id_medico, id_paciente, fecha, costo) VALUES 
    -- Enero
    (1, 100, '2024-01-10', 150.00), -- Juan visita Cardiología
    (2, 103, '2024-01-11', 100.00), -- Ana (niña) visita Pediatría
    (1, 102, '2024-01-12', 150.00),
    (3, 101, '2024-01-15', 200.00), -- Maria visita Ginecología
    (5, 104, '2024-01-16', 80.00),
    (4, 105, '2024-01-18', 120.00),
    (1, 106, '2024-01-20', 150.00),
    
    -- Febrero (Retornos y nuevos pacientes)
    (1, 100, '2024-02-05', 150.00), -- Juan REGRESA a Cardiología (2da visita)
    (3, 101, '2024-02-10', 200.00), -- Maria REGRESA a Ginecología (2da visita)
    (7, 107, '2024-02-12', 100.00), -- Sofia visita Pediatría en Miraflores
    (6, 108, '2024-02-15', 180.00),
    (5, 109, '2024-02-20', 80.00),
    
    -- Marzo (Más retornos para el Window Function)
    (5, 100, '2024-03-01', 80.00),  -- Juan va a Medicina General (3ra visita total)
    (4, 101, '2024-03-05', 120.00), -- Maria va a Dermatología (3ra visita total)
    (2, 103, '2024-03-10', 100.00), -- Ana regresa al pediatra
    (1, 104, '2024-03-15', 150.00),
    (6, 102, '2024-03-20', 180.00);
'''))

conn.commit()
print(" Datos insertados correctamente.")

 Datos insertados correctamente.


## 4. CONSULTA DE PRUEBA CON PANDAS

In [36]:
query = "SELECT * FROM Citas"
df_citas = pd.read_sql(query, conn)

print("\n--- Vista de la tabla Citas desde Pandas ---")
display(df_citas)

# Cerramos la conexión al terminar
#conn.close()


--- Vista de la tabla Citas desde Pandas ---


Unnamed: 0,id_cita,id_medico,id_paciente,fecha,costo
0,1,1,100,2024-01-10,150.0
1,2,2,103,2024-01-11,100.0
2,3,1,102,2024-01-12,150.0
3,4,3,101,2024-01-15,200.0
4,5,5,104,2024-01-16,80.0
5,6,4,105,2024-01-18,120.0
6,7,1,106,2024-01-20,150.0
7,8,1,100,2024-02-05,150.0
8,9,3,101,2024-02-10,200.0
9,10,7,107,2024-02-12,100.0


In [40]:
# CONSULTA 1: EL JOIN CLÁSICO
# Pregunta: "Dame una lista de citas con el nombre del médico y del paciente."
# Demuestra: Uso de INNER JOIN para cruzar 3 tablas.
query_joins = '''
SELECT 
    C.fecha,
    M.nombre AS Doctor,
    M.especialidad,
    P.nombre AS Paciente
FROM Citas C
INNER JOIN Medicos M ON C.id_medico = M.id_medico
INNER JOIN Pacientes P ON C.id_paciente = P.id_paciente
ORDER BY C.fecha DESC;
'''
print("--- 1. Reporte Detallado de Citas (JOINS) ---")
display(pd.read_sql_query(query_joins, conn))

--- 1. Reporte Detallado de Citas (JOINS) ---


Unnamed: 0,fecha,doctor,especialidad,paciente
0,2024-03-20,Dra. Mendoza,Neurología,Carlos Ruiz
1,2024-03-15,Dr. Perez,Cardiología,Luis Vera
2,2024-03-10,Dra. Gomez,Pediatría,Ana Diaz
3,2024-03-05,Dra. Ruiz,Dermatología,Maria Lopez
4,2024-03-01,Dr. Quispe,Medicina General,Juan Silva
5,2024-02-20,Dr. Quispe,Medicina General,Valeria Maza
6,2024-02-15,Dra. Mendoza,Neurología,Jorge Lima
7,2024-02-12,Dr. Castillo,Pediatría,Sofia Vargas
8,2024-02-10,Dr. Soto,Ginecología,Maria Lopez
9,2024-02-05,Dr. Perez,Cardiología,Juan Silva


In [39]:
# CONSULTA 2: AGREGACIONES Y GROUP BY
# Pregunta: "¿Qué médico ha generado más ingresos para la clínica?"
# Demuestra: SUM, GROUP BY y ORDER BY (Esencial para dashboards).
query_kpi = '''
SELECT 
    M.nombre,
    COUNT(C.id_cita) as Total_Citas,
    SUM(C.costo) as Ingresos_Totales
FROM Medicos M
JOIN Citas C ON M.id_medico = C.id_medico
GROUP BY M.nombre
ORDER BY Ingresos_Totales DESC;
'''
print("\n--- 2. Ranking de Médicos por Ingresos (GROUP BY) ---")
display(pd.read_sql_query(query_kpi, conn))


--- 2. Ranking de Médicos por Ingresos (GROUP BY) ---


Unnamed: 0,nombre,total_citas,ingresos_totales
0,Dr. Perez,5,750.0
1,Dr. Soto,2,400.0
2,Dra. Mendoza,2,360.0
3,Dr. Quispe,3,240.0
4,Dra. Ruiz,2,240.0
5,Dra. Gomez,2,200.0
6,Dr. Castillo,1,100.0


In [38]:
# CONSULTA 3: WINDOW FUNCTIONS (EL "PLUS" DE LA OFERTA)
# Pregunta: "Enumera las citas de cada paciente ordenadas por fecha."
# Demuestra: ROW_NUMBER().
# Significa: "Créame un ranking (row_number) reiniciando la cuenta (partition) por cada paciente".
query_window = '''
SELECT 
    P.nombre AS Paciente,
    C.fecha,
    M.especialidad,
    ROW_NUMBER() OVER(PARTITION BY P.id_paciente ORDER BY C.fecha) as Nro_Visita
FROM Citas C
JOIN Pacientes P ON C.id_paciente = P.id_paciente
JOIN Medicos M ON C.id_medico = M.id_medico;
'''
print("\n--- 3. Historial de Visitas (WINDOW FUNCTIONS) ---")
display(pd.read_sql_query(query_window, conn))


--- 3. Historial de Visitas (WINDOW FUNCTIONS) ---


Unnamed: 0,paciente,fecha,especialidad,nro_visita
0,Juan Silva,2024-01-10,Cardiología,1
1,Juan Silva,2024-02-05,Cardiología,2
2,Juan Silva,2024-03-01,Medicina General,3
3,Maria Lopez,2024-01-15,Ginecología,1
4,Maria Lopez,2024-02-10,Ginecología,2
5,Maria Lopez,2024-03-05,Dermatología,3
6,Carlos Ruiz,2024-01-12,Cardiología,1
7,Carlos Ruiz,2024-03-20,Neurología,2
8,Ana Diaz,2024-01-11,Pediatría,1
9,Ana Diaz,2024-03-10,Pediatría,2


## Cerrar la conexion

In [32]:
conn.close()