
# Guía de instalación: Streamlit + PostgreSQL (cliente) + utilidades
**Fecha:** 2025-10-16  
**Contexto:** Curso con 8 estudiantes, laboratorio computacional. Esta guía instala **solo herramientas de Python** para construir una app con **Streamlit** que se conecte a **PostgreSQL** (no se instala el servidor de PostgreSQL).  
**Objetivo de la sesión:** que cada estudiante configure su entorno e **instale paquete por paquete** usando `pip install`, entendiendo **para qué sirve cada herramienta**.

---


## 0) Crear y activar entorno virtual (aislar dependencias)

### macOS / Linux
```bash
python3 -m venv .venv            # crea un entorno virtual llamado .venv
source .venv/bin/activate        # activa el entorno
python -m pip install --upgrade pip wheel  # actualiza instalador y ruedas binaras
```
**¿Por qué?** Un *entorno virtual* evita conflictos con otras asignaturas/proyectos. `pip` es el instalador de paquetes. `wheel` permite instalar binarios precompilados cuando están disponibles (instalaciones más rápidas y estables).

### Windows (PowerShell)
```powershell
python -m venv .venv
. .\.venv\Scripts\Activate.ps1
python -m pip install --upgrade pip wheel
```
> Si PowerShell bloquea scripts, ejecutar PowerShell como administrador y usar:  
> `Set-ExecutionPolicy Bypass -Scope Process`

---


## 1) Instalar **Streamlit** — framework para apps web de datos
```bash
pip install streamlit
```
**¿Qué es?** Un framework para crear aplicaciones web interactivas en Python de forma rápida (ideal para tableros, formularios y visualizaciones).  
**Prueba rápida:**
```bash
python -c "import streamlit as st; print('Streamlit OK', st.__version__)"
```

---



## 2) Instalar **pandas** — manipulación de datos tabulares
```bash
pip install pandas
```
**¿Qué es?** Librería estándar para cargar, limpiar y transformar datos (CSV, Parquet, etc.).  
**Prueba rápida:**
```bash
python -c "import pandas as pd; import io; df=pd.read_csv(io.StringIO('a,b\n1,2')); print('pandas OK', df.shape)"
```



---

## 3) Instalar **SQLAlchemy** — capa de conexión/abstracción a bases de datos
```bash
pip install sqlalchemy
```
**¿Qué es?** Una capa de abstracción que gestiona conexiones a distintas BD (PostgreSQL, SQLite, etc.) y ayuda a construir consultas de forma segura y portable.  
**Prueba rápida:**
```bash
python -c "import sqlalchemy as sa; print('SQLAlchemy OK', sa.__version__)"
```



---

## 4) Instalar **psycopg** (cliente PostgreSQL para Python)
```bash
pip install 'psycopg[binary]'
```
**¿Qué es?** El driver que permite a Python conectarse a **PostgreSQL**. La variante `[binary]` instala binarios precompilados para evitar compilar dependencias nativas (más fácil en Windows/macOS).  
**Prueba rápida (sin servidor):**
```bash
python -c "import psycopg; print('psycopg OK', psycopg.__version__)"
```
> Nota: No verifica conexión a un servidor; solo que el paquete está correctamente instalado.

---


## 4.1) Respaldar las librerias isntaladas hasta el momento, para luego automatizar la instalación
**Guarda en un archivo las librerias instaladas hasta el momento en el entorno**
```bash
pip freeze > requirements.txt
```
**Se instalan las librerias a partir de archivo**
```bash
pip install -r requirements.txt
```


## 5) Instalar **python-dotenv** — gestión de credenciales por variables de entorno
```bash
pip install python-dotenv
```
**¿Qué es?** Carga variables definidas en un archivo `.env` (p. ej., `DATABASE_URL`) para **no exponer credenciales** en el código.  
**Prueba rápida:**
```bash
python - << 'PY'
import os
from dotenv import load_dotenv
open(".env","w").write("DATABASE_URL=postgresql+psycopg://user:pass@localhost:5432/mydb\n")
load_dotenv()
print("dotenv OK, DATABASE_URL =", os.getenv("DATABASE_URL"))
PY
```



---

## (Opcional) 6) Instalar utilidades de experiencia
```bash
pip install rich pyyaml
```
- **rich**: salidas bonitas en consola (tablas, colores, trazas legibles).
- **pyyaml**: leer archivos YAML de configuración.

**Prueba rápida:**
```bash
python - << 'PY'
from rich import print
print("[bold green]rich OK[/]")
import yaml
print("pyyaml OK:", yaml.safe_load("a: 1"))
PY
```



---

## 7) Comprobación integral de imports
```bash
python - << 'PY'
mods = ["streamlit","pandas","sqlalchemy","psycopg","dotenv"]
missing = []
for m in mods:
    try:
        __import__(m)
    except Exception as e:
        missing.append((m, str(e)))
print("OK" if not missing else f"Faltan módulos: {missing}")
PY
```



---

## 8) Pequeño *smoke test* de conexión (sin requerir servidor activo)

> Este fragmento no necesita que PostgreSQL esté en ejecución; solo construye el engine y falla de forma controlada si no puede conectarse. Sirve para explicar cómo **SQLAlchemy** usa el DSN.

```bash
python - << 'PY'
import os
from dotenv import load_dotenv
from sqlalchemy import create_engine, text

# Cargar DSN desde .env (o configurar uno ficticio para la demo)
load_dotenv()
dsn = os.getenv("DATABASE_URL", "postgresql+psycopg://user:pass@localhost:5432/mydb")
print("DSN =", dsn)

engine = create_engine(dsn, echo=False, future=True)

try:
    with engine.connect() as conn:
        conn.execute(text("SELECT 1"))
        print("Conexión OK (servidor accesible)")
except Exception as e:
    print("Engine creado. No fue posible conectar (esto es esperado si no hay servidor):")
    print("->", type(e).__name__, str(e)[:200], "...")
PY
```

Explicación:
- `create_engine(...)` crea el objeto de conexión de SQLAlchemy a partir del DSN (`postgresql+psycopg://...`).
- `SELECT 1` prueba una consulta mínima.
- Si no hay servidor, vemos cómo capturar y mostrar la excepción de forma pedagógica.

---



## 9) Guía de desactivación / limpieza
```bash
deactivate   # salir del entorno virtual en macOS/Linux/Windows
```
```bash
# (opcional) borrar el entorno virtual
rm -rf .venv              # macOS / Linux
rmdir /s /q .venv         # Windows (CMD)
```
> Para congelar versiones del entorno actual (por reproducibilidad en otra clase):  
> `pip freeze > requirements_lock.txt` (se usa solo como registro, no en la instalación de esta sesión).

---

## Resumen de herramientas y su rol
- **Streamlit:** construir la interfaz web de la app de datos.
- **pandas:** cargar/limpiar/transformar datasets (CSV, etc.).
- **SQLAlchemy:** conectar Python ↔ PostgreSQL con API consistente y segura.
- **psycopg (binary):** driver nativo para hablar con PostgreSQL desde Python.
- **python-dotenv:** manejar credenciales vía `.env` (seguridad y buenas prácticas).
- **rich/pyyaml (opcionales):** mejor UX en consola y manejo de configuraciones.

---

### Checklist para el ticket de salida
- [ ] Entorno virtual activo y `pip` actualizado.
- [ ] Paquetes instalados uno a uno con `pip install ...`.
- [ ] Imports verificados (sección 7).
- [ ] `.env` con `DATABASE_URL` (sección 5).
- [ ] *Smoke test* del engine de SQLAlchemy ejecutado (sección 8).

---

> **Siguiente clase:** diseñaremos el esquema en PostgreSQL y cargaremos un CSV con un mini flujo de DTS, para luego consultar y visualizar desde Streamlit.
