<a href="https://colab.research.google.com/github/Warspyt/PC_Python_2025II/blob/main/clase__15/Python_NumPy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Curso de Programaci√≥n de Computadores en Python
## Librer√≠as de Python y NumPy
#### Universidad Nacional de Colombia

**Objetivos:**
- Entender qu√© son las librer√≠as y c√≥mo gestionarlas (est√°ndar y externas).
- Aprender a crear tus propias librer√≠as y paquetes Python.
- Dominar NumPy: arrays, operaciones vectorizadas, broadcasting, √°lgebra lineal, estad√≠sticas y casos de uso.
- Resolver ejercicios cortos y retos pr√°cticos (incluyen proyectos m√°s grandes).

---

## üìö Contenido (resumen)
1. Introducci√≥n a librer√≠as (qu√©, por qu√©, tipos) ‚Äî con im√°genes ilustrativas
2. Instalaci√≥n y gesti√≥n de paquetes (`pip`, `venv`, `requirements.txt`, `conda`)
3. Estructura de m√≥dulos y c√≥mo crear una librer√≠a propia (package)
4. Buenas pr√°cticas: versionado, documentaci√≥n, testing b√°sico
5. NumPy profundo: creaci√≥n, indexing, broadcasting, √°lgebra lineal, random, performance
6. Ejemplos aplicados y casos de uso (simulaci√≥n, se√±ales, estad√≠sticas)
7. Ejercicios cortos y retos largos (proyectos)
8. Tips, recursos y pasos siguientes

---
**Nota:**** Este notebook est√° pensado para ejecutarse en Google Colab o Jupyter. Algunas celdas que instalan paquetes est√°n marcadas y solo deben ejecutarse si es necesario.


## 1Ô∏è‚É£ Introducci√≥n a librer√≠as en Python

Una **librer√≠a** es un conjunto de m√≥dulos que empaquetan funciones, clases y utilidades reutilizables.

Algunas librerias conocidas son:

![Python libraries](https://edteam-media.s3.amazonaws.com/community/original/2ef2016b-1028-43f8-861d-bd8188ea3d5a.jpg)

---

### Tip
> Las librer√≠as populares suelen ofrecer alias est√°ndar: `import numpy as np`, `import pandas as pd`, `import matplotlib.pyplot as plt`.


### 1.1 Librer√≠as de la biblioteca est√°ndar vs externas

- **Estand√°r (stdlib):** vienen con Python (ej: `math`, `datetime`, `os`, `json`, `csv`). No necesitas instalarlas.
- **Externas:** se instalan desde PyPI (`pip`) o con `conda` (ej: `numpy`, `pandas`, `scipy`, `requests`).

Cuando se empieza un proyecto, se documentan las dependencias en `requirements.txt` o `environment.yml` para `conda`.


In [None]:
# Ejemplo: usar m√≥dulos est√°ndar
import math, json, csv, datetime
print('sqrt(16)=', math.sqrt(16))
print('fecha ahora:', datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S'))


## 2Ô∏è‚É£ Instalaci√≥n y gesti√≥n de paquetes

**pip**:
- `pip install paquete`
- `pip install paquete==1.2.3` para una versi√≥n espec√≠fica

**Entornos virtuales (recomendado):**
- `python -m venv venv` ‚Üí crear
- `source venv/bin/activate` (Unix) o `venv\Scripts\activate` (Windows)

**requirements.txt**:
- `pip freeze > requirements.txt`
- `pip install -r requirements.txt`

**Conda** (opcional):
- `conda create -n mienv python=3.10`

---

### Ejercicio corto: comprobar pip y crear requirements

Completa la celda para listar la versi√≥n de `pip` y (opcional) generar un `requirements.txt` si instala paquetes.


In [None]:
# Opcional: ejecutar en Colab/Jupyter si deseas instalar paquetes (descomentar si hace falta)
# !pip install numpy pandas matplotlib
import sys
import subprocess
print('Python version:', sys.version)
try:
    import pip
    print('pip version:', pip.__version__)
except Exception as e:
    print('pip no disponible:', e)


Python version: 3.12.12 (main, Oct 10 2025, 08:52:57) [GCC 11.4.0]
pip version: 24.1.2


## 3Ô∏è‚É£ C√≥mo crear tu propia librer√≠a (paquete) en Python

### Estructura m√≠nima de un package:

```
mi_paquete/
‚îú‚îÄ mi_paquete/
‚îÇ  ‚îú‚îÄ __init__.py
‚îÇ  ‚îú‚îÄ modulo1.py
‚îÇ  ‚îî‚îÄ modulo2.py
‚îú‚îÄ tests/
‚îÇ  ‚îî‚îÄ test_modulo1.py
‚îî‚îÄ setup.py   (opcional para distribuci√≥n)
```

- `__init__.py` indica que el directorio es un paquete.
- Puedes publicar en PyPI con `twine` o usar `pip install -e .` para desarrollo editable.

### Ejemplo r√°pido: crear un package dentro del notebook (editable) y usarlo


In [None]:
# Creamos un paquete de ejemplo en el entorno de trabajo (funciona en Colab/Jupyter)
import os
package_root = 'mi_paquete'
if not os.path.exists(package_root):
    os.makedirs(os.path.join(package_root,'mi_paquete'), exist_ok=True)
    os.makedirs(os.path.join(package_root,'tests'), exist_ok=True)

# __init__.py
with open(os.path.join(package_root,'mi_paquete','__init__.py'),'w',encoding='utf-8') as f:
    f.write("from .modulo1 import saludo\n")

# modulo1.py
with open(os.path.join(package_root,'mi_paquete','modulo1.py'),'w',encoding='utf-8') as f:
    f.write('def saludo(nombre):\n')
    f.write('    return f"Hola, {nombre}! Bienvenido a mi_paquete."\n')

# modulo2.py
with open(os.path.join(package_root,'mi_paquete','modulo2.py'),'w',encoding='utf-8') as f:
    f.write('def suma(a,b):\n')
    f.write('    return a+b\n')

print('Estructura creada en', package_root)
print(os.listdir(package_root), '->', os.listdir(os.path.join(package_root,'mi_paquete')))


Estructura creada en mi_paquete
['tests', 'mi_paquete'] -> ['modulo1.py', 'modulo2.py', '__init__.py']


In [None]:
# A√±adimos el paquete al path y probamos su uso
import sys
sys.path.insert(0, 'mi_paquete')
from mi_paquete import saludo
print(saludo('Jay'))


Hola, Jay! Bienvenido a mi_paquete.


### Publicaci√≥n y distribuci√≥n (resumen)

- Para distribuir: crear `pyproject.toml` o `setup.py`, build con `python -m build`, subir con `twine upload dist/*`.
- Usa `pip install -e .` durante desarrollo para instalar en modo editable.

---
### Ejercicio: crear m√≥dulo propio

Crea un m√≥dulo `estadisticas.py` dentro de `mi_paquete` que contenga funciones `promedio(lista)` y `desviacion(lista)`. Luego importa y prueba las funciones.


In [None]:
# Esqueleto: completa el m√≥dulo estadisticas.py
mod_path = os.path.join(package_root,'mi_paquete','estadisticas.py')
with open(mod_path,'w',encoding='utf-8') as f:
    f.write('def promedio(xs):\n')
    f.write('    pass\n\n')
    f.write('def desviacion(xs):\n')
    f.write('    pass\n')
print('archivo creado:', mod_path)


archivo creado: mi_paquete/mi_paquete/estadisticas.py


In [None]:
# Soluci√≥n de referencia (descomentar para usar)
with open(mod_path,'w',encoding='utf-8') as f:
    f.write('import math\n')
    f.write('def promedio(xs):\n')
    f.write('    return sum(xs)/len(xs) if xs else 0\n\n')
    f.write('def desviacion(xs):\n')
    f.write('    m = promedio(xs)\n')
    f.write('    var = sum((x-m)**2 for x in xs)/len(xs) if xs else 0\n')
    f.write('    return math.sqrt(var)\n')

# Probar
sys.path.insert(0, 'mi_paquete')
from mi_paquete.estadisticas import promedio, desviacion
print('promedio [1,2,3]=', promedio([1,2,3]))
print('desviacion [1,2,3]=', desviacion([1,2,3]))


## 4Ô∏è‚É£ Buenas pr√°cticas: documentaci√≥n, testing y versionado

- Documenta con docstrings y `README.md`.
- Usa `pytest` para tests b√°sicos (`tests/test_modulo.py`).
- Usa control de versiones (git) y sigue semver para releases.

### Ejercicio corto: escribe un test para `promedio` usando `pytest` (esqueleto)


In [None]:
# Esqueleto test (guardar en mi_paquete/tests/test_estadisticas.py)
test_code = '''
from mi_paquete.estadisticas import promedio

def test_promedio():
    assert promedio([1,2,3]) == 2
'''
with open(os.path.join(package_root,'tests','test_estadisticas.py'),'w',encoding='utf-8') as f:
    f.write(test_code)
print('Test creado:', os.path.join(package_root,'tests','test_estadisticas.py'))


Test creado: mi_paquete/tests/test_estadisticas.py


## 5Ô∏è‚É£ NumPy

En esta secci√≥n ampliamos los usos de NumPy: manejo de tipos, broadcasting complejo, √°lgebra, transformadas r√°pidas (FFT b√°sica), generaci√≥n de se√±ales y comparaci√≥n de rendimiento con listas.


In [None]:
import numpy as np
# Tipos y casting
a = np.array([1,2,3], dtype=np.int32)
print('a dtype:', a.dtype)
print('a as float:', a.astype(float))

# Broadcasting avanzado
M = np.ones((4,3))
v = np.arange(3)
print('M+v:\n', M+v)

# Operaciones l√≥gicas y masking
x = np.arange(10)
mask = (x % 2 == 0)
print('pares:', x[mask])


a dtype: int32
a as float: [1. 2. 3.]
M+v:
 [[1. 2. 3.]
 [1. 2. 3.]
 [1. 2. 3.]
 [1. 2. 3.]]
pares: [0 2 4 6 8]


### 5.1 √Ålgebra lineal y aplicaciones
- `np.linalg` para resolver sistemas y calcular autovalores.
- Ejemplo: resolver grandes sistemas y medir tiempo.


In [None]:
# Resolver un sistema y calcular autovalores
A = np.random.rand(5,5)
b = np.random.rand(5)
x = np.linalg.solve(A,b)
vals, vecs = np.linalg.eig(A)
print('soluci√≥n x[:3]=', x[:3])
print('autovalores[:3]=', vals[:3])


soluci√≥n x[:3]= [-18.30227276   7.12772445 -16.6927887 ]
autovalores[:3]= [2.10842952 0.54792568 0.02001933]


### 5.2 FFT y se√±ales (introducci√≥n)
- `np.fft.fft` y `np.fft.ifft` para transformadas r√°pidas.
- Ejemplo: generar se√±al con ruido y estimar frecuencia dominante.


In [None]:
import numpy as np
fs = 500  # sample rate
t = np.arange(0,1,1/fs)
sig = np.sin(2*np.pi*50*t) + 0.5*np.random.randn(len(t))
fft = np.fft.fft(sig)
freqs = np.fft.fftfreq(len(sig), 1/fs)
idx = np.argmax(np.abs(fft))
print('Freq dominante (Hz):', abs(freqs[idx]))


Freq dominante (Hz): 50.0


### 5.3 Performance: listas vs NumPy
- Medir tiempos con `%timeit` (en Jupyter) o `time` en scripts.


In [None]:
import time
n = 10_000_00
lst = list(range(n))
start = time.time()
sum_lst = sum([x*x for x in lst])
end = time.time()
print('Lista comprehension time:', end-start)

arr = np.arange(n)
start = time.time()
sum_arr = np.sum(arr*arr)
end = time.time()
print('NumPy vectorized time:', end-start)


Lista comprehension time: 0.054064273834228516
NumPy vectorized time: 0.002830028533935547


# 6Ô∏è‚É£ Ejercicios

### Ejercicio corto A: multiplicar matrices
- Crea dos matrices A (3x3) y B (3x3) con valores aleatorios y calcula A@B y A*B (element-wise).  


In [None]:
# Esqueleto Ejercicio corto A
import numpy as np

def ejercicio_corto_A():
    A = None
    B = None
    # TODO: crear A,B y calcular
    return None

# Descomenta para probar despu√©s
# print(ejercicio_corto_A())


In [None]:
# Soluci√≥n referencia Ejercicio corto A
import numpy as np

def ejercicio_corto_A():
    A = np.random.rand(3,3)
    B = np.random.rand(3,3)
    matmul = A @ B
    elem = A * B
    return matmul, elem

print(ejercicio_corto_A())


### Ejercicio corto B: m√°scara y filtrado
- Dado un array de 1000 valores aleatorios normales, cuenta cu√°ntos est√°n entre -1 y 1.


In [None]:
# Esqueleto Ejercicio corto B
import numpy as np

def ejercicio_corto_B(seed=0):
    # TODO: generar muestras y contar
    return None


In [None]:
# Soluci√≥n referente Ejercicio corto B
import numpy as np

def ejercicio_corto_B(seed=0):
    np.random.seed(seed)
    s = np.random.randn(1000)
    count = np.sum((s>-1)&(s<1))
    return int(count)

print(ejercicio_corto_B())


# 7Ô∏è‚É£ Reto ‚Äî Proyecto 1: An√°lisis de datos sint√©ticos

**Descripci√≥n:** Genera un dataset sint√©tico (CSV) de mediciones experimentales (por ejemplo, temperatura, presi√≥n, tiempo). Luego:
- Lee el CSV con `numpy.genfromtxt` o `pandas` (si lo deseas).
- Calcula estad√≠sticas por columna.
- Aplica filtrado (elimina outliers > 3œÉ).
- Guarda un archivo limpio y genera un reporte con resultados.

**Requisitos:** manejo de archivos, NumPy, control de errores.


In [None]:
# Esqueleto proyecto 1: generar CSV, procesar y guardar
import numpy as np
import csv

def generar_dataset(path='datos_sinteticos.csv', n=1000, seed=0):
    np.random.seed(seed)
    tiempo = np.arange(n)
    temperatura = 20 + 2*np.sin(2*np.pi*tiempo/50) + np.random.randn(n)
    presion = 1 + 0.01*np.random.randn(n)
    with open(path,'w',newline='',encoding='utf-8') as f:
        writer = csv.writer(f)
        writer.writerow(['tiempo','temperatura','presion'])
        for i in range(n):
            writer.writerow([tiempo[i], f"{temperatura[i]:.3f}", f"{presion[i]:.4f}"])
    print('Dataset generado en', path)


def procesar_dataset(path_in='datos_sinteticos.csv', path_out='datos_limpios.csv'):
    # TODO: leer, calcular stats, filtrar outliers y guardar limpio
    pass


In [None]:
# Soluci√≥n de referencia (usar para guiarse)
import numpy as np
import csv

def procesar_dataset(path_in='datos_sinteticos.csv', path_out='datos_limpios.csv'):
    data = np.genfromtxt(path_in, delimiter=',', names=True, dtype=float)
    temps = data['temperatura']
    pres = data['presion']
    mean_t, std_t = np.mean(temps), np.std(temps)
    mask = np.abs(temps - mean_t) <= 3*std_t
    clean_idx = np.where(mask)[0]
    with open(path_out,'w',newline='',encoding='utf-8') as f:
        writer = csv.writer(f)
        writer.writerow(['tiempo','temperatura','presion'])
        for i in clean_idx:
            writer.writerow([int(data['tiempo'][i]), f"{temps[i]:.3f}", f"{pres[i]:.4f}"])
    print('Procesado.Stats: mean_t=', mean_t, 'std_t=', std_t, 'n_clean=', len(clean_idx))


# 8Ô∏è‚É£ Reto ‚Äî Proyecto 2: Procesamiento de se√±ales

**Descripci√≥n:** Simula una se√±al con varias frecuencias y ruido. Usa FFT para detectar frecuencias dominantes y filtrar ruido (filtro pasa-bajo simple). Guarda la se√±al original y filtrada en archivos y grafica resultados (si est√°s en Colab/Jupyter permite `%matplotlib inline`).


In [None]:
# Esqueleto proyecto 2: se√±al, FFT y filtrado
import numpy as np
import matplotlib.pyplot as plt

def generar_senal(fs=1000, dur=1.0):
    t = np.arange(0, dur, 1/fs)
    sig = 0.7*np.sin(2*np.pi*50*t) + 0.3*np.sin(2*np.pi*120*t) + 0.5*np.random.randn(len(t))
    return t, sig

def filtrar_pasabajo(sig, fs, cutoff=100):
    # TODO: FFT, cero componentes > cutoff, iFFT
    return None

# Prueba r√°pida (descomentar despu√©s de implementar)
# t, sig = generar_senal()
# tfilt = filtrar_pasabajo(sig, 1000, cutoff=80)


In [None]:
# Soluci√≥n referencia proyecto 2 (gu√≠a)
import numpy as np
import matplotlib.pyplot as plt

def filtrar_pasabajo(sig, fs, cutoff=100):
    N = len(sig)
    S = np.fft.fft(sig)
    freqs = np.fft.fftfreq(N, 1/fs)
    S_filtered = S.copy()
    S_filtered[np.abs(freqs) > cutoff] = 0
    sig_filt = np.fft.ifft(S_filtered).real
    return sig_filt

# Ejemplo de uso (descomentar en entorno gr√°fico)
# t, sig = generar_senal()
# sig_f = filtrar_pasabajo(sig, 1000, cutoff=80)
# plt.figure(figsize=(10,4)); plt.plot(t[:500], sig[:500], label='original'); plt.plot(t[:500], sig_f[:500], label='filtrada'); plt.legend(); plt.show()


## ‚úÖ Tips, recomendaciones y recursos finales

- Prefiere entornos virtuales y `requirements.txt` para reproducibilidad.
- Documenta con `README.md` y docstrings; usa `sphinx` para documentaci√≥n formal.
- Usa `pytest` para tests y CI (GitHub Actions) para automatizar pruebas.
- Aprende a usar `numpy`, `pandas`, `matplotlib`, `scipy` y luego explora `scikit-learn` para ML.

**Recursos:**
- NumPy docs: https://numpy.org/doc/
- Python packaging guide: https://packaging.python.org/
- Tutoriales: Real Python, SciPy lectures
