# Comparativo Educativo: SQL vs NoSQL
## Análisis Estructural de Bases de Datos con Ejemplos Prácticos

Este notebook explora las diferencias fundamentales entre bases de datos SQL y NoSQL mediante ejemplos prácticos, visualizaciones y analogías didácticas.

## 1. Simulación de una base de datos SQL (estructura rígida)

Vamos a simular una tabla SQL con un esquema fijo, donde cada registro debe cumplir con la misma estructura (como si cada dato fuera una carta en una baraja, todas con el mismo formato).

En este ejemplo, crearemos una tabla de usuarios con columnas fijas: `id`, `nombre`, `edad`, `email`.

In [None]:
# Simulación de una tabla SQL con pandas
import pandas as pd
import numpy as np

np.random.seed(42)
num_rows = 200
nombres = [f"Usuario_{i}" for i in range(num_rows)]
edades = np.random.randint(18, 65, size=num_rows)
emails = [f"usuario{i}@ejemplo.com" for i in range(num_rows)]

sql_df = pd.DataFrame({
    'id': range(1, num_rows+1),
    'nombre': nombres,
    'edad': edades,
    'email': emails
})
sql_df.head()

Visualicemos la distribución de edades en la tabla SQL. En este modelo, todos los registros tienen las mismas columnas, como si cada carta de una baraja tuviera el mismo diseño y se apilaran perfectamente unas sobre otras.

In [None]:
# Visualización de la distribución de edades
import matplotlib.pyplot as plt
import seaborn as sns

plt.figure(figsize=(8,4))
sns.histplot(sql_df['edad'], bins=15, kde=True, color='skyblue')
plt.title('Distribución de edades en la tabla SQL')
plt.xlabel('Edad')
plt.ylabel('Cantidad de usuarios')
plt.show()

## 2. Simulación de una base NoSQL con documentos heterogéneos (estructura libre)

Ahora representamos una base NoSQL donde cada documento es diferente, como si cada hoja de un cuaderno tuviera información distinta y formatos variados. Aquí, los registros pueden tener diferentes campos y estructuras.

In [None]:
# Simulación de documentos NoSQL heterogéneos
import random

documentos_nosql = []
for i in range(num_rows):
    doc = {
        'id': i+1,
        'nombre': nombres[i],
        'edad': int(edades[i])
    }
    # Agregar campos aleatorios
    if random.random() < 0.5:
        doc['email'] = emails[i]
    if random.random() < 0.3:
        doc['telefono'] = f"300{random.randint(1000000,9999999)}"
    if random.random() < 0.2:
        doc['direccion'] = f"Calle {random.randint(1,100)} #{random.randint(1,99)}-A"
    documentos_nosql.append(doc)

# Mostrar algunos ejemplos
documentos_nosql[:5]

En este modelo, cada documento puede tener diferentes campos, como si cada hoja de un cuaderno tuviera información distinta. Visualizaremos cuántos documentos tienen cada campo para ver la heterogeneidad.

In [None]:
# Visualización de la heterogeneidad de los documentos
from collections import Counter

campos = []
for doc in documentos_nosql:
    campos.extend(doc.keys())
conteo_campos = Counter(campos)

plt.figure(figsize=(6,4))
sns.barplot(x=list(conteo_campos.keys()), y=list(conteo_campos.values()), palette='viridis')
plt.title('Cantidad de apariciones de cada campo en documentos NoSQL')
plt.ylabel('Cantidad de documentos')
plt.xlabel('Campo')
plt.show()

## 3. Simulación de una base NoSQL homogénea (estructura uniforme, sin esquema obligatorio)

En este ejemplo, todos los documentos tienen el mismo formato, pero el modelo sigue siendo flexible: podríamos agregar o quitar campos en cualquier momento. Es como tener baldes idénticos, pero donde podríamos poner diferentes tipos de objetos si quisiéramos.

In [None]:
import random
import string

# Letras permitidas para la inicial
letras_permitidas = ['a', 'b', 'c', 'd', 'e', 't', 'y', 'u', 'i', 'q']

# Simulación de documentos NoSQL homogéneos con nombres aleatorios entre letras permitidas
nosql_homogeneo = []
for i in range(num_rows):
    letra = random.choice(letras_permitidas)
    nombre = f"{letra}usuario_{i}"
    doc = {
        'id': i+1,
        'nombre': nombre,
        'edad': int(edades[i]),
        'email': emails[i]
    }
    nosql_homogeneo.append(doc)

# Mostrar algunos ejemplos
nosql_homogeneo[:5]

Visualicemos la distribución de las letras iniciales en este modelo homogéneo, que aunque es flexible, mantiene la uniformidad en todos los documentos.

In [None]:
# Visualización: cantidad de nombres que inician por cada letra del abecedario a-z

plt.figure(figsize=(10,4))
# Contar cuántos nombres inician por cada letra del abecedario a-z en nosql_homogeneo
primeras_letras = [doc['nombre'][0] for doc in nosql_homogeneo]
conteo_letras = Counter(primeras_letras)
letras = list(string.ascii_lowercase)
cantidades = [conteo_letras.get(letra, 0) for letra in letras]

sns.barplot(x=letras, y=cantidades, palette='mako')
plt.title('Cantidad de nombres que inician por cada letra (a-z)')
plt.xlabel('Letra inicial')
plt.ylabel('Cantidad de nombres')
plt.show()

## 4. Reflexión comparativa: Ventajas y desventajas de SQL vs NoSQL

### SQL (Relacional):
**Ventajas:**
- Integridad de datos garantizada
- Consultas complejas y relacionales eficientes
- Estructura clara y predecible
- Ideal para datos estructurados y relaciones

**Desventajas:**
- Menos flexible ante cambios de esquema
- Escalabilidad horizontal limitada
- Requiere definir estructura antes de insertar datos

### NoSQL (Documental):
**Ventajas:**
- Flexibilidad de esquema total
- Fácil de escalar horizontalmente
- Ideal para datos semi-estructurados o heterogéneos
- Desarrollo más ágil

**Desventajas:**
- Menor integridad y validación automática
- Consultas complejas menos eficientes
- Posible inconsistencia de datos
- Menos herramientas de análisis maduras

### Analogía final:
- **SQL** es como una biblioteca donde todos los libros tienen el mismo tamaño y formato, lo que facilita el orden y la búsqueda.
- **NoSQL** es como una caja de archivos donde cada documento puede ser diferente, permitiendo guardar cualquier cosa, pero requiriendo más cuidado para encontrar y validar la información.

**La elección depende del caso de uso:** si se requiere estructura y relaciones complejas, SQL es ideal; si se necesita flexibilidad y escalabilidad, NoSQL es la mejor opción.