# Proyecto Módulo 1

In [None]:
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits import mplot3d
sns.set_theme(style="whitegrid")

%matplotlib inline
plt.rcParams["figure.figsize"] = (8, 6)

import warnings
warnings.filterwarnings('ignore')

# Matplotlib

## Mobius Strip

En este desafío, vas a construir y visualizar en 3D una **cinta de Möbius**, una figura fascinante que tiene una sola cara y un solo borde.  

---

## 🎯 Objetivos de aprendizaje

- Comprender cómo usar `np.meshgrid` para crear superficies paramétricas.
- Aplicar transformaciones matemáticas para construir una cinta de Möbius.
- Visualizar una superficie 3D compleja usando `Matplotlib` con `plot_trisurf`.
- Personalizar el gráfico: etiquetas, ángulo de cámara, colores, transparencia…

---

## 🧩 Planteamiento del problema

La cinta de Möbius se puede generar matemáticamente deformando un anillo circular.  
Usarás dos variables:

- `θ` (theta): un ángulo que recorre el círculo completo de 0 a 2π.
- `w`: una coordenada que representa el ancho de la cinta, de −0.25 a +0.25.

Para cada punto de la cinta, se define:

- Una deformación del radio: `r = 1 + w * cos(θ / 2)`
- Coordenadas 3D:
  - `x = r * cos(θ)`
  - `y = r * sin(θ)`
  - `z = w * sin(θ / 2)`

---

## 🛠️ Tareas

1. **Importa las bibliotecas necesarias**: `numpy` y `matplotlib`.
2. **Genera la malla** de puntos `theta` y `w` con `np.meshgrid`.
3. **Calcula las coordenadas (x, y, z)** aplicando las fórmulas anteriores.
4. **Usa `plot_trisurf` para trazar la superficie**.
5. Ajusta los **límites**, **etiquetas** de ejes, **colores** y el **ángulo de cámara** para que la visualización sea clara y atractiva.
6. (Opcional) Añade una barra de color o modifica el colormap.

---

## 🎨 Pistas

- Usa `np.linspace(0, 2*np.pi, 30)` para `theta` y `np.linspace(-0.25, 0.25, 8)` para `w`.
- Usa `np.ravel()` para aplanar las matrices y poder pasarlas a `plot_trisurf`.
- Ajusta `ax.view_init(elevación, azimut)` para un buen ángulo de vista.
- Usa `cmap='viridis'`, `'plasma'`, `'coolwarm'`, o el que más te guste.

---

## 📌 ¿Qué entregas?

Un gráfico 3D interactivo que muestre la cinta de Möbius completa, con etiquetas de ejes, color bien aplicado, y un ángulo de cámara agradable.

> ¿Puedes explicarle a un compañero por qué esta figura tiene **una sola cara**?

---

¡Buena suerte! 🌈🚀


In [None]:
# data


# radius
r =

# x, y, z
x = np.ravel()
y = np.ravel()
z = np.ravel()

In [None]:
# 🎨 Inicio del gráfico


# 🌈 Dibujar la superficie de la cinta de Möbius


# 📏 Límites (ajustados para que el gráfico no se corte)
ax.set_xlim(-1.5, 1.5)
ax.set_ylim(-1.5, 1.5)
ax.set_zlim(-0.5, 0.5)

# 🏷️ Etiquetas de ejes


# 🔄 Ángulo de cámara
ax.view_init(10, 65)

# 🖼️ Mostrar figura
plt.show()

# Numpy

## 🧠 Perceptrones para Compuertas Lógicas AND y OR

En este desafío, entrenarás dos **perceptrones** (neuronas artificiales) para modelar el comportamiento de las compuertas lógicas **AND** y **OR** usando **NumPy**.

---

## 🎯 Objetivos de aprendizaje

- Comprender el algoritmo de aprendizaje del perceptrón y su regla de actualización.  
- Implementar en NumPy una función de activación sigmoide suavizada.  
- Entrenar perceptrones que resuelvan funciones linealmente separables.  
- Registrar y graficar la evolución del error durante el entrenamiento.

---

## 🧩 Planteamiento del problema

El perceptrón calcula la salida  

$$
s = \sigma(\mathbf{w} \cdot \mathbf{x} + b)
$$

donde:

- $(\mathbf{w} \in \mathbb{R}^2)$ son los **pesos**.  
- $(b \in \mathbb{R})$ es el **sesgo** (*bias*).  
- $(\sigma)$ es la función de activación *sigmoide suavizada*:

$$
\sigma(x)=
\begin{cases}
0 & \text{si } x < -5 \\\\
1 & \text{si } x > 5 \\\\
\frac{1}{1 + e^{-x}} & \text{en otro caso}
\end{cases}
$$

Como conjunto de entrenamiento se usan las tablas de verdad de AND y OR:

$$
\mathbf{X} =
\begin{bmatrix}
1 & 1 \\\\
1 & 0 \\\\
0 & 1 \\\\
0 & 0
\end{bmatrix},
\quad
\mathbf{Y}_{AND} =
\begin{bmatrix}
1 \\\\
0 \\\\
0 \\\\
0
\end{bmatrix},
\quad
\mathbf{Y}_{OR} =
\begin{bmatrix}
1 \\\\
1 \\\\
1 \\\\
0
\end{bmatrix}
$$

Cada puerta lógica se aprende con su propio perceptrón.

---

## 🛠️ Tareas

1. **Importa** las bibliotecas: `numpy` (y `matplotlib.pyplot` para el gráfico).  
2. **Define** la función `sigmoid_soft(x)` descrita arriba (usa `np.where`).  
3. **Inicializa** pesos `w` (por ejemplo, `np.random.randn(2)`) y sesgo `b = 0`.  
4. **Implementa el bucle de entrenamiento**:  
   - Para cada muestra `(x_i, y_i)` calcula `ŷ_i = sigmoid_soft(w·x_i + b)`.  
   - Calcula el error `ε_i = y_i - ŷ_i`.  
   - Actualiza `w ← w + η · ε_i · x_i` y `b ← b + η · ε_i`.  
   - Suma `|ε_i|` en `error_epoch`.  
5. **Repite** hasta que `error_epoch` sea 0 o alcances un número máximo de epochs.  
6. **Registra** `error_epoch` en una lista para graficarlo al final.  
7. **Grafica** la evolución del error para AND (azul) y OR (naranja).  
8. **Muestra** los pesos finales y verifica que las predicciones coinciden con la tabla de verdad.

---

## 🎨 Pistas

- Utiliza `η = 0.1` como **tasa de aprendizaje** inicial.  
- Con cuatro muestras, un máximo de **50–100 epochs** suele ser suficiente.  
- Para el gráfico:

  ```python
  plt.plot(errors_and, label='AND')
  plt.plot(errors_or, label='OR')
  plt.xlabel('Época')
  plt.ylabel('Error absoluto acumulado')
  plt.legend()
  plt.ylim(-0.5, 4.5)

- Para el gráfico comparativo:

  ```python
  labels = ["11", "10", "01", "00"]
  x = np.arange(len(labels))
  width = 0.35

  fig, ax = plt.subplots()
  ax.bar(x - width/2, y_true, width, label='Real')
  ax.bar(x + width/2, y_pred.round(), width, label='Predicho')

  ax.set_xticks(x)
  ax.set_xticklabels(labels)
  ax.set_ylabel('Salida')
  ax.set_title('Comparación Real vs Predicho')
  ax.legend()
  plt.show()


In [None]:
# ────────────────────────────────
# 1. Funciones auxiliares
# ────────────────────────────────

# ───────────────────────────────────────────────
# a. Sigmoide suavizada
# ───────────────────────────────────────────────
def sigmoid_soft(z):
    """
    Calcula la sigmoide suavizada:
        - Devuelve 0 si z < -5
        - Devuelve 1 si z > 5
        - En el resto, aplica 1 / (1 + e^{-z})

    Acepta escalares o arrays 1D/2D.
    """
    z = np.asarray(z, dtype=float)
    return .........

In [None]:
# ───────────────────────────────────────────────
# b. Entrenamiento del perceptrón
# ───────────────────────────────────────────────
def train_perceptron(X, y, eta=0.1, max_epochs=100):
    """
    Entrena un perceptrón de 2 entradas usando la regla clásica de aprendizaje.

    Parámetros
    ----------
    X : array (n_samples, 2)
        Vectores de entrada.
    y : array (n_samples,)
        Etiquetas (0/1).
    eta : float
        Tasa de aprendizaje.
    max_epochs : int
        Número máximo de pasadas por el conjunto de datos.

    Devuelve
    --------
    w : array (2,)
        Pesos finales.
    b : float
        Sesgo final.
    errors : list
        Error absoluto acumulado por época.
    """
    w = np.random.randn(2)   # Pesos aleatorios
    b = 0.0                  # Sesgo inicial
    errors = []



    return w, b, errors

In [None]:
# ───────────────────────────────────────────────
# c. Predicción con el modelo entrenado
# ───────────────────────────────────────────────
def predict(X, w, b):
    """
    Predice las salidas del perceptrón entrenado para cada fila de X.
    Devuelve un array con las probabilidades (entre 0 y 1).
    """
    preds = []


In [None]:
# ────────────────────────────────
# 2. Datos (tablas de verdad)
# ────────────────────────────────
X = np.array([], dtype=float)

y_and = np.array([], dtype=float)
y_or  = np.array([], dtype=float)

In [None]:
# ────────────────────────────────
# 3. Entrenamiento , eta=0.1
# ────────────────────────────────
w_and, b_and, errors_and = train_perceptron
w_or,  b_or,  errors_or  = train_perceptron

print("Pesos AND:", w_and, "   Sesgo AND:", b_and)
print("Pesos OR :", w_or,  "   Sesgo OR :", b_or)

In [None]:
# ────────────────────────────────
# 4. Predicciones finales
# ────────────────────────────────
y_pred_and = predict
y_pred_or  = predict

# Para la comparación real-predicho usamos valores redondeados (0/1)
y_pred_and_bin = np.round(y_pred_and)
y_pred_or_bin  = np.round(y_pred_or)

In [None]:
# ────────────────────────────────
# 5. Gráfico 1 – Evolución del error
# ────────────────────────────────
plt.figure(figsize=(6, 4))

plt.plot()
plt.plot()

plt.xlabel("Época")
plt.ylabel("Error absoluto acumulado")
plt.ylim(-0.5, 4.5)
plt.title("Convergencia del perceptrón")



plt.show()

In [None]:
# ────────────────────────────────
# 6. Gráfico 2 – Real vs. Predicho
# ────────────────────────────────
labels = []
x = np.arange(len(labels))
width = 0.35

fig, axs = plt.subplots(1, 2, figsize=(9, 3), sharey=True)

# AND
axs[0].bar(x - width/2, y_and,        width, label="Real")
axs[0].bar(x + width/2, y_pred_and_bin, width, label="Predicho")
axs[0].set_xticks(x)
axs[0].set_xticklabels(labels)
axs[0].set_title("AND")
axs[0].set_ylabel("Salida")

# OR
axs[1].bar(x - width/2, y_or,        width, label="Real")
axs[1].bar(x + width/2, y_pred_or_bin, width, label="Predicho")
axs[1].set_xticks(x)
axs[1].set_xticklabels(labels)
axs[1].set_title("OR")

for ax in axs:
    ax.set_ylim(-0.1, 1.1)
    ax.legend()

fig.suptitle("Comparación Real vs. Predicho")
plt.tight_layout()
plt.show()

# Pandas

## Análisis con Pandas

El objetivo de este proyecto es dominar el análisis exploratorio de datos (EDA) en un contexto bancario utilizando **Pandas** y **Seaborn**.

---

## 🎯 Objetivos del proyecto

1. Explorar un conjunto de datos bancarios con Pandas.  
2. Construir tablas dinámicas (*pivot tables*).  
3. Visualizar el conjunto de datos con distintos tipos de gráficas mediante Seaborn.

---

## 🗂️ Estructura general

- **Materiales y métodos**  
- **Parte general**  
  - Importación de librerías  
  - Exploración del *dataset*  
  - Tablas dinámicas  
  - Visualización con Seaborn  
- **Tareas / Desafíos**

---

## 🔧 1. Librerías
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

%matplotlib inline
sns.set_theme(style="whitegrid")  # Estilo por defecto


## 🔍 2. Carga y exploración del dataset

Los datos usados en este proyecto proceden de una porción del conjunto de marketing bancario de libre acceso alojado en el repositorio **UCI Machine Learning** (consulta las condiciones de cita en: [https://archive.ics.uci.edu/ml/citation\_policy.html](https://archive.ics.uci.edu/ml/citation_policy.html)).
El dataset, descrito originalmente en *Moro et al., 2014*, está a disposición libremente.

El objetivo general es llevar a cabo un análisis preliminar que ayude a identificar qué clientes aceptarían la oferta de un **depósito a plazo** tras recibir una llamada del banco. En otras palabras, buscamos calificar a los clientes potenciales según sus rasgos —por ejemplo, anticipar si incumplirán un préstamo o si abrirán un depósito— a partir de su perfil.

En este proyecto, nos plantearemos varias preguntas clave sobre la base de los datos:

1. ¿Qué porcentaje de clientes aceptan la oferta?
2. Entre los clientes que aceptan la oferta, ¿cuáles son los valores promedio de las variables numéricas más relevantes?
3. ¿Cuánto dura, en promedio, la llamada de aquellos que terminan aceptando?
4. ¿Cuál es la edad media de los clientes captados que además están solteros?
5. ¿Cómo varían la edad media y la duración de la llamada según las distintas ocupaciones?

Por último, complementaremos el estudio con visualizaciones que faciliten diseñar campañas de marketing bancario más efectivas.

Inicia cargando el dataset.

In [None]:
df =

### Información del dataset

Muestra los nombres de las columnas

Imprime la Información general del dataset

Columnas del *dataset* y su descripción

| Nº | Nombre de la columna        | Descripción (español)                                                                          | Tipo / Valores posibles                                                                                                                                                  |
| -- | --------------------------- | ---------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------ |
| 1  | **age**                     | Edad del cliente (en años).                                                                    | Numérica                                                                                                                                                                 |
| 2  | **job**                     | Tipo de ocupación.                                                                             | Categórica: `admin.`, `blue-collar`, `entrepreneur`, `housemaid`, `management`, `retired`, `self-employed`, `services`, `student`, `technician`, `unemployed`, `unknown` |
| 3  | **marital**                 | Estado civil.                                                                                  | Categórica: `divorced`, `married`, `single`, `unknown`                                                                                                                   |
| 4  | **education**               | Nivel educativo.                                                                               | Categórica: `basic.4y`, `basic.6y`, `basic.9y`, `high.school`, `illiterate`, `professional.course`, `university.degree`, `unknown`                                       |
| 5  | **default**                 | ¿Tiene créditos en mora?                                                                       | Categórica: `no`, `yes`, `unknown`                                                                                                                                       |
| 6  | **housing**                 | ¿Tiene préstamo hipotecario?                                                                   | Categórica: `no`, `yes`, `unknown`                                                                                                                                       |
| 7  | **loan**                    | ¿Tiene préstamo personal?                                                                      | Categórica: `no`, `yes`, `unknown`                                                                                                                                       |
| 8  | **contact**                 | Medio de contacto.                                                                             | Categórica: `cellular`, `telephone`                                                                                                                                      |
| 9  | **month**                   | Mes del último contacto.                                                                       | Categórica: `jan`, `feb`, `mar`, …, `nov`, `dec`                                                                                                                         |
| 10 | **day\_of\_week**           | Día de la semana del último contacto.                                                          | Categórica: `mon`, `tue`, `wed`, `thu`, `fri`                                                                                                                            |
| 11 | **duration**                | Duración del último contacto (segundos).                                                       | Numérica                                                                                                                                                                 |
| 12 | **campaign**                | Número de contactos realizados con este cliente en la campaña actual (incluye el último).      | Numérica                                                                                                                                                                 |
| 13 | **pdays**                   | Días transcurridos desde el contacto anterior en la campaña previa (`999` → nunca contactado). | Numérica                                                                                                                                                                 |
| 14 | **previous**                | Nº de contactos previos con este cliente antes de la campaña actual.                           | Numérica                                                                                                                                                                 |
| 15 | **poutcome**                | Resultado de la campaña de marketing anterior.                                                 | Categórica: `failure`, `nonexistent`, `success`                                                                                                                          |
| 16 | **emp.var.rate**            | Tasa de variación del empleo (trimestral).                                                     | Numérica                                                                                                                                                                 |
| 17 | **cons.price.idx**          | Índice de precios al consumidor (mensual).                                                     | Numérica                                                                                                                                                                 |
| 18 | **cons.conf.idx**           | Índice de confianza del consumidor (mensual).                                                  | Numérica                                                                                                                                                                 |
| 19 | **euribor3m**               | Tipo Euribor a 3 meses (diario).                                                               | Numérica                                                                                                                                                                 |
| 20 | **nr.employed**             | Número de empleados (trimestral).                                                              | Numérica                                                                                                                                                                 |
| 21 | **y** *(variable objetivo)* | ¿El cliente contrató un depósito a plazo?                                                      | Binaria: `yes`, `no`                                                                                                                                                     |


In [None]:
print()

¿Está el dataset completo? Recuerda que en la columna **y** se encuentra el valor que nos dice si la persona aceptó o no un depósito a plazo.

Describe los datos numéricos del dataset y conoce tus datos

* ¿Cuál es la edad media de los clientes? $\to$

Describe los datos categóricos del dataset , puedes utilizar ``object``

Refiriéndose a la mayor cantidad de elementos en cada columna `top`
* ¿cuál es el trabajo más común? $\to$
* sobre el estado marital. $\to$
* sobre el nivel educativo. $\to$

De las personas que aceptarían el depósito a plazo (variable **y**). ¿Cuántas lo aceptaron y cuántos no?

**Tip:** Usa `value_counts`

Represéntalo gráficamente usando `countplot`

¿Cuál es el estatus marital de los clientes? ¿En qué **proporción** se encuentran?

**Tip:** usa `value_counts` y `normalize`

* ¿Cuál es la **proporción** de clientes que se encuentran **casados**? $\to$

Represéntalo usando `pie` de seaborn

In [None]:
marital_counts =

plt.figure(figsize=(8, 6))
plt.title("Marital Status Distribution")
sns.set_theme(style="whitegrid")



plt.ylabel("")
plt.show()

¿Los resultados son concordantes con lo que te brindó la información al inicio? $\to (Sí/No)$

### Ordenar los datos

No interesa ofertar **depósitos a plazo** a nuevos clientes, para ello se realizan llamadas para contactarlos y cada llamada tiene una duración.

Ordena los datos de acuerdo a `duration` y de forma Descendente.

¿Durante qué meses se produjeron las llamadas más largas?

Represéntalo gráficamente usando `barplot`.

In [None]:
df_duration =
df_duration.reset_index
top_durations = df_duration.head(x)

plt.figure(figsize=(10, 6))


plt.xlabel("Duración")
plt.ylabel("Meses")
plt.show()

¿Cuál fue la menor edad y mayor duración en las llamadas realizadas?

**Tip:** Ordena en base a `age` y `duration`.

Grafica un `barplot` usando solo los primeros 5 elementos del orden generado previamente.

In [None]:
df_edad_duration =
df_edad_duration.reset_index
top_edad_durations = df_edad_duration.head(x)

plt.figure(figsize=(10, 6))



plt.xlabel("Edad")
plt.ylabel("Duración")
plt.show()

* Para que una llamada sea efectiva debe ser cora y directa. De acuerdo al análisis ¿crees que las llamadas están siendo efectivas con los jóvenes? $\to$

### Aplicar funciones

Esposible aplicar funciones directamente hacia los `panda.Series` o columnas o en un dataframe completo.

Vamos a encontrar los valores **máximos** para cada columna usando `apply`

* ¿Cuál es la edad del cliente más longevo? $\to$
* ¿Cuál es la cantidad de llamadas a un solo contacto durante una campaña? $\to$

Sabemos que la columna **y** es importante para nuestro análisis, esta columna es binaria. Usualmente es conveniente convertir los datos categóricos en `y` hacia `0` y `1` usando `map`.

### Indexación

¿Cuál es la media de los clientes interesados en obtener un contrato de depósito? y ¿cuál es la proporción respecto al total en **y**?

**Tip:** Usa la columna **y**.

* ¿Es un porcentage bajo o alto para un banco? $\to$

¿Cuál es la media en los datos totales para los clientes que **SÍ** contratarían un depósito?

**Tip:** Usan decribe en **y**

* ¿Cuál es la media de la edad de los clientes que **SÍ** aceptarián un depósito a plazo a los que deberíamos llamar? $\to$

Si los llamaramos ¿Cuánto tiempo necesitaríamos en promedio para convencerlos?

**Tip:** Recuerda usar la columna **y** y **duration**.

¿Cuál es la edad promedio de los clientes que **SÍ** aceptarián un depósito a plazo y se encuentran solteros?

**Tip:** Usa *boleanos*

¿Cuál es la información de la última persona a quién se le llamó?

### Tablas Pivote

¿Cuál es el estado marital de los clientes?

**Tip:** Usa `crosstab` y analiza en **y**

¿Y la proporción de ellos?

**Tip:** Usa `crosstab` y `normalze= "index" `

¿Cuál es la media de la **edad** y **duración** de la llamada respecto del **trabajo** desempeñado?

**Tip:** Usa `pivot_table`

## 📊 3. Visualizaciones Adicionales

Muchas veces al tener muchas variables (columnas), es complicado analizar o llevarlo hacia un entorno real. Para ello se analizan variables que podamos cuantificar u observar.

Gracifica usando `pairplot` la relación entre *age* , *duration* y *campaign*

* ¿Qué variables siguen una distribución gaussiana o geométrica? $\to$

Existen casos en que hay valores que se encuentran fuera de un margen estadístico. Para ello usualmente se debe filtrar, una opción es usar quatiles.

Aquí vamos a visualizar usando `boxplot` los outliers en los datos de las **edades** respecto al estado civil.

Añadamos ahora un filtro visual adicional separándolos por `housing`.

**Tip:** Usa `hue`

* ¿Existe alguna relación importante al conocer si tienen un préstamo para vivienda? $\to (Sí/No)$

# Gracias por su participación

No olvides enviar el notebook renombrándolo **Módulo1_Nombre_Apellido1_Apellido2**.