# Introducción a Machine Learning
En esta lección, aprenderemos los conceptos básicos de machine learning, incluyendo los tipos de aprendizaje, los modelos de regresión lineal y logística, y las etapas del modelamiento en machine learning.


## 1. Tipos de aprendizaje
Existen tres tipos principales de aprendizaje en machine learning:
- **Aprendizaje supervisado**: El modelo aprende de datos etiquetados. Se usan ejemplos de entrada y su correspondiente salida correcta para predecir las salidas de nuevos datos. Ejemplos: regresión lineal, árboles de decisión.
- **Aprendizaje no supervisado**: El modelo trabaja con datos no etiquetados, buscando patrones o agrupaciones en los datos. Ejemplos: clustering con k-medias, análisis de componentes principales (PCA).
- **Aprendizaje por refuerzo**: Un agente interactúa con un entorno y aprende de las consecuencias de sus acciones mediante un sistema de recompensas y castigos.


### Ejemplo visual de aprendizaje supervisado
Vamos a generar un ejemplo de aprendizaje supervisado con un conjunto de datos sencillo, usando regresión lineal para predecir una variable.


In [ ]:
# Importamos las bibliotecas necesarias
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# Creamos datos de ejemplo
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# Creamos el modelo de regresión lineal
lin_reg = LinearRegression()
lin_reg.fit(X, y)

# Hacemos predicciones
X_new = np.array([[0], [2]])
y_predict = lin_reg.predict(X_new)

# Visualizamos los datos y la línea de regresión
plt.plot(X_new, y_predict, "r-", label="Predicción")
plt.scatter(X, y)
plt.xlabel("X")
plt.ylabel("y")
plt.title("Regresión Lineal - Aprendizaje Supervisado")
plt.legend()
plt.show()

## 2. Modelos de regresión lineal y logística
**Regresión Lineal**: Es un método para predecir una variable continua a partir de una o más variables independientes.

**Regresión Logística**: Es un modelo usado para la clasificación binaria, donde la variable dependiente es categórica (por ejemplo, 0 o 1).

### Ejemplo de regresión logística
Vamos a realizar un ejemplo usando un modelo de regresión logística para clasificar datos binarios.


In [ ]:
# Importamos las bibliotecas necesarias
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
from sklearn.metrics import classification_report

# Generamos un conjunto de datos sintéticos para clasificación binaria
X, y = make_classification(n_samples=100, n_features=2, n_classes=2, random_state=42)

# Dividimos los datos en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Creamos el modelo de regresión logística
log_reg = LogisticRegression()
log_reg.fit(X_train, y_train)

# Hacemos predicciones
y_pred = log_reg.predict(X_test)

# Imprimimos un reporte de clasificación
print(classification_report(y_test, y_pred))

## 3. Etapas del modelamiento en machine learning
El proceso de machine learning incluye las siguientes etapas:
1. **Recolección de datos**: Obtención de los datos necesarios para entrenar el modelo.
2. **Preprocesamiento de los datos**: Limpieza, normalización y transformación de los datos en un formato adecuado para el modelo.
3. **División de los datos**: División del conjunto de datos en conjunto de entrenamiento y prueba.
4. **Selección del modelo**: Elegir el modelo más adecuado según el problema.
5. **Entrenamiento del modelo**: Ajuste del modelo usando el conjunto de entrenamiento.
6. **Evaluación del modelo**: Medir el rendimiento del modelo usando el conjunto de prueba.
7. **Ajuste del modelo**: Mejorar el modelo con ajustes adicionales (hiperparámetros, regularización, etc.).


### Visualización de las etapas del modelamiento
Podemos visualizar el proceso de machine learning como un ciclo iterativo, donde el modelo es refinado con base en la evaluación de su rendimiento en nuevos datos.

In [ ]:
# Dibujamos un diagrama simple de las etapas del machine learning
import matplotlib.pyplot as plt
import networkx as nx

# Creamos el gráfico
G = nx.DiGraph()
etapas = ["Recolección de datos", "Preprocesamiento", "División de datos", "Selección del modelo", "Entrenamiento", "Evaluación", "Ajuste del modelo"]
G.add_edges_from([(etapas[i], etapas[i+1]) for i in range(len(etapas)-1)])

# Dibujamos el gráfico
pos = nx.spring_layout(G)
nx.draw(G, pos, with_labels=True, node_color='lightblue', node_size=2000, font_size=10, font_weight='bold', arrows=True)
plt.title('Ciclo de etapas del modelamiento en Machine Learning')
plt.show()