# Tarea 09
Sebastián González Juárez

# Parte teórica

**1. Explica con tus propias palabras en qu ́e consiste una “Maquina de Turing”.¿Que elementos la componen y cu ́al es su funcionamiento basico?**

Es un sistema identifica símbolos en una cinta infinita a partir de ciertas reglas. Las elementos con los que cuenta son:
- Cinta infinita: Dividida en celdas que contienen símbolos.
- Cabezal de lectura/escritura: Lee y escribe símbolos en la cinta, moviéndose a la izquierda o derecha.
- Estado actual: La máquina está en un estado específico en cada paso.
- Tabla de transiciones: Define las acciones (escribir, moverse, cambiar de estado) según el símbolo leído y el estado actual.

La decisión del funcionamiento en resumen es:

(a)	Lee un símbolo bajo el cabezal.

(b)	Consulta la tabla de transiciones para decidir qué acción tomar.

(c)	Escribe un símbolo, mueve el cabezal y cambia de estado.

(d)	Repite hasta llegar a un estado de "parada" (aceptación/rechazo).


**2. ¿Qu ́e significa que un lenguaje de programaci ́on actual (como Python o C++) siga el paradigma de Turing?**

Significa que es Turing-completo, es decir, puede resolver cualquier problema computable que una Máquina de Turing pueda resolver. Esto implica que:
-	Puede implementar bucles, condicionales y recursión.
-	Tiene capacidad de memoria ilimitada (sin contar la limitación por hardware).


**3. Reflexiona: ¿Que ventajas y limitaciones tiene el enfoque simbolico (como las maquinas de Turing) frente al enfoque conexionista (como las redes
neuronales)?**

El enfoque simbólico (como las máquinas de Turing) tenemos reglas lógicas claras y es preciso para problemas estructurados, pero es inflexible. El enfoque conexionista (como las redes neuronales) aprende de datos y maneja tareas complejas, pero es una "caja negra" que requiere mucha información y potencia. El primero es bueno para algoritmos definidos; el segundo, para problemas con patrones ocultos.

**4. Discute: ¿Como influye el tamaño de las capas ocultas en la predictividad de una red neuronal?**

El tamaño de las capas ocultas influye en:
- Capacidad de modelado: Más neuronas permiten aprender patrones complejos, pero pueden causar sobreajuste (overfitting).
- Generalización: Capas muy pequeñas subajustan (underfit), mientras que capas muy grandes memorizan el entrenamiento pero fallan en datos nuevos.
- Balance: Se usa validación cruzada para encontrar un equilibrio óptimo

**5. Busca: ¿Fue el poder de computo lo que impulso la revolucion del Deep
Learning?**

Sí, pero no fue el único factor. La revolución del Deep Learning se debió a:
- Hardware: GPUs/TPUs permitieron entrenar redes profundas eficientemente.
- Big Data: Disponibilidad de grandes datasets (ej.: ImageNet).
- Avances algorítmicos: Backpropagation, ReLU, dropout, arquitecturas como CNN/Transformer.
- Software: Librerías como TensorFlow/PyTorch facilitaron la implementación.

## Clasificacion con redes neuronales

**1. Carga el conjunto de datos de c ́ancer de mama desde Scikit-learn y divide
el conjunto en entrenamiento (80%) y prueba (20%).**

In [1]:
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split

In [2]:
data = load_breast_cancer()
X = data.data
y = data.target

In [3]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

**2. Entrena una red neuronal MLP (MLPClassifier) con las siguientes caracteristicas: 2 capas ocultas con 10 neuronas cada una, funcion de activacion tanh, y 1000 iteraciones (con los demas par ́ametros en default)**

In [4]:
from sklearn.neural_network import MLPClassifier

In [5]:
mlp = MLPClassifier(hidden_layer_sizes=(10, 10), activation='tanh', max_iter=1000, random_state=42)
mlp.fit(X_train, y_train)

**3. Calcula la precision del modelo en el conjunto de prueba.**

In [6]:
from sklearn.metrics import accuracy_score

In [7]:
y_pred = mlp.predict(X_test)
initial_accuracy = accuracy_score(y_test, y_pred)
print(f"Precisión inicial: {initial_accuracy:.4f}")

Precisión inicial: 0.9561


**4. Estudia el efecto de la estandarizacion de las caracterısticas:**

In [8]:
from sklearn.preprocessing import StandardScaler

In [9]:
# Estandarizar los datos
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [10]:
# Entrenar y evaluar con datos estandarizados
mlp_scaled = MLPClassifier(hidden_layer_sizes=(10, 10), activation='tanh', max_iter=1000, random_state=42)
mlp_scaled.fit(X_train_scaled, y_train)

In [11]:
y_pred_scaled = mlp_scaled.predict(X_test_scaled)
scaled_accuracy = accuracy_score(y_test, y_pred_scaled)
print(f"Precisión estandarizada: {scaled_accuracy:.4f}")

Precisión estandarizada: 0.9825


¿Cual es la diferencia de rendimiento antes y despues de estandarizar?

Mejoro, pues sin estandarizar, las diferentes escalas de los datos (algunos números muy grandes, otros muy pequeños) hacían que la red neuronal aprendiera mal, como si unas características "gritaran" más fuerte que otras solo por sus valores. Al estandarizar, todas las características quedaron en la misma escala (centradas en 0 y con rango similar), lo que permitió que el modelo aprendiera mejor los patrones reales y cometiera menos errores. Básicamente, le dimos a la red neuronal "lentes correctivos" para que viera los datos con claridad.

**5. Realiza los siguientes experimentos con el modelo:**

a. Haz la red neuronal m ́as ancha (m ́as neuronas por capa, por ejemplo
50).

In [12]:
mlp_wide = MLPClassifier(hidden_layer_sizes=(50, 50), activation='tanh', max_iter=1000, random_state=42)
mlp_wide.fit(X_train_scaled, y_train)
y_pred_wide = mlp_wide.predict(X_test_scaled)
print(f"Precisión red ancha: {accuracy_score(y_test, y_pred_wide):.4f}")

Precisión red ancha: 0.9825


Se obtuvo la misma presición

b. Haz la red neuronal m ́as profunda (m ́as capas ocultas).

In [13]:
mlp_deep = MLPClassifier(hidden_layer_sizes=(10, 10, 10, 10), activation='tanh', max_iter=1000, random_state=42)
mlp_deep.fit(X_train_scaled, y_train)
y_pred_deep = mlp_deep.predict(X_test_scaled)
print(f"Precisión red profunda: {accuracy_score(y_test, y_pred_deep):.4f}")

Precisión red profunda: 0.9737


emperora la presición

c. Cambia la funci ́on de activaci ́on de las neuronas ocultas (por ejem-
plo, relu, etc.).

In [14]:
mlp_relu = MLPClassifier(hidden_layer_sizes=(10, 10), activation='relu', max_iter=1000, random_state=42)
mlp_relu.fit(X_train_scaled, y_train)
y_pred_relu = mlp_relu.predict(X_test_scaled)
print(f"Precisión con relu: {accuracy_score(y_test, y_pred_relu):.4f}")

Precisión con relu: 0.9825


Se obtuvo la misma presición

d. ¿Qu ́e configuraci ́on de red neuronal ofrece el mejor rendimiento?

La que empeoro fue la red profunda. Las demás tuvieron lo mismo de presición.

e. Finalmente compara tu “mejor” modelo de MLP con los resultados
de entrenar un bosque aleatorio al comparar las matrices de confusi ́on
para los dos modelos.

In [15]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import confusion_matrix

In [16]:
# Entrenar Random Forest
rf = RandomForestClassifier(random_state=42)
rf.fit(X_train_scaled, y_train)
y_pred_rf = rf.predict(X_test_scaled)

In [17]:
print("\nMatriz de confusión Random Forest:")
print(confusion_matrix(y_test, y_pred_rf))


Matriz de confusión Random Forest:
[[40  3]
 [ 1 70]]


In [18]:
mlp_wide = MLPClassifier(hidden_layer_sizes=(50, 50), activation='tanh', max_iter=1000, random_state=42)
mlp_wide.fit(X_train_scaled, y_train)
y_pred_wide = mlp_wide.predict(X_test_scaled)
print("\nMatriz de confusión mlp_wide:")
print(confusion_matrix(y_test, y_pred_wide))


Matriz de confusión mlp_wide:
[[42  1]
 [ 1 70]]


In [19]:
# Comparación de precisiones
print(f"\nPrecisión mejor MLP: {accuracy_score(y_test, y_pred_wide):.4f}")
print(f"Precisión Random Forest: {accuracy_score(y_test, y_pred_rf):.4f}")


Precisión mejor MLP: 0.9825
Precisión Random Forest: 0.9649


Ambos modelos mostraron buen rendimiento, con el MLP teniendo una ligera ventaja en este caso particular.