# Percepción (PER): examen de prácticas del bloque 1, grupo 3CO11, turno 2, 25-4-2023, 8:45-9:30

Lee este cuaderno y realiza las actividades y ejercicios propuestos.

## Importación de librerías relevantes

Como sabes, sklearn facilita el aprendizaje y evaluación de clasificadores discriminativos en digits. Ejecuta el código siguiente para importar librerías relevantes:

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import multivariate_normal
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Perceptron, LogisticRegression
from sklearn.metrics import accuracy_score
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler, PolynomialFeatures
from sklearn.pipeline import make_pipeline

## Lectura del corpus digits

Ejecuta el código siguiente con random_state igual a las tres últimas cifras de tu DNI/NIE:

In [2]:
digits = load_digits()
X = digits.data
y = digits.target
X_train, X_test, y_train, y_test = train_test_split(
    digits.data, digits.target, test_size=0.75, shuffle=True, random_state=123)
print(X_train.shape, y_train.shape)

(449, 64) (449,)


## Perceptrón

Ejecuta el código siguiente para estudiar la precisión de Perceptrón con penalización L2 en función de alpha:

In [3]:
for a in np.logspace(-8,-3,6):
    clf = Perceptron(penalty='l2', alpha=a, random_state=0).fit(X_train, y_train)
    acc = accuracy_score(y_test, clf.predict(X_test))
    print('La precisión de {0!s} es {1:.1%}'.format(clf, acc))

La precisión de Perceptron(alpha=1e-08, penalty='l2') es 92.5%
La precisión de Perceptron(alpha=1e-07, penalty='l2') es 92.5%
La precisión de Perceptron(alpha=1e-06, penalty='l2') es 92.4%
La precisión de Perceptron(alpha=1e-05, penalty='l2') es 90.9%
La precisión de Perceptron(penalty='l2') es 92.8%
La precisión de Perceptron(alpha=0.001, penalty='l2') es 60.8%


## Regresión logística

Añade una celda de código para estudiar regresión logística con solver lbfgs, en función del preproceso. Aparte de características polinómicas (de grado 2 a lo sumo), el preproceso de características puede incluir estandarización (StandardScaler) y reducción de la dimensión (PCA). Determina una configuración del preproceso que obtenga máxima precisión.

In [4]:
def lr_exp(standardize=True, degree=1, n_components=0):
    clf = make_pipeline(StandardScaler() if standardize else None, 
    PolynomialFeatures(degree=degree),
    PCA(n_components=n_components) if n_components > 0 else None,
    LogisticRegression(max_iter=10000, solver='lbfgs', n_jobs=8)).fit(X_train, y_train)
    y_pred = clf.predict(X_test)
    return accuracy_score(y_test, y_pred)

for degree in [1, 2]:
    for n_components in [8, 16, 32, 64, 128, 256, 0]:
        if n_components <= min(X_train.shape): 
            for standardize in [False, True]:
                acc = lr_exp(standardize=standardize, degree=degree, n_components=n_components)
                print('degree {0:} standardize {1:} components {2:}: {3:.1%} acc'.format(degree, standardize, n_components, acc))

degree 1 standardize False components 8: 88.4% acc
degree 1 standardize True components 8: 85.6% acc
degree 1 standardize False components 16: 92.7% acc
degree 1 standardize True components 16: 92.9% acc
degree 1 standardize False components 32: 94.4% acc
degree 1 standardize True components 32: 94.4% acc
degree 1 standardize False components 64: 94.7% acc
degree 1 standardize True components 64: 95.1% acc
degree 1 standardize False components 0: 94.7% acc
degree 1 standardize True components 0: 95.1% acc
degree 2 standardize False components 8: 86.5% acc
degree 2 standardize True components 8: 62.6% acc
degree 2 standardize False components 16: 91.9% acc
degree 2 standardize True components 16: 80.0% acc
degree 2 standardize False components 32: 94.4% acc
degree 2 standardize True components 32: 86.5% acc
degree 2 standardize False components 64: 95.3% acc
degree 2 standardize True components 64: 92.1% acc
degree 2 standardize False components 0: 96.7% acc
degree 2 standardize True co