In [1]:
# Se importan las biblotecas que se van a utilizar
import numpy as np
from matplotlib import pyplot as plt
import h5py # es el formato en el que están almacenados los dígitos

plt.rcParams['figure.figsize'] = (10.0, 10.0) # tamaño de las figuras por defecto
# el inline sirve para que las figuras se muestren dentro del notebook
%matplotlib inline

# Ejemplo de ejercicio de parcial

En este ejemplo se muestra como funciona un aspecto particular del parcial. Existirán algunas partes en un ejercicio que funcionan como puntos de control, permiten continuar con el ejercicio aún cuando alguna de las partes anteriores no haya sido completada. Para realizar dichas partes sin haber completado alguna parte anterior puede que sea necesario ejecutar todas las celdas anteriores.

<a id="Extraccion"></a>
## Extracción de características

En esta sección se calculan características a partir de un cierto conjunto de datos ...

A continuación se levantan las características precalculadas por los docentes. Sin importar lo que se hizo antes, de aquí en más se trabajará con las características calculadas por los docentes.

In [5]:
# Se levantan las características calculadas por los docentes 
features_train = np.load('caracteristicas_train_docentes.npy')

In [4]:
print(features_train.shape)

(300, 2)


<a id="Normalizacion"></a>
## Normalización de características

Se plantea realizar una normalización de las características del conjunto de entrenamiento. Esto quiere decir que para cada una de las características se deberá encontrar un factor de escala y una traslación de forma tal que el mínimo valor que toma esa característica sea -1 y el máximo valor +1. La transformación es de la forma:

$$
f_n= \alpha (f + \beta)
$$

<a id="ParteX"></a>
### Parte X (XX Puntos)

Normalizar los puntos del conjunto de entrenamiento

$
\begin{bmatrix}
-x_1^T- \\
   .    \\
   .    \\
-x_N^T-
\end{bmatrix}
$

$$\bmatrix \alpha (max + \beta) = 1$$
$$\alpha (min + \beta) = -1$$

$$\alpha = \frac{2}{max - min}$$

$$\beta = -\frac{max + min}{2}$$


In [6]:
# traslación de la primera característica
beta1 = - ( np.amin(features_train[:,0]) + np.amax(features_train[:,0]) )/2

# factor de re-escalado de la primera característica
alpha1 = 2 / ( np.amax(features_train[:,0]) - np.amin(features_train[:,0]) )

# traslación de la segunda característica
beta2 =  - ( np.amin(features_train[:,1]) + np.amax(features_train[:,1]) )/2

# factor de re-escalado de la segunda característica
alpha2 =  2 / ( np.amax(features_train[:,1]) - np.amin(features_train[:,1]) ) 

# caracteristicas de entrenamiento normalizadas
features_train_n_estudiante = features_train.copy()

features_train_n_estudiante[:,0] = alpha1 * ( features_train[:,0] + beta1 )
features_train_n_estudiante[:,1] = alpha2 * ( features_train[:,1] + beta2 )

La siguiente celda verifica que las características fueron correctamente normalizadas.

In [7]:
min0, min1 = np.min(features_train_n_estudiante, axis=0)
max0, max1 = np.max(features_train_n_estudiante, axis=0)
print('El rango de la característica cero es: [%.02f, %.02f]' % (min0, max0))
print('El rango de la característica uno es: [%.02f, %.02f]' % (min1, max1))

El rango de la característica cero es: [-1.00, 1.00]
El rango de la característica uno es: [-1.00, 1.00]


A continuación se guardan las características calculadas y se levantan las características normalizadas precalculadas por los docentes. Si ambas coinciden la ejecución de la celda muestra el valor True. De aquí en más se trabajará con las precalculadas por los docentes.

In [8]:
# Se guardan las características normalizadas calculadas por el estudiante
np.save('caracteristicas_train_normalizadas_estudiante', features_train_n_estudiante)

In [9]:
# Se levantan las características normalizadas precalculadas por los docentes
features_train_n = np.load('caracteristicas_train_normalizadas_docentes.npy')

np.allclose(features_train_n_estudiante, features_train_n)

True