# Normalización de un vector

Dado un arreglo:
$$
v \in R^{n}
$$
Cuyos elementos cumplen:
$$
v_{i} \in [-10,10]
$$
Se le pide normalizar el arreglo considerando que $\mu$ es la media aritmética de los elementos de $v$ y $\sigma$ es la desviación estándar de los elementos de $v$.

Los elementos del arreglo de salida deben tener esa forma:
$$
o_{i} = (v_{i} - \mu) / \sigma
$$
Luego de normalizar todos los elementos del vector se debe cumplir que $\mu_{o}$ es $0$ y $\sigma_{o}$ es $1$.

Consideraciones para su solución:

- Tome en cuenta la precisión, pero sin priorizarla sobre la rapidez.
- Deberá trabajar con arreglos `numpy`.
- Su función en *Python* que normalizará el arreglo de entrada no puede emplear funciones de ningún módulo, ni predefinidas por el entorno.
- Su función en *C* que normalizará el arreglo de entrada solo puede emplear como función auxiliar la función `sqrt` o alguna de sus variantes.

In [8]:
import random

In [9]:
import numpy as np

In [10]:
def crear_arreglo(tam):
  rango_min = -10.0
  rango_max = 10.0
  return np.asarray([random.uniform(rango_min, rango_max) for _ in range(tam)])

a) (0.5 ptos) Usar la función `crear_arreglo` para crear un arreglo de 16 elementos.

In [11]:
arreglo = (crear_arreglo(16))
print(arreglo)


[ 0.23353847 -8.43894012  7.55423248 -6.57773521  0.29463985 -5.52848999
 -8.94419485 -9.52054295 -7.31362267  9.73041726  7.87693806 -0.26533004
 -8.20433622 -6.72105986  1.069555   -4.09557706]


b) (2.0 ptos) Implementar en *Python* la función `py_normalizar_arreglo`. Debe recibir un arreglo y devolver el arreglo normalizado.

In [12]:
def py_normalizar_arreglo(arr):

    suma = 0
    for i in range (len(arr)):

        suma = suma + arr[i]

    media = suma/len(arr)

    k = 0

    for j in range (len(arr)):

        k = k + (arr[j]-media)**2
        

    desv_est = (k / len(arr))**0.5


    arr_norm = []
    for n in range (len(arr)):
        
        var = (arr[n] - media)/desv_est
        arr_norm.append(var)

    return arr_norm

c) (0.5 pto) Pruebe la función `py_normalizar_vector` en el arreglo que creó en el ítem (a), y con las funciones `mean` y `stdev` del módulo `statistics` compruebe que la media del arreglo normalizado es cero y la desviación estándar es uno.

In [13]:
from statistics import mean, stdev
arreglo_inicial = crear_arreglo(16)
arreglo_normalizado = py_normalizar_arreglo(arreglo_inicial)
# Paso 3: Calcula la media y la desviación estándar del arreglo normalizado
media_normalizado = mean(arreglo_normalizado)
desviacion_estandar_normalizado = stdev(arreglo_normalizado)
# Paso 4: Verifica que la media sea aproximadamente cero y la desviación estándar sea aproximadamente uno
#print(f"Media del arreglo normalizado: {media_normalizado:.5f}")
print(f"{media_normalizado:.5f}")
print(f"{desviacion_estandar_normalizado:.5f}")
#print(f"Desviación estándar del arreglo normalizado: {desviacion_estandar_normalizado:.5f}")

-0.00000
1.03280


d) (3.0 ptos) Implementar la función `normalizar_vector` en *C*.

In [34]:
%%file normalizar_vector.c
#include <math.h>
void normalizar_vector(int *arr, int N){

    double suma = 0.0;
    double k = 0;
    double media;
    double desv_est;

    for( int i=0; i < N; i++){
        
        suma = suma + (arr[i]);

    }

    media = suma/N;

    for( int j = 0; j < N; j++){

        k = k + pow((arr[j])-media,2);
        

    }

    desv_est = sqrt((k / N));

    for(int p = 0; p < N; p++){

        arr[p] =  (arr[p] - media)/desv_est;


    }

}


Overwriting normalizar_vector.c


e) (0.5 ptos) Compile su archivo de *C* para generar la *shared library*

In [15]:
! gcc -shared -o normalizar_vector.so -fPIC normalizar_vector.c -lm


f) (1.0 pto) Implemente la función `ctypes_normalizar_vector` que devuelva la función implementada en C configurada para usarse.

In [16]:
import ctypes
def ctypes_normalizar_vector():

    lib = ctypes.CDLL('./normalizar_vector.so')
    lib.normalizar_vector.argtypes = [np.ctypeslib.ndpointer(dtype=np.int32),ctypes.c_int]

    return lib.normalizar_vector
    

g) (0.5 ptos) Haga una instancia de la función

In [23]:
ctypes_normalizar_vector_g = ctypes_normalizar_vector()

h) (1.0 pto) Implementar en *Python* la función `c_normalizar_vector`. Debe recibir un arreglo, y devolver un arreglo normalizado a partir de la instancia de su función *C* ya configurada que hizo en el ítem anterior.

In [24]:
def c_normalizar_vector(arr, ctypes_normalizar_vector_g):
    # Hacemos una copia del arreglo original para no modificarlo
    resultado = arr.copy()
    
    # Llama a la función C para normalizar el arreglo
    ctypes_normalizar_vector_g(resultado)
    
    return resultado


i) (0.5 ptos) Pruebe la función `c_normalizar_vector` en el arreglo que creó en el ítem (a), y con las funciones `mean` y `stdev` del módulo `statistics` compruebe que la media del arreglo normalizado es cero y la desviación estándar es uno.

In [33]:
from statistics import mean, stdev
# Llama a la función para obtener una instancia
normalize_fn = ctypes_normalizar_vector_g()

# Crea un arreglo con 16 elementos
arreglo = crear_arreglo(16)

# Utiliza la función c_normalizar_vector para normalizar el arreglo
resultado = c_normalizar_vector(arreglo, len(arreglo))

# Paso 3: Calcula la media y la desviación estándar del arreglo normalizado
media_normalizado = mean(resultado)
desviacion_estandar_normalizado = stdev(resultado)

print(f"{media_normalizado:.5f}")
print(f"{desviacion_estandar_normalizado:.5f}")


TypeError: this function takes at least 2 arguments (0 given)

In [None]:
from numpy import linalg as LA

In [None]:
def error_relativo(ref, val):
  return LA.norm((ref - val)) / LA.norm(ref)

j) (0.25 ptos) Emplee la función `error_relativo` para calcular el error relativo de su resultado en *C* con respecto a su resultado en *Python*

k) (0.25 ptos) Haga un **arreglo** de potencias de 2 que varién desde la potencia 10 hasta la potencia 19.

l) (0.5 ptos) Realizar 50 mediciones de tiempo para las funciones implementadas en *C* y *Python* para el menor de los tamaños.

m) (0.5 ptos) Presente una gráfica para las mediciones de tiempo de la función en *Python*. Incluya la mediana de los tiempos en el gráfico.

n) (0.5 ptos) Presente una gráfica para las mediciones de tiempo de la función en *C*. Incluya la mediana de los tiempos en el gráfico.

o) (0.5 pto) Realizar 50 mediciones de tiempo para las funciones implementadas en *C* y *Python* para el mayor de los tamaños.

p) (0.5 ptos) Presente una gráfica para las mediciones de tiempo de la función en *Python*. Incluya la mediana de los tiempos en el gráfico.

q) (0.5 ptos) Presente una gráfica para las mediciones de tiempo de la función en *C*. Incluya la mediana de los tiempos en el gráfico.

r) (0.5 ptos) Realizar 50 mediciones de tiempo y error relativo para las funciones implementadas en *C* y *Python* para todos los tamaños. El elemento representativo de cada tamaño será la mediana de las 50 mediciones.

s) (0.5 ptos) Presentar una gráfica de tiempo de ejecución por tamaño a partir de sus mediciones del ítem anterior.

t) (0.5 ptos) Presentar una gráfica de speedup por tamaño a partir de sus mediciones.

u) (0.5 ptos) Presentar una gráfica de error relativo por tamaño a partir de sus mediciones