# Ejercicios NumPy II

In [1]:
import numpy as np

### Ejercicio 1

Cargar la matriz de números que se encuentra en dimensiones.txt. Cada fila representa a cada uno de los objetos de un problema concreto, siendo cada una de las columnas las características que definen cada objeto. Observa que cada columna tiene un rango muy diferente. Obtener nuevas matrices en las que cada una de las características esté en la misma escala. Para cada matriz, normaliza todas las columnas utilizando uno de los siguientes métodos:
- Dividir cada elemento entre la suma de los elementos de cada columna $$\frac{x_i}{\sum_{j=1}^{n}x_j}$$
- Restar a cada elemento el mínimo de la columna y dividir entre la resta del máximo menos mínimo $$\frac{x_i-\min_j x_j}{\max_j x_j - \min_j x_j}$$
- Restar a cada elemento la media aritmética de la columna y dividir entre la desviación típica de los elementos de la columna $$\frac{x_i - \overline{x}}{\sigma}$$
- Dividir cada elemento entre la norma euclídea del vector columna $$\frac{x_i}{\sqrt{\sum_{j=1}^{n}x_j^2}}$$

In [12]:
matriz = np.loadtxt('matriz.txt', delimiter = ',')
normalizacion1 = matriz / matriz.sum(axis = 0)
normalizacion2 = (matriz - matriz.min(axis = 0))/(matriz.max(axis = 0) - matriz.min(axis = 0))
normalizacion3 = (matriz - matriz.mean(axis = 0))/matriz.std(axis = 0)
normalizacion4 = matriz / np.sqrt((matriz**2).sum(axis = 0))
#normalizacion4 = matriz / np.linalg.norm(matriz, axis = 0)

array([[ True,  True,  True, ...,  True,  True,  True],
       [ True,  True,  True, ...,  True,  True,  True],
       [ True,  True,  True, ...,  True,  True,  True],
       ..., 
       [ True,  True,  True, ...,  True,  True,  True],
       [ True,  True,  True, ...,  True,  True,  True],
       [ True,  True,  True, ...,  True,  True,  True]], dtype=bool)

### Ejercicio 2

En este ejercicio vamos a aproximar la integral definida de una función $\int_{a}^{b} f(x)dx$ mediante números aleatorios. Para ello, vamos a generar un conjunto de n (suficientemente grande) números aleatorios en el intervalo $[a,b]$. La aproximación de la integral de dicha función vendrá dada por

$$\frac{b-a}{n}\sum_{i=1}^{n} f(x_i).$$

Calculamos la aproximación de la integral $\int_{0}^{10}f(x)dx$ donde 

$$f(x)=\begin{cases}
    x^2-\frac{x}{9} & \mbox{ si } x\le 3 \\
    \frac{4x}{3}-3 & \mbox{ si } 3<x\le 6 \\
    \frac{-5x}{24}+\frac{50}{24} &  \mbox{ en otro caso}
\end{cases}$$

Evidentemente, cuanto mayor sea n (conjunto de números aleatorios), mejor será la aproximación de la integral

In [26]:
n = 100000
a = 0
b = 10
x = np.random.uniform(a, b, size = (n))
f = np.zeros_like(x)
f[x<=3] = x[x<=3]**2 - x[x<=3]/9
f[(x>3) & (x<=6)] = 4*x[(x>3) & (x<=6)]/3 - 3
f[x>6] = -5*x[x>6]/24 + 50/24
integral = float(b-a)/n * f.sum()
integral

18.698514865268756

### Ejercicio 3

Aproximación del número $\pi$ mediante números aleatorios. 

Generar un conjunto de n puntos aleatorios de dos dimensiones en el cuadrado $[-1,1]^2$. Para cada punto aleatorio $(x_1,x_2)$, contaremos cuántos puntos satisfacen que están dentro del círculo de radio 1 centrado en $(0,0)$, es decir, cuántos cumplen la condición $x_1^2+x_2^2\le 1$. El área de dicho círculo es $\pi$, puesto que el radio es igual a 1. Por tanto, podemos establecer que 

$$ \pi = 4 \frac{\mbox{# puntos dentro del círuclo}}{n}$$

<img src="image.png">

In [32]:
n = 10000000
x = np.random.uniform(low = -1, high = 1, size = (n, 2))
puntos_dentro = np.sum((x**2).sum(axis = 1)<=1)
pi = 4.0 * puntos_dentro / n
pi

3.1407336

### Ejercicio 4

Comprobación del tiempo de ejecución entre diferentes instrucciones.

Importando el módulo time podemos acceder a la funcionalidad %timeit que nos permite medir el tiempo de ejecución de una instrucción, función, etc.

Observa el siguiente código

In [33]:
import time
def suma1(m1, m2):
    dimensiones = m1.shape
    m = np.zeros_like(m1)
    for i in range(dimensiones[0]):
        for j in range(dimensiones[1]):
            m[i,j] = m1[i,j] + m2[i,j]

def suma2(m1,m2):
    m = m1+2

m1 = np.random.rand(1000,1000)
m2 = np.random.rand(1000,1000)
%timeit suma1(m1,m2)
%timeit suma2(m1,m2)

1 loop, best of 3: 451 ms per loop
100 loops, best of 3: 4 ms per loop


Comprueba el tiempo de ejecución en estos casos:

Ejemplo1: Dado un vector de n números aleatorios entre 0 y 10, realizar una función que aplique la misma función f(x)  (del ejercicio de la integración) recorriendo todos los elementos y utilizando if/elif. Realizar otra función que aplique boolean indexing. Comparar los tiempos




In [37]:
def funcion_1(x):
    f = np.zeros_like(x)
    for i in range(len(x)):
        if x[i]<= 3:
            f[i] = x[i]**2 - x[i]/9
        elif x[i]<=6:
            f[i] = 4*x[i]/3 - 3
        else:
            f[i] = -5*x[i]/24 + 50/24
    return f

def funcion_2(x):
    f = np.zeros_like(x)
    f[x<=3] = x[x<=3]**2 - x[x<=3]/9
    f[(x>3) & (x<=6)] = 4*x[(x>3) & (x<=6)]/3 - 3
    f[x>6] = -5*x[x>6]/24 + 50/24
    return f

x = np.random.uniform(low = 0, high = 10, size = 10000)
%timeit funcion_1(x)
%timeit funcion_2(x)

100 loops, best of 3: 15.5 ms per loop
1000 loops, best of 3: 506 µs per loop
