In [2]:
import numpy as np

# Pregunta 1

## Parte A
### Lógica

Se busca determinar el valor del coeficiente cc en la expansión de Taylor, utilizando un método con convergencia cuadrática. Para esto, se propone el uso del método de Newton, ya que se indica que la raíz tiene multiplicidad 1.

Esto implica usar el método de Newton ó Newton modificado, pero como m=1, entonces solo usaremos newton.

Primero necesitamos obtener lo que pide este método.

1. La función f(x) y f'(x)
2. El punto inicial (o initial guess), para esta pregunta, el punto inicial será el punto entre $x$ y $x0$

La forma en la que está la función f(x) que nos dan no es muy amigable, por lo que podríamos cambiarla a una forma equivalente.

$f(x) = f(x_0) + f'(x_0)(x-x_0) + \frac{f''(x_0)}{2!}(x-x_0)^2+ ... + \frac{f^{(k)}(x_0)}{k!}(x-x_0)^k + \frac{f^{(k+1)}(c)}{(k+1)!}(x-x_0)^{k+1}$

Para que sea más bonito, cambiemos todo lo que está a la izquierda de $\frac{f^{(k+1)}(c)}{(k+1)!}(x-x_0)^{k+1}$ a $T_k(x)$

Es decir: $f(x_0) + f'(x_0)(x-x_0) + \frac{f''(x_0)}{2!}(x-x_0)^2+ ... + \frac{f^{(k)}(x_0)}{k!}(x-x_0)^k = T_k(x)$

Y queda como: $f(x) = T_k(x) + \frac{f^{(k+1)}(c)}{(k+1)!}(x-x_0)^{k+1}$, de esta forma podemos poner todo nuestro enfoque en c. 

Recordando lo que conocemos, podemos saber que $f(x)$ y $T_k(x)$ son un numero constante, ya que conocemos a $x$ y a $x_0$ y las k derivadas de f(x) son obtenibles computacionalmente. 

Luego podemos mover $T_k(x)$ al otro lado de la ecuación y queda: $\frac{f^{(k+1)}(c)}{(k+1)!}(x-x_0)^{k+1} = f(x) -T_k(x)$

Moviendo el resto de las variables quedamos con $f^{(k+1)}(c) = \frac{(f(x) -T_k(x))(k+1)!}{(x-x_0)^{k+1}}$

Dejemos a $\frac{(f(x) -T_k(x))(k+1)!}{(x-x_0)^{k+1}} = ϕ(c)$ por simplicidad

Con esto, podemos obtener $f^{(k+1)}(c) = ϕ(c)$ y al pasarl $ϕ(c)$ a la izquierda quedamos con $G(c) := f^{(k+1)}(c) - ϕ(c) = 0$ 



Y esta será función con la que podríamos iterar usando el método de Newton.

### Algoritmo
Para aplicar el algoritmo, si o si se necesita la derivada de la función con la cual iteraremos, por lo que voy a asumir que se puede obtener.

Luego $G'(c) = f^{(k+2)}(c)$ (el $ϕ(c)$ se elimina ya que es una constante respecto a c).

Con esto podemos tener la siguiente iteración de Newton.

$c_{i+1} = c_i - \frac{f^{(k+1)}(c) - ϕ(c)}{f^{(k+2)}(c)}$

Finalmente, el orden de acciones a seguir es:
1. Obtener f(x), ya que conocemos f(x) y x.
2. Evaluar el polinomio hasta k, es decir, obtener las derivadas hasta k y luego evaluar con $x$ e $x_0$, es decir, obtener $T_k(c)$
3. Calcular la constante $ϕ(c)$, esta se calcula después de obtener las derivadas ya que su valor posiblemente cambie con el tamaño de k y por ende la precisón de la aproximación.
4. Definir $G(c) := f^{(k+1)}(c) - ϕ(c) = 0$
5. Aplicar Newton hasta que se llegue a una tolerancia o numero de iteraciones.
6. Valor de c debería ser la raíz de $G(c)$, lo cual obtenemos al finalizar las iteraciones.

## Parte B
Se implementa el algoritmo usando las funciones dadas:

In [None]:
'''
input :
x : (float) value of $x$.
x0 : (float) value of $x_0$
k : (integer) This defines the number of terms to be used, which is $k+1$.
output:
c : (float) the estimated value for $c$.
'''
def find_c(x,x0,k):
# Your own code.
    dx= x-x0

    #paso 1
    fx = k_derivatives_of_f(x,0) #no la tengo y no la voy a definir :)

    #paso 2
    vector_k = np.arange(k+1) #de 0 a k
    derivadas = k_derivatives_of_f(x0,vector_k) #derivadas en x0
    powers = np.power(dx, vector_k) #potencias de dx
    factoriales = my_factorial(vector_k) #factoriales de k   
    Tk = np.dot(derivadas / factoriales, powers)

    #paso 3
    phi = (my_factorial(k+1) * (fx - Tk)) / np.power(dx, k+1)

    #paso 4, newton
    #como dijimos antes, el punto medio entre x0 y x será el initial guess
    c_i = (x0 + x) / 2
    #necesitamos a G(c_i) y G'(c_i)
    def G(c):
        return k_derivative_of_f(c, k+1) - phi
    def Gp(c):
        return k_derivative_of_f(c, k+2)

    c = Newton1D(G,Gp,c_i,m=1)
    
    return c




# Pregunta 2
## Parte A

Nos dan los vectores:

$x = [2^{-800},2^{-800}],
\newline
y = [2^{-700},2^{-700}].$

Hacemos un ruteo de la función dada considerando double precision.

### Ruteo

El producto punto correspondiente es: $2^{-800} * 2^{-700} + 2^{-800} * 2^{-700}$ lo cual es $2^{-1500} + 2^{-1500} = 2^{-1499}$

Pero, como estamos con precisión doble conocemos que el valor minimo posible es $2^{-1074}$ (la explicación es muy larga, pero es tan simple como pensar que la precisión limitada y con un exponente y mantisa de ciertos valores, el valor minimo almacenado debido al uso de los bits es tambien limitado a un tamaño, y con precisión doble es $2^{-1074}$) y por ende $2^{-1500}$ se anula y queda 0 por lo que el producto punto es 0.

Luego se calcula n_x usando my_norm_2(x):

Se obtiene max_abs_value, en este caso es $max\_abs\_value = 2^{-800}$

x_tilde es: $x_{tilde} = \frac{[2^{-800},2^{-800}]}{2^{-800}}$

x_tilde_norm es la norma 2 del vector x_tilde (puedo observar que se normaliza el vector para evitar anular todo con la doble precisión): $x\_tilde\_norm = \sqrt{1^2 + 1^2} = \sqrt{2}$

luego la norma2 es $norm_2 = 2^{-800} * \sqrt{2}$

Volviendo a la función anterior, quedamos con n_x igual a $2^{-800} * \sqrt{2}$

Pero el siguiente paso es dot/n_x como sabemos que dot es 0 entonces out queda como 0

El siguiente paso es calcular n_y, pero como se hará otra división igual a la anterior el valor seguirá siendo 0.

Finalmente se retorna 0 (podría decirse que los vectores son perpendiculares, pero claramente no es así)


## Parte B
### Parte A (de la B)

#### Lógica
Como vimos antes, el problema radica en la forma en que se calcula el producto punto. Pero si normalizamos los vectores x e y antes de calcular el producto punto, como se hace en my_norm_2, podremos evitar la anulación que se produce.

Tengamos la similitud del coseno: 
$ \frac{\langle x,y \rangle}{ ||x||_2 ||y||_2}$

Cambiemos los valores de $||x||_2$ y de $||y||_2$ a uno equivalente, como visto en la función my_norm_2 se retorna norm_2 = max_abs_value*x_tilde_norm, que es la norma del vector multiplicado por el valor máximo de la función y visto en el enunciado: $||x||_2 = α||\frac{x}{α}||$ con α el valor máximo del vector x y $||y||_2 = β||\frac{y}{β}||$ con β el valor máximo del vector y.

Luego tendemos esto:
$ \frac{\langle x,y \rangle}{ α||\frac{x}{α}|| β||\frac{y}{β}||}$

Podemos usar los máximos valores de los vectores para normalizar a x e y antes de calcular el producto punto y evitar la anulación!

#### Algoritmo
Sería muy similar al algoritmo que nos dieron en el enunciado, solo que habrán unos pasos extra como normalizar a x e y, luego tendremos que agregar los máximos para no perder la equivalencia.

1. Escalar a X y a Y
2. Calcular el producto punto de X_n e Y_n
3. Calcular la norma 2 de X e Y usando my_norm_2
4. Hacer las divisiones para obtener la similitud del coseno

### Parte B (de la B)

Primero normalizamos 
$x_n = \frac{[2^{-800},2^{-800}]}{2^{-800}} = [1, 1]$
$y_n = \frac{[2^{-700},2^{-700}]}{2^{-700}} = [1, 1]$
El producto punto correspondiente es: $dot = [1,1]*[1,1] = 1+1 = 2$

Luego se calcula n_x usando my_norm_2(x):

Se obtiene max_abs_value, en este caso es $max\_abs\_value = 2^{-800}$

x_tilde es: $x_{tilde} = \frac{[2^{-800},2^{-800}]}{2^{-800}}$

x_tilde_norm es la norma 2 del vector x_tilde (puedo observar que se normaliza el vector para evitar anular todo con la doble precisión): $x\_tilde\_norm = \sqrt{1^2 + 1^2} = \sqrt{2}$

luego la norma2 es $norm_2 = 2^{-800} * \sqrt{2}$

Volviendo a la función anterior, quedamos con n_x igual a $2^{-800} * \sqrt{2}$

Luego, dot/n_x es $\frac{2}{2^{-800} * \sqrt{2}}$

Como antes normalizamos a x, debemos multiplicarle el valor máximo de x a esta expresión para que quede equivalente.

$out = \frac{2*2^{-800}}{2^{-800} * \sqrt{2}}$ y se simplifica:

$out = \frac{2}{\sqrt{2}}$

El siguiente paso es calcular n_y, el valor es similar al de n_x.

$n_y = 2^{-700} * \sqrt{2}$

Lo que sigue es cs = out/n_y

$cs = \frac{\frac{2}{\sqrt{2}}}{2^{-700} * \sqrt{2}}$

Igual que antes, como se normaliza Y, tenemos que multiplicar su valor máximo.

$cs = \frac{\frac{2}{\sqrt{2}}*2^{-700}}{2^{-700} * \sqrt{2}} = \frac{2}{\sqrt{2}*\sqrt{2}} = \frac{2}{2} = 1$ 

Finalmente se retorna 1, lo que es correcto ya que los vectores son paralelos.


### Parte C
Se implementa la función descrita

In [4]:
'''
input:
x : (ndarray) Input vector 'x'.
output:
norm_2 : (float) norm-2 of the vector 'x'
'''
def my_norm_2(x):
    # Getting the max absolute value
    max_abs_value = np.max(np.abs(x))

    # Scaling the vector
    x_tilde = x/max_abs_value

    # Computing the 2-norm of the scaled vector
    x_tilde_norm = np.linalg.norm(x_tilde)

    # Computing the actual 2-norm of ’x’
    norm_2 = max_abs_value*x_tilde_norm

    # Return the computed norm-2
    return norm_2

In [3]:
def cosine_similarity_v1(x,y):
    # Primero normalizamos los vectores
    x_max = np.max(np.abs(x))
    x_n = x/x_max
    y_max = np.max(np.abs(y))
    y_n = y/y_max
    # Producto punto entre los vectores normalizados
    dot_product = np.dot(x_n,y_n)

    # Computing the 2-norm of x
    n_x = my_norm_2(x_n)
    # Computing the first division y multiplicamos para que el resultado sea el mismo
    out = dot_product/n_x
    # Computing the 2-norm of y
    n_y = my_norm_2(y_n)
    # Computing the second division y multiplicamos para que el resultado sea el mismo
    cs = out/n_y
    # Returning the computed cosine similarity
    return cs

In [5]:
#probemos 
x = np.array([np.power(2,-800.),np.power(2,-800.)])
y = np.array([np.power(2,-700.),np.power(2,-700.)])
cosine_similarity_v1(x,y)
#close enough

0.9999999999999999