<a href="https://colab.research.google.com/github/AndresGuevara10/Amigo-Secreto/blob/main/Numpy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Numpy: Análisis numérico eficiente con Python**

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


NumPy es una biblioteca de Python que ofrece diversas herramientas y funcionalidades esenciales para la computación científica, incluyendo objetos de matriz multidimensional conocidos como *arrays*, rutinas para operaciones rápidas en matrizes, además de operaciones matemáticas, manipulación de formas, estadística entre otros. Es ampliamente utilizada en áreas como análisis de datos, procesamiento de señales y aprendizaje de máquina.

Para acceder a la documentación de esta biblioteca, puedes hacer clic en el siguiente enlace: https://numpy.org/devdocs/index.html

## Importando las bibliotecas y conectando con Drive

In [2]:
import numpy as np
from google.colab import drive

drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [3]:
####### Método 1 para cargar nuestro dataset desde Github Gists ########

# url = 'https://gist.githubusercontent.com/ahcamachod/41b8a65c5e5b58125401deafb68af460/raw/f84320f69efa1cc3e86e1db054422cfa4869c63e/manzanas.csv'
# np.loadtxt(url,delimiter=',')

In [4]:
# 12 * 7 + 3 = 87
np.arange(1,88,1)

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
       35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51,
       52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68,
       69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85,
       86, 87])

In [5]:
# np.loadtxt(url,delimiter=',',usecols = np.arange(1,88,1))

In [6]:
####### Método 2 para cargar el dataset directamente desde Google Drive #####

path = '/content/drive/MyDrive/Numpy/manzanas.csv'

datos = np.loadtxt(path,delimiter=',',usecols = np.arange(1,88,1))

FileNotFoundError: /content/drive/MyDrive/Numpy/manzanas.csv not found.

## Métodos básicos para explorar *Arrays*

In [None]:
datos.ndim

In [None]:
datos.shape

In [None]:
datos

In [None]:
datos.T

In [None]:
datos_transpuestos = datos.T

## Visualización y Selección

In [None]:
fechas = datos_transpuestos[:,0]
fechas

In [None]:
precios = datos_transpuestos[:,1:]
precios

In [None]:
import matplotlib.pyplot as plt

plt.plot(fechas,precios)

In [None]:
plt.plot(fechas,precios[:,0])

In [None]:
fechas = np.arange(1,88,1)

In [None]:
plt.plot(fechas,precios[:,0])

In [None]:
Moscu = precios[:,0]
Kaliningrado = precios[:,1]
Petersburgo = precios[:,2]
Krasnodar = precios[:,3]
Ekaterimburgo = precios[:,4]

In [None]:
plt.plot(fechas,Kaliningrado)

## Comparación entre *arrays*

In [None]:
Moscu.shape

In [None]:
moscu_1 = Moscu[0:12]
moscu_2 = Moscu[12:24]
moscu_3 = Moscu[24:36]
moscu_4 = Moscu[36:48]

In [None]:
plt.plot(np.arange(1,13,1),moscu_1)
plt.plot(np.arange(1,13,1),moscu_2)
plt.plot(np.arange(1,13,1),moscu_3)
plt.plot(np.arange(1,13,1),moscu_4)
plt.legend(['2013','2014','2015','2016'])

In [None]:
np.array_equal(moscu_1,moscu_2)

In [None]:
np.allclose(moscu_1,moscu_2, 2)

## Tratamiento de Nan

In [None]:
np.mean(Moscu)

In [None]:
np.mean(Kaliningrado)

In [None]:
plt.plot(fechas, Kaliningrado)

In [None]:
Kaliningrado

In [None]:
np.isnan(Kaliningrado)

In [None]:
np.sum(np.isnan(Kaliningrado))

In [None]:
Kaliningrado[4] = (Kaliningrado[3] + Kaliningrado[5])/2

In [None]:
np.sum(np.isnan(Kaliningrado))

In [None]:
plt.plot(fechas, Kaliningrado)

In [None]:
np.mean(Kaliningrado)

## Diferencia entre *arrays*

In [None]:
plt.plot(fechas,Moscu)

### **y = ax + b**

In [None]:
x = fechas
y = 1.5 * x + 78

In [None]:
y

In [None]:
plt.plot(fechas,Moscu)
plt.plot(x,y)

In [None]:
Moscu - y

In [None]:
np.sqrt(np.sum(np.power(Moscu - y,2)))

In [None]:
x = fechas
y = 0.5 * x + 78

In [None]:
plt.plot(fechas,Moscu)
plt.plot(x,y)

In [None]:
Moscu - y

In [None]:
np.sum(np.power(Moscu - y,2))

In [None]:
np.sqrt(np.sum(np.power(Moscu - y,2)))

In [None]:
np.linalg.norm(Moscu - y)

## Multiplicación

$$\alpha = pendiente$$
$$\beta = interseccion$$
$$n = observaciones$$
$$y = precio$$
$$x = fecha$$


La solución para la pendiente es:

$$\alpha = \frac{n \sum xy - \sum x \sum y}{n \sum x^2 - (\sum x)^2} $$

Y para la intersección:
 $$\beta = \frac{\sum y - \alpha \sum x}{n} $$

Y obtenemos la ecuación de la recta:

$$y = \alpha x + \beta $$

In [None]:
n = np.size(Moscu)
y = Moscu
x = fechas

$$\alpha = \frac{n \sum xy - \sum x \sum y}{n \sum x^2 - (\sum x)^2} $$

In [None]:
a = (n*np.sum(x*y)-np.sum(x)*np.sum(y))/(n*np.sum(x**2) - np.sum(x)**2)

 $$\beta = \frac{\sum y - \alpha \sum x}{n} $$

In [None]:
b = np.mean(y)- a*np.mean(x)

In [None]:
print(f'La pendiente es: {a}\nLa intersección es: {b}')

In [None]:
y = a*x + b

In [None]:
y

In [None]:
np.linalg.norm(Moscu - y)

In [None]:
plt.plot(fechas,Moscu)
plt.plot(x,y)
plt.plot(25,a*25+b,'*r')
plt.plot(75,a*75+b,'*r')

In [None]:
a*25+b

In [None]:
a*75+b

## Valores Aleatorios

In [None]:
# Entero

np.random.randint(40,100,100)

In [None]:
# Decimal

np.random.uniform(0.1,0.9,100)

In [None]:
pendientes = np.random.uniform(0.1,0.9,100)
pendientes

In [None]:
for i in range(100):
  print(np.linalg.norm(Moscu - (pendientes[i]*x + b)))

In [None]:
norma = np.array([])

for i in range(100):
  norma = np.append(norma, np.linalg.norm(Moscu - (pendientes[i]*x + b)))

In [None]:
norma

In [None]:
np.random.uniform(0.1,0.9,5)

In [None]:
np.random.uniform(0.1,0.9,5)

In [None]:
np.random.uniform(0.1,0.9,5)

In [None]:
np.random.seed(99)
np.random.uniform(0.1,0.9,5)

In [None]:
np.random.seed(99)
np.random.uniform(0.1,0.9,5)

In [None]:
np.random.uniform(0.1,0.9,5)

In [None]:
np.random.seed(99)

norma = np.array([])

for i in range(100):
  norma = np.append(norma, np.linalg.norm(Moscu - (pendientes[i]*x + b)))

In [None]:
norma

In [None]:
np.random.seed(99)

norma = np.array([])

for i in range(100):
  norma = np.append(norma, np.linalg.norm(Moscu - (pendientes[i]*x + b)))

norma

## Exportando el archivo generado

In [None]:
pendientes

In [None]:
norma

In [None]:
datos = np.column_stack([norma,pendientes])
datos

In [None]:
datos.shape

In [None]:
np.savetxt('/content/drive/MyDrive/Numpy/norma_y_pendientes.csv', datos, delimiter=',')