# CLASE 1.1: INTRODUCCI√ìN A NUMPY.
---
## ¬øQu√© es Numpy?
**Numpy** (acr√≥nimo de Numerical Python) es una librer√≠a de c√≥digo abierto desarrollada en Python y que es com√∫nmente utilizada en pr√°cticamente todos los campos de la computaci√≥n cient√≠fica y la ingenier√≠a, siendo el est√°ndar casi universal para el an√°lisis eficiente de datos num√©ricos en Python y el pilar fundamental de un mont√≥n de otras librer√≠as cient√≠ficas de gran poder, aptas para tareas tan diversas que todo ser humano que desee realizar an√°lisis de datos mediante el uso del lenguaje Python debe, como paso cero, tener esta librer√≠a como primera opci√≥n dentro de su caja de herramientas.

La librer√≠a **Numpy** es utilizada extensivamente como base para otras librer√≠as famosas y de uso masivo en Python, tales como **Pandas** (especializada en el an√°lisis de datos estructurados), **Matplotlib** (especializada en la graficaci√≥n y reportabilidad mediante una API de bajo nivel, pero sencilla y muy robusta), **Scipy** (la librer√≠a cient√≠fica de Python, especializada en el modelamiento anal√≠tico de fen√≥menos, procesos y sistemas de gran complejidad), **Scikit-Learn** (la librer√≠a cl√°sica de Machine Learning de Python) o **Tensorflow** (una de las librer√≠as de Deep Learning m√°s utilizadas en el mercado). Por esta raz√≥n, **Numpy** suele representar el primer acercamiento de los usuarios interesados en aprender t√≥picos de ciencia de datos desde una perspectiva pr√°ctica y es esencial en cualquier asignatura relativa a la toma de decisiones basadas en datos usando el lenguaje de programaci√≥n Python.

El elemento central de **Numpy** es una estructura de datos conocida como arreglo y que, en t√©rminos *pythonicos*, corresponde a un objeto conocido como `ndarray`. Dicho nombre hace referencia a un arreglo de valores (com√∫nmente num√©ricos) de dimensi√≥n ${n\times d}$, que suele ser imaginado como una estructura de datos de tipo matricial, que idealmente vive en el conjunto $\mathbb{R}^{n\times d}$ (que representa al conjunto de todas las matrices con ${n}$ filas y ${d}$ columnas). Sin embargo, **Numpy** no suele limitarse a arreglos matriciales, sino que a cualquier conjunto de elementos que puedan ser utilizados para operaciones vectorizadas, lo que incluye por supuesto a objetos de mayor dimensi√≥n, como tensores, y a otros de menor dimensi√≥n, como vectores. Todas estas estructuras de datos se representan en **Numpy** mediante el objeto `ndarray`.

Dado lo anterior, **Numpy** provee soporte para todo tipo de operaciones vectorizadas que son t√≠picas en el √°lgebra matricial y tensorial, desde sumas y productos de matrices, hasta descomposiciones en valores singulares, factorizaciones de tipo QR e incluso ortogonalizaci√≥n de arreglos matriciales. Lo mejor de todo esto, es que tales operaciones se realizan en **Numpy** con un alto grado de eficiencia en lo que respecta al tiempo de ejecuci√≥n.

### Instalaci√≥n de Numpy.
**Numpy** se incluye siempre como librer√≠a base en el framework de Anaconda Python. Sin embargo, siempre es posible instalar esta librer√≠a de manera separada mediante el gestor de paquetes de conda usando una terminal de Anaconda como sigue:

`conda install numpy`

Tambi√©n es posible usar el √≠ndice de paquetes de Python (PyPI) mediante el gestor `pip` para la instalaci√≥n de **Numpy**:

`pip install numpy`

La importaci√≥n de la librer√≠a **Numpy** en Python suele seguir una especie de est√°ndar en t√©rminos de su prefijo. De esta manera, **Numpy** suele importarse mediante el alias `np`, por lo que, una vez instalado, accederemos a todas funciones como sigue:

In [1]:
import numpy as np

### El Concepto de Arreglo.
Ya hab√≠amos comentado que los arreglos son estructuras de datos que permiten la realizaci√≥n de operaciones vectorizadas sobre ellos, pero es justo que ahondemos un poco m√°s en estos objetos y los conozcamos a fondo, simb√≥licamente, antes de comenzar a hacer operaciones con ellos.

Como ya dijimos, el arreglo es el elemento central de **Numpy**. Corresponde a una grilla de valores que viene provista con la correspondiente informaci√≥n relativa a la data almacenada en dicha grilla, y formas que permiten localizar dicha informaci√≥n en la grilla y c√≥mo interpretar tal informaci√≥n. La √∫nica restricci√≥n es que dicha grilla **s√≥lo puede contener informaci√≥n de un √∫nico tipo**.

Un ejemplo de arreglo es el *vector*. En t√©rminos m√°s bien rigurosos, un vector es un arreglo unidimensional, en el sentido de que, si bien un vector es un objeto cuya dimensi√≥n, matem√°ticamente, es equivalente al n√∫mero de elementos que lo constituyen, en t√©rminos geom√©tricos, tales elementos se ordenan en una √∫nica fila o columna, raz√≥n por la cual, en la terminolog√≠a computacional, los vectores constituyen arreglos de una sola dimensi√≥n.

Vamos a ejemplificar esto e ilustrarlo para que podamos entenderlo mejor. En Numpy, la creaci√≥n de un arreglo puede hacerse siempre mediante la funci√≥n `np.array()` (o simplemente `array()`, si nos abstraemos de usar el correspondiente alias `np`). Si queremos escribir el vector $\mathbf{x} =( -1,1,5,-8,2)  \in \mathbb{R}^{5} $, es posible considerar una representaci√≥n mediante una matriz fila o una matriz columna, ya que, equivalentemente, podemos escribir $\mathbf{x}$ simb√≥licamente como

<p style="text-align: center;">$\mathbf{x} =\left( \begin{matrix}-1&1&5&-8&2\end{matrix} \right)  \in \mathbb{R}^{1\times 5} \  \vee \  \mathbf{x} =\left( \begin{array}{r}-1\\ 1\\ 5\\ -8\\ 2\end{array} \right)  \in \mathbb{R}^{5\times 1}$</p>

En **Numpy**, todo arreglo puede escribirse considerando que, en t√©rminos matriciales, las filas se definen como listas de Python. Si queremos escribir una matriz con ${n}$ filas, bastar√° siempre con especificar un total de ${n}$ listas separadas por comas, donde el n√∫mero de elementos dentro de cada lista (que es el mismo, por supuesto, para todas ellas) define el n√∫mero de columnas de la matriz, usando la funci√≥n `np.array()`.

Como queremos representar, en este caso, al vector ùê± definido previamente, debemos considerar el tipo de representaci√≥n: Si $\mathbf{x}$ se representa por medio de una matriz fila (es decir, $\mathbf{x} \in \mathbb{R}^{1\times 5}$), bastar√° con escribir, conforme el esquema anteriormente descrito:

In [2]:
x = np.array([-1, 1, 5, -8, 2]) # Definimos el arreglo x.
print(x) # Imprimimos en pantalla el valor de x.

[-1  1  5 -8  2]


Por otro lado, si queremos escribir $\mathbf{x}$ como un vector columna, entonces cada una de las entradas de $\mathbf{x}$ debe ser una lista por s√≠ sola, ya que, como dijimos, cada fila de un arreglo se especifica mediante listas, separadas por comas. Por lo tanto, si $\mathbf{x} \in \mathbb{R}^{5\times 1}$, entonces imputaremos 5 listas separadas por comas. De este modo, debemos tener:

In [3]:
x = np.array([[-1], [1], [5], [-8], [2]]) # Definimos el arreglo x.
print(x) # Imprimimos en pantalla el valor de x.

[[-1]
 [ 1]
 [ 5]
 [-8]
 [ 2]]


Extender esta idea a matrices resulta, por supuesto, natural. Consideremos entonces la matriz $\mathbf{A} \in \mathbb{R}^{4\times 4} $, definida como

<p style="text-align: center;">$\mathbf{A} =\left( \begin{array}{rrrr}-2&1&-7&6\\ 1&3&1&-4\\ -5&-5&0&4\\ -9&2&-8&9\end{array} \right)  \in \mathbb{R}^{4\times 4} $</p>

Construir una estructura de este tipo en **Numpy** resulta muy sencillo. Como dijimos previamente, usamos la funci√≥n `np.array()` para la generaci√≥n de este arreglo, definiendo cada una de las filas mediante listas y separ√°ndolas mediante comas. Por lo tanto, para el caso de la matriz $\mathbf{A}$, bastar√° con escribir:

In [4]:
# Definimos la matriz A.
A = np.array([
    [-2, 1, 7, 6],
    [1, 3, 1, -4],
    [-5, -5, 0, 4],
    [-9, 2, -8, 9]
])
print(A) # Imprimimos en pantalla el valor de A.

[[-2  1  7  6]
 [ 1  3  1 -4]
 [-5 -5  0  4]
 [-9  2 -8  9]]


Como vemos, construir matrices con **Numpy** resulta sencillo y, sobretodo, natural, debido principalmente al est√°ndar de imputaci√≥n de los elementos que componen un arreglo conforme la funci√≥n `np.array()`. Las matrices, desde una perspectiva geom√©trica, corresponden a arreglos bidimensionales, en el sentido de que su morfolog√≠a queda completamente determinada por dos par√°metros, que son, correspondientemente, el n√∫mero de filas y columnas que caracterizan al arreglo. Por lo tanto, la matriz `A` que construimos previamente, es un arreglo bidimensional con geometr√≠a o forma `(4, 4)`, debido a que √©sta posee 4 filas y 4 columnas.

**Numpy**, como ya comentamos en un principio, no se limita a vectores y matrices. Tambi√©n es posible construir estructuras m√°s generales, como es el caso de los tensores. Al igual que las matrices, los tensores son objetos algebraicos que describen relaciones lineales entre otros objetos que, a su vez, son elementos de determinados espacios vectoriales. Tales elementos pueden ser vectores, matrices e incluso otros tensores. En t√©rminos geom√©tricos, los tensores suelen representarse en **Numpy** como arreglos tridimensionales, debido a que un tensor puede imaginarse como un conjunto de matrices de la misma dimensi√≥n apiladas unas encimas de las otras. De este modo, los tres par√°metros que definen la geometr√≠a del tensor corresponden al n√∫mero de filas, n√∫mero de columnas y n√∫mero de apilamientos, respectivamente.

Un ejemplo de tensor es el siguiente:

In [5]:
# Definimos el tensor T.
T = np.array([
    [
        [2, -1, -1, 4, -5],
        [0, -3, 3, -2, -7],
        [-1, 1, 6, -9, 1],
        [-8, -8, 1, -1, 6],
    ],
    [
        [5, -5, 1, -1, 3],
        [-4, 9, 8, 1, 0],
        [0, -1, -5, -7, 2],
        [5, -7, -6, -8, 1],
    ],
    [
        [2, -2, 5, 1, 0],
        [3, -3, -4, 1, 0],
        [-2, -8, -1, 0, 5],
        [-8, 1, -5, 0, 6],
    ]
])
print(T) # Imprimimos en pantalla el valor de T.

[[[ 2 -1 -1  4 -5]
  [ 0 -3  3 -2 -7]
  [-1  1  6 -9  1]
  [-8 -8  1 -1  6]]

 [[ 5 -5  1 -1  3]
  [-4  9  8  1  0]
  [ 0 -1 -5 -7  2]
  [ 5 -7 -6 -8  1]]

 [[ 2 -2  5  1  0]
  [ 3 -3 -4  1  0]
  [-2 -8 -1  0  5]
  [-8  1 -5  0  6]]]


Vemos pues que el tensor `T` tiene un total de tres dimensiones morfol√≥gicas (tensor de orden 3). La primera especifica el sub-arreglo de inter√©s; la segunda, la fila de dicho sub-arreglo; y la tercera, la columna de dicho sub-arreglo. Ya ahondaremos m√°s en la selecci√≥n de elementos en un arreglo de **Numpy**. Pero vale la pena mencionar que, bajo esta convenci√≥n, el elemento en la posici√≥n `[2, 1, 2]` del tensor `T` ser√≠a el n√∫mero -4. Considerando que Python siempre cuenta a partir de la posici√≥n 0, vemos que el sub-arreglo en la posici√≥n 2 (el √∫ltimo) tiene, en la posici√≥n `[1, 2]`, al elemento -4. En un lenguaje m√°s algebraico, este tensor podr√≠a especificarse como $\mathbf{T} =\left\{ t_{ijk}\right\}  \in \mathbb{R}^{4\times 5\times 3}$, y el elemento previamente se√±alado ser√≠a $t_{212}=-4$.