# El entorno de trabajo

Este es el entorno de trabajo que vamos a utilizar en las sesiones prácticas de la asignatura, se llama Jupyter y viene incluido en la distribución *Anaconda* de *Python*.

En este entorno podemos combinar 'cajas' de texto en las que explicar ideas y conceptos, y 'cajas' de código en las que definir o evaluar funciones *Python*.

In [1]:
1+2

3

El tipo de caja se controla con el menú desplegable de la derecha en el que podemos escoger 'Code' para cajas de código o 'Markdown' para cajas de texto.

El texto se escribe en formato 'Markdown' con el que podemos fácilmente crear cabeceras, destacar texto, crear listas, incluir imágenes o enlaces a páginas web. Un resumen de las directivas 'Markdown' se puede encontrar fácilmente en internet buscando 'markdown cheat sheet'.

Una vez completado el contenido de una caja, podemos evaluarla con la combinación de teclas Control-Enter (quedándonos en la misma caja que hemos evaluado), Mayusculas-Enter (pasando a la siguiente caja) o Alt-Enter (creando una nueva caja).

También disponemos de las habituales opciones de edición en las cajas (cortar, copiar, pegar) así como otras que nos permiten dividir una caja o unir cajas. En el menú superior tenemos acceso a estas y otras opciones.

En el menú 'Help' disponéis de enlaces a documentación de algunas de las herramientas que usaremos durante el curso, *Python*, *NumPy*, *SciPy*, *Matplotlib*, *Pandas*

## Introducción a NumPy

*NumPy* es una biblioteca para manejo de arrays multidimensionales, cuyas componentes son datos del mismo tipo.

In [2]:
import numpy as np

Para crear un array *NumPy* usamos la función `np.array`, proporcionando los datos como listas de listas, con la misma cantidad de datos.

In [3]:
a = np.array([[1.8,2.3,3.4],
              [2.5,3.2,1.1]])

El atributo `ndim` nos indica el número de dimensiones del array y el atributo `shape` el número de datos que hay en cada dimensión

In [4]:
a.ndim

2

In [5]:
a.shape

(2, 3)

Para obtener un dato debemos indicar su posición (contada desde 0) como una secuencia de valores que indican la componente en la que se encuentra

In [6]:
a[1,1]

3.2

Los datos de un array se pueden reorganizar cambiando las dimensiones con el método (no destructivo) `np.reshape`

In [7]:
a.reshape(3,2)

array([[1.8, 2.3],
       [3.4, 2.5],
       [3.2, 1.1]])

In [8]:
a

array([[1.8, 2.3, 3.4],
       [2.5, 3.2, 1.1]])

In [9]:
np.random.random((3,4))

array([[0.0573417 , 0.52846619, 0.63518243, 0.92832322],
       [0.42225506, 0.44115999, 0.87072423, 0.9153737 ],
       [0.98880338, 0.18209531, 0.92645333, 0.90130236]])

In [10]:
np.arange(1,12,2).reshape(2,3)

array([[ 1,  3,  5],
       [ 7,  9, 11]])

### Operaciones con arrays

In [11]:
A = np.array([[1,2,3],[4,5,6]])
B = np.random.random((2,3))

In [12]:
A

array([[1, 2, 3],
       [4, 5, 6]])

In [13]:
B

array([[0.50644243, 0.17872725, 0.13250284],
       [0.25104472, 0.76106406, 0.02619418]])

In [14]:
A *= 3

In [15]:
A

array([[ 3,  6,  9],
       [12, 15, 18]])

In [16]:
A+B

array([[ 3.50644243,  6.17872725,  9.13250284],
       [12.25104472, 15.76106406, 18.02619418]])

In [17]:
A*B

array([[ 1.51932728,  1.07236347,  1.19252558],
       [ 3.0125367 , 11.41596088,  0.47149529]])

In [18]:
A.min()

3

In [19]:
B.max()

0.7610640584175777

In [20]:
B>0.5

array([[ True, False, False],
       [False,  True, False]])

In [21]:
B.T

array([[0.50644243, 0.25104472],
       [0.17872725, 0.76106406],
       [0.13250284, 0.02619418]])

In [22]:
np.dot(A,B.T)

array([[ 3.78421634,  5.55526617],
       [11.14326897, 14.89999286]])

### Indexado y slicing

In [23]:
C = np.arange(15).reshape((3,5))

In [24]:
C

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [25]:
C[:,:3:2]

array([[ 0,  2],
       [ 5,  7],
       [10, 12]])

In [26]:
C[-1]

array([10, 11, 12, 13, 14])

In [27]:
C[:-1]

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [28]:
C[:,2]

array([ 2,  7, 12])

### Indexación con arrays

In [29]:
D = np.arange(15)**2

In [30]:
D

array([  0,   1,   4,   9,  16,  25,  36,  49,  64,  81, 100, 121, 144,
       169, 196])

In [31]:
i = np.array([2,3,0,6])

In [32]:
D[i]

array([ 4,  9,  0, 36])

In [33]:
j = np.array([[6,1,9],[4,2,4],[3,7,1]])

In [34]:
D[j]

array([[36,  1, 81],
       [16,  4, 16],
       [ 9, 49,  1]])

### Indexación booleana

In [35]:
E = np.random.random((2,4))

In [36]:
E

array([[0.03969035, 0.1539079 , 0.42007447, 0.20577842],
       [0.18875271, 0.01169445, 0.13218457, 0.73642842]])

In [37]:
I = E>0.5

In [38]:
I

array([[False, False, False, False],
       [False, False, False,  True]])

In [39]:
E[I]

array([0.73642842])

In [40]:
E[I] = 0

In [41]:
E

array([[0.03969035, 0.1539079 , 0.42007447, 0.20577842],
       [0.18875271, 0.01169445, 0.13218457, 0.        ]])

In [42]:
E[E!=0]

array([0.03969035, 0.1539079 , 0.42007447, 0.20577842, 0.18875271,
       0.01169445, 0.13218457])

## Ejercicios

Generar una matrix aleatoria 3x4 y normalizar sus componentes (escalándolos) de manera que el menor sea 0 y el mayor 1.

In [97]:
a = np.random.rand(3,4)
print("Random matrix:")
print(a)
max, min = a.max(), a.min() # Get max and min
x = (a - min)/(max - min) # Normalize
print("Normalize matrix:")
x

Random matrix:
[[0.03505365 0.4582442  0.45840792 0.93989039]
 [0.59124327 0.10302491 0.22922099 0.7291379 ]
 [0.01239908 0.7736833  0.01093643 0.68365398]]
Normalize matrix:


array([[0.0259617 , 0.48151769, 0.48169393, 1.        ],
       [0.62468849, 0.09913137, 0.23497888, 0.77312924],
       [0.00157452, 0.82108146, 0.        , 0.72416672]])

En una matriz 20x20, obtener la matriz que se obtiene al extraer las
filas de índice par y las columnas de índice impar 

In [98]:
a = np.random.rand(20,20)
x = a[0::2,1::2]
x

array([[0.90915122, 0.64790041, 0.18938694, 0.15994933, 0.20042849,
        0.4060368 , 0.45322595, 0.15431569, 0.89154677, 0.94724282],
       [0.16823947, 0.75030473, 0.680812  , 0.69103928, 0.53587902,
        0.45872693, 0.92223194, 0.95875407, 0.67665323, 0.67064988],
       [0.17295041, 0.22826745, 0.72292097, 0.27262845, 0.46546949,
        0.60386314, 0.60126385, 0.56248185, 0.74048276, 0.43068327],
       [0.06994471, 0.30569888, 0.48348612, 0.00291829, 0.63542189,
        0.13546853, 0.33872428, 0.51178522, 0.32747148, 0.74077859],
       [0.397041  , 0.39700112, 0.99539965, 0.22491897, 0.84239928,
        0.86572496, 0.34030943, 0.79353506, 0.17273597, 0.59431376],
       [0.48705568, 0.39099263, 0.94751004, 0.84998972, 0.51148916,
        0.69861937, 0.35699266, 0.92779978, 0.73203871, 0.30561273],
       [0.39857969, 0.11354872, 0.43916986, 0.85931043, 0.55659834,
        0.03281785, 0.49011864, 0.99973974, 0.93198375, 0.62105181],
       [0.25892922, 0.67758162, 0.6292930

Dada una matriz A de tamaño 20x10 y otra B de tamaño 20x1 con valores entre
0 y 100, devolver una matriz conteniendo las filas de A que corresponden a las
posiciones de B que son mayores de 50 

In [99]:
A = np.random.randint(100, size=(20, 10))
B = np.random.randint(100, size=(20, 1))
X = np.array([A[i] for i in range(A.shape[0]) if B[i] > 50])
X

array([[73,  0, 15, 60, 44, 89, 78, 29, 93, 71],
       [87, 58, 94, 79, 66,  8, 90, 10, 65, 61],
       [25, 30, 59, 40, 93, 32, 81, 92, 92, 98],
       [57, 61, 69, 85, 12, 82,  0, 76, 28, 88],
       [51, 42, 31, 99, 47, 15, 94, 79, 75, 57],
       [70, 79,  8,  5, 59, 76, 94, 17, 48, 82],
       [96,  7,  7, 33, 77, 92, 35, 29, 91, 10],
       [70, 85, 86, 63, 98, 99, 54,  1, 50, 83],
       [61, 75, 99, 84, 39,  7, 58, 91, 10, 89],
       [ 4,  7, 13, 25, 19, 50, 84, 29, 25, 49],
       [65, 92, 82, 36, 89, 43, 13, 64, 84, 90]])

Otra forma de implementarse el ejercicio anterior es:

In [132]:
A = np.random.randint(100, size=(20, 10))
B = np.random.randint(100, size=(20, 1))
mask = B[:,0] > 50
A[mask,: ]

array([[ 3, 62, 87, 72, 88, 14, 63, 58, 86, 50],
       [96, 88,  4, 98, 38, 89,  6, 99, 90, 34],
       [12, 55, 49, 66, 87, 51, 30, 84, 53, 99],
       [66, 45, 52, 28, 54, 89, 81, 19, 72, 43],
       [ 5, 59, 87,  6,  3, 15, 51,  5, 98, 44],
       [34, 86, 60, 68, 40, 63, 56, 34, 12, 75],
       [57, 47, 43, 80, 44, 68, 40, 31, 98, 30],
       [76, 79, 38, 25, 14, 63, 54, 52, 25, 40],
       [31, 62, 40, 26, 64, 41, 65, 78,  8, 85],
       [50, 80, 45, 44, 28, 24, 65, 27, 35, 23]])