# **Python para Ciencia de Datos: Numpy**

___

**Saúl Arciniega Esparza** | Ph.D. Profesor Asociado C Tiempo Completo

* [Twitter](https://twitter.com/zaul_arciniega) | [LinkedIn](https://www.linkedin.com/in/saularciniegaesparza/) | [ResearchGate](https://www.researchgate.net/profile/Saul-Arciniega-Esparza)
* [Hydrogeology Group](https://www.ingenieria.unam.mx/hydrogeology/), [Facultad de Ingeniería de la UNAM](https://www.ingenieria.unam.mx/)
___

### **Contenido**

0. [Librería numpy](#Librería-numpy)
1. [Creando arrays](#1.-Creando-arrays)
    1. [Dimensiones y forma de un array](#1.1-Dimensiones-y-forma-de-un-array)
    2. [Arreglos de más de dos dimensiones](#1.2-Arreglos-de-más-de-dos-dimensiones)
    3. [Diferencias entre una lista y un array](#1.3-Diferencias-entre-una-lista-y-un-array)
2. [Métodos de numpy](#2.-Métodos-de-numpy)
3. [Operaciones algebráicas con arrays](#3.-Operaciones-algebráicas-con-arrays)
4. [Índices de arrays](#4.-Indices-de-arrays)
    1. [Índices de arrays de 1 dimensión](#4.1-Indices-de-arrays-de-1-dimension)
    2. [Índices de arrays de 2 dimensiones](#4.2-Indices-de-arrays-de-2-dimensiones)
    3. [Índices de arrays multi-dimensiones](#4.3-Indice-de-arrays-de-más-de-dos-dimensiones)
    4. [Llamando elementos con el método **take**](#4.4-Llamando-elementos-con-el-método-take())
    5. [Reemplazar valores en un array](#4.5-Reemplazar-valores-en-un-array)
5. [Manipulando forma de arrays](#5.-Manipulando-forma-de-arrays)
    1. [Agregando renglones a un array](#5.1-Agregando-renglones-a-un-array)
    2. [Agregando columnas a un array](#5.2-Agregando-columnas-a-un-array)
    3. [Eliminar renglones y columnas de un array](#5.3-Eliminar-renglones-y-columnas-de-un-array)
6. [Crear arrays usando métodos de numpy](#6.-Crear-arrays-usando-métodos-de-numpy)
    1. [Crear matrices de coordenadas](#6.1-Crear-matrices-de-coordenadas)
7. [Estadísticos con numpy](#7.-Estadísticos)
8. [Crear funciones](#8.-Crear-funciones)
9. [Estructuras de control](#9.-Estructuras-de-contol)
    1. [Condicionales](#9.1-Condicionales)
    2. [Condicionales múltiples](#9.2-Condicionales-múltiples)
    3. [Ciclo **For**](#9.3-Ciclo-For)

___
# Librería numpy

[Ir a inicio](#Contenido)

[NumPy](https://numpy.org/) es una librería que agrega un mayor soporte para vectores y matrices en Python (similar a Matlab), constituyendo una biblioteca de funciones matemáticas de alto nivel.

Para trabajar con numpy primero tenemos que importarlo:

In [None]:
import numpy as np

___
## 1. Creando arrays

[Ir a inicio](#Contenido)

Numpy tiene un tipo de objeto propio llamado **array** (aunque también tiene otro objeto llamado **matrix**), que se maneja similar a las listas, pero mucho más potente para análisis numérico.
Para crear un array simplemente usamos:

In [None]:
lista = [1, 2, 4]        # lista
array = np.array(lista)  # convertir lista a array

print(lista)
print(array)

In [None]:
lista

Podemos verificar el tipo de objeto:

In [None]:
print(type(lista))
print(type(array))

Adicionalmente podemos ver el tipo de variable que almacena el array:

In [None]:
print(array.dtype)
print(type(array[0]))  # extraer el primer elemento

como podemos observar, np.array() asignó por defecto un elemento entero de 32 bits que no existe originalmente en python. Para definir un tipo de dato especifico podemos ingresar un argumento adicional:

In [None]:
array1 = np.array(lista, dtype=int)         # definir un array de enteros
array2 = np.array(lista, dtype=float)       # definir un array de flotantes
array3 = np.array(lista, dtype=np.int16)    # definir un array de enteros de 16 bits
array4 = np.array(lista, dtype=np.int32)    # definir un array de enteros de 32 bits
array5 = np.array(lista, dtype=np.float16)  # definir un array de flotantes de 16 bits
array6 = np.array(lista, dtype=np.float32)  # definir un array de flotantes de 32 bits
array7 = np.array(lista, dtype=np.float64)  # definir un array de flotantes de 64 bits

print('Imprimir tipo de datos')
print(array1.dtype)
print(array2.dtype)
print(array3.dtype)
print(array4.dtype)
print(array5.dtype)
print(array6.dtype)
print(array7.dtype)

print('Imprimir tipo de primer elemento')
print(type(array1[0]))
print(type(array2[0]))
print(type(array3[0]))
print(type(array4[0]))
print(type(array5[0]))
print(type(array6[0]))
print(type(array7[0]))

### 1.1 Dimensiones y forma de un array
Los arrays tienen dos propiedades que nos permiten conocer las dimensiones y el numero de renglones y columnas (en el caso de un array de 2 dimensiones):

In [None]:
np.array([1, 2, 3, 4], dtype=float).shape

In [None]:
# vector renglon de 1 dimension
array1 = np.array([1, 2, 3, 4], dtype=float)
# vector renglon de 2 dimensiones
array2 = np.array([[1, 2, 3, 4]], dtype=float)
# vector columna de 2 dimensiones
array3 = np.array([[1], [2], [3], [4]], dtype=float)
# matriz de 2x2 de 2 dimensiones
array4 = np.array([[1, 2], [3, 4]], dtype=float)
# matriz de 3x2 de 2 dimensiones
array5 = np.array([[1, 2], [3, 4], [5, 6]], dtype=float)

print('array1')
print(array1)
print('array2')
print(array2)
print('array3')
print(array3)
print('array4')
print(array4)
print('array5')
print(array5)

In [None]:
# Para ver las dimensiones y la forma de cada array
print('array1  dimensiones:', array1.ndim, ' forma:', array1.shape)
print('array2  dimensiones:', array2.ndim, ' forma:', array2.shape)
print('array3  dimensiones:', array3.ndim, ' forma:', array3.shape)
print('array4  dimensiones:', array4.ndim, ' forma:', array4.shape)
print('array5  dimensiones:', array5.ndim, ' forma:', array5.shape)

### 1.2 Arreglos de más de dos dimensiones
En la mayoría de los casos se analizarán arreglos de 1 o 2 dimensiones, sin embargo para propósitos de percepción remota es común que se tengan 3 o hasta 4 dimensiones que representan el tiempo y alguna capa (suelo, atmosfera, etc).

In [None]:
# Para definir un arreglo de 3 dimensiones supongamos que tenemos
# las siguientes listas
l1 = [[1, 2], [3, 4]]
l2 = [[5, 6], [7, 8]]
l3 = [[9, 10], [11, 12]]
l4 = [[13, 14], [15, 16]]

# ahora transformemos matirces de distintas dimensiones
array1 = np.array(l1)            # matrix de 2x2 de 2 dimensiones
array2 = np.array([l1, l2])      # matrix de 2x2x2 de 3 dimensiones
array3 = np.array([l1, l2, l3])  # matrix de 3x2x2 de 3 dimensiones
array4 = np.array([[l1, l2], [l3, l4]])  # matrix de 2x2x2x2 de 4 dimensiones

print('Imprimir matrices')
print('Matriz de 2x2')
print(array1)
print('Matriz de 2x2x2')
print(array2)
print('Matriz de 3x2x2')
print(array3)
print('Matriz de 2x2x2x2')
print(array4)

print('Imprimir dimensiones')
print('array1  dimensiones:', array1.ndim, ' forma:', array1.shape)
print('array2  dimensiones:', array2.ndim, ' forma:', array2.shape)
print('array3  dimensiones:', array3.ndim, ' forma:', array3.shape)
print('array4  dimensiones:', array4.ndim, ' forma:', array4.shape)

### 1.3 Diferencias entre una lista y un array
La diferencia principal entre los array de numpy y las listas, es que los arrays nos permite realizar operaciones algebráicas directamente, mientas que con las listas tendrámos que utilizar comprension de listas o la función map.

In [None]:
lista = [1, 2, 3, 4]
array = np.array(lista)

# multiplicar cada elemento por 3
print([x * 3 for x in lista])        # lista metodo 1
print(list(map(lambda x: x * 3, lista)))  # lista metodo 2
# lista metodo 3
resultado = []
for x in lista:
    resultado.append(x * 3)
print(resultado)

# Ahora con un array
print(array * 3)

# LOS ARRAYS NOS PERMITEN REALIZAR OPERACIONES DIRECTAMENTE!

___
## 2. Métodos de numpy

[Ir a inicio](#Contenido)

[**Numpy**](https://numpy.org/) tiene una enorme cantidad de funciones estadísticas, algebráicas, manipulación y creación, entre otras. No se pueden abarcar todas ellas, pero la aplicación de alguas de ellas se muestra a continuación:

Para la explicación supóngase que se ha definido un array

```python
a = np.random.rand(3, 4)
```

| Método | Descripción |
| :-: | :- |
| a.shape | Devuelve una tupla con el numero de elementos por dimension|
| a.ndim | Devuelve el numero de dimensiones del array |
| a.size | Devuelve el numero de elementos en todo el array |
| a.T | Devuelve la transpuesta del array |
| a.transpose() | Devuelve la transpuesta del array pero permite indicar la dimension sobre la cual transponer los datos|
| a.argmax() | Devuelve el índice del elemento con el valor máximo en el array |
| a.argmin() | Devuelve el índice del elemento con el valor mínimo del array |
| a.argsort() | Devuelve los índices de los elementos ordenados de menor a mayor |
| a.astype() | Realiza una copia profunda del array a permitiendo cambiar el tipo de los datos |
| a.copy() | Realiza una copia profunda del array |
| a.cumprod() | Realiza el producto acumulado |
| a.cumsum() | Realiza la suma acumulada |
| a.diagonal() | Obtiene la diagonal principal (por defecto, pero se puede cambiar) |
| a.dot() | Obtiene el producto punto con respecto otro array |
| a.flatten() | Convierte el array a un array de una sola dimension |
| a.sum() | Obtiene la suma del array |
| a.max() | Obtiene el valor máximo |
| a.min() | Obtiene el valor mínimo |
| a.mean() | Obtiene el promedio |
| a.var() | Obtiene la varianza |
| a.std() | Obtiene la desviación estándar |
| a.nonzero() | Devuelve un array de booleanos con verdadero para todos aquellos valores diferentes a 0 |
| a.reshape() | Cambia la forma de una array |
| a.round() | Redondea los elementos del array a un número específico de decimales |
| a.take() | Obtiene un valor del array ingresando el índice del elemento |
| np.abs(a) | Calcula valor absoluto de los elementos de a |
| np.array(a) | construye un array a partir de una lista o una tupla |
| np.nan | Objeto propio de numpy que define un No Numero y se utiliza para indicar elementos sin datos |
| np.polyfit() | Genera un ajuste con regresión lineal |
| np.gemfromtxt() | Leer un archivo delimitado como un array |
| np.savetxt() | Escribe un archivo delimitado con datos de un array |
| np.vstack() | Agrega renglones a un array |
| np.hstack() | Agregar columnas a un array |
| np.where() | Regresa los renglones y columnas de boolenos verdaderos de un array o lista |
| np.isnan() | Regresa un array de booleanos con True para aquellos valores np.nan |
| np.delete() | Elimina un renglon o columna de un array |
| np.arange() | Similar a **range**, se utiliza para generar vectores con valores crecientes o decrecientes |
| np.meshgrid() | Regresa matrices de coordenadas a partir de arrays de coordenadas |
| np.linspace() | Crea un array con valores que van de un valor inicial a uno final, pero en lugar de indicar el elemento se ingresa el número de vértices |

In [None]:
# Para mostrar la aplicación de algunas funciones tenemos deinido
# el array
a = np.random.rand(3, 4)

print(a.max())     # obtener el maximo
print(a.round(2))  # redondear a 2 decimales
print(np.log(a))   # logaritmo natural

___
## 3. Operaciones algebráicas con arrays

[Ir a inicio](#Contenido)

In [None]:
# Si tenemos definidas dos arrays
array1 = np.array([2, 4, 6, 8], dtype=float)
array2 = np.array([5, 6, 0.5, 1], dtype=float)

# Ahora veamos varias operaciones algebaricas
# obviamente para que funcionen array1 y array2 deben de tener la misma forma (shape)
print(array1 + array2)   # suma 
print(array1 - array2)   # resta
print(array1 * array2)   # multiplicacion
print(array1 ** array2)  # potencia
print(array1 / array2)   # division
print(array1 + 3.0)      # suma de una constante  
print(array1 - 3.0)      # resta de una constante
print(array1 * 3.0)      # multiplicacion por unaconstante
print(array1 ** 3.0)     # potencia con una constante
print(array1 / 3.0)      # division por una constante

Se debe de tener cuidao con divisiones con numeros enteros en Python 2.7, por lo que para análisis numérico conviene siempre usar arrays con tipo de datos flotante:

In [None]:
# por ejemplo definamos el array
array1 = np.array([1, 2, 3, 4])  # por defecto los define como enteros

print(array1 / 5)   # division por una constante

print(array1 / 5.0)  # al usar la constante como flotante soluciona nuestro problema

# pero la mayoría del tiempo es mejor usar el array con números flotantes
# para convertir un array de un tipo de datos a otro podemos usar .astype()
array2 = array1.astype(float)  # copia profunda del array1 pero como flotantes

print(array2 / 5)

___
## 4. Indices de arrays

[Ir a inicio](#Contenido)

Para llamar elementos de un array se utiliza una sintaxis similar a la de una lista:

In [None]:
# Supongamos que tenemos definidas las siguientes variables
lista1 = [1, 2, 3, 4]
lista2 = [[1, 3], [4, 6], [5, 9]]

# ahora pasemos las listas a arrays
array1 = np.array(lista1)  # 1 dimension
array2 = np.array(lista2)  # 2 dimensiones
array3 = np.array([array2, array2 / 2.0])  # 3 dimensiones
array4 = np.array([[array2, array2 / 2.0], [array2 / 3.0, array2 / 4.0]])  # 4 dimensiones

print('Arrays definidos')
print(array1)
print(array2)
print(array3)
print(array4)

### 4.1 Indices de arrays de 1 dimension
Este es el caso más sencillo y funcionan igual que con una lista:

In [None]:
print('Ejemplo con lista')
print(lista1[0])  # primer valor
print(lista1[1])  # segundo valor
print(lista1[-1])  # ultimo valor
print(lista1[1:3]) # segundo a tercer valor

print('Ejemplo con array')
print(array1[0])  # primer valor
print(array1[1])  # segundo valor
print(array1[-1])  # ultimo valor
print(array1[1:3]) # segundo a tercer valor

# Una caracteristica interesante de los arrays es que podemos insertar una lista o un array de enteros
# para llamas varios valores, cosa que no se puede en las listas
print(array1[[1, 2]])  # segundo y tercer elemento
print(array1[[0, -1]])  # primer y ultimo elemento
print(array1[[0, 0, 0]])  # incluso podemos llamar al mismo elemento varias veces

print(array1[np.array([0, -1], dtype=int)])  # podemos usar arrays con enteros como indices

### 4.2 Indices de arrays de 2 dimensiones
Cuando tenemos dos dimensiones y queremos llamar un conjunto de elementos en un array debemos considerar que ahora tenemos que hacer referencia tanto al renglon como a la columna:

In [None]:
# Primero veamos como funciona en un lista
print('Listas')
print(lista2[0])  # asi llamamos al primer renglon
print(lista2[1])  # asi llamamos al segundo renglon
print(lista2[0][0]) # asi llamamos al primer elemento del segundo renglon
print(lista2[1][0]) # primer elemento del segundo renglon

# Ahora veamos con el array
print('Arrays')
print(array2[0])  # primer renglon
print(array2[1])  # segundo renglon
# Adicionalmente en los arrays podemos usar dos puntos (:) para seleccionar ya sea todo el renglon o la columna
print(array2[0, :])  # primer renglon
print(array2[1, :])  # segundo renglon
print(array2[:, 0])  # primera columna
print(array2[:, 1])  # segunda columna

# NOTA: cuando se llama un renglon o una columna se debe de tener en cuenta que el resultado es un
# array de 1 dimension!

# Ahora pasemos a extraer un elemento en especifico
print('Elementos en arrays')
print(array2[0][0]) # primer elemento del segundo renglon
print(array2[1][0]) # primer elemento del segundo renglon
# o de manera alternativa
print(array2[0, 0]) # primer elemento del segundo renglon
print(array2[1, 0]) # primer elemento del segundo renglon

### 4.3 Indice de arrays de más de dos dimensiones
Para entender cómo llamar elementos en arrays multidimensionales se debe tener claro cómo están estructurados, por ejemplo, un array de 3 dimensiones se estructura como **matriz**x**renglon**x**columna**

In [None]:
# Probemos el array de 3 dimensiones
print('array3[0]')
print(array3[0])  # vemos que llamamos a la primer matriz que ingresamos
print('array3[1]')
print(array3[1])  # segunda matriz

In [None]:
# Ahora que sucede si incrementamos otra dimension
print('array3[0, 0]')
print(array3[0, 0])  # primer renglon de la primer matriz
print('array3[1, 2]')
print(array3[1, 2])  # tercer renglon de la segunda matriz

# lo anterior se puede escribir de igual manera como
print('array3[0, 0, :]')
print(array3[0, 0, :])  # primer renglon de la primer matriz
print('array3[1, 2, :]')
print(array3[1, 2, :])  # tercer renglon de la segunda matriz

In [None]:
# Que pasa si queremos llamar a toda una columna? en este caso tenemos que usar :
print('array3[0, :, 0]')
print(array3[0, :, 0])  # primer columna de primer matriz
print('array3[1, :, 1]')
print(array3[1, :, 1])  # segunda columna de primer matriz

In [None]:
# Ahora para llamar a un elemento en especifico debemos considerar la sintaxis
# array[matriz, renglon, columna]
print(array3)
print('array3[0, 0, 0]')
print(array3[0, 0, 0])  # primer elemento de la primer matriz
print('array3[0, 1, 0]')
print(array3[0, 1, 0])  # primer matriz, segundo renglon, primer columna
print('array3[1, 2, 1]')
print(array3[1, 2, 1])  # segunda matriz, tercer renglon, segunda columna

In [None]:
# Para el caso de array de 4 dimensiones simplemente se extiende el numero de indices a ingresar,
# recordando que los dos ultimos corresponden al renglon y a la columna
# la sintaxis es array[matriz_renglon, matriz_columna, renglon, columna]
print(array4)
print('array4[0, 0, 0, 0]')
print(array4[0, 0, 0, 0])  # primer elemento de la matriz del primer renglon de la primer columna
print('array4[:, 0, :, :]')
print(array4[:, 0, :, :])  # con esto extraemos todas las matrices de la primer columna

### 4.4 Llamando elementos con el método take()
Python reproduce una propiedad de las matrices de Matlab mediante el uso del indice del elemento y no el renglón y columna

In [None]:
# definamos un array como
d = np.array([[0, 1, 2], [3, 4, 5]])

print(d.take(0))  # equivale a d[0, 0]
print(d.take(1))  # equivale a d[0, 1]
print(d.take(2))  # equivale a d[1, 0]
print(d.take(3))  # equivale a d[1, 1]

print(d.take([0, 2, 1])) # tambien se puede usar una lista o un array
# para llamar varios elementos

### 4.5 Reemplazar valores en un array

In [None]:
d = np.random.rand(4, 5)

print(d)

d[0, 0] = 2  # reemplazar primer elemento
print('\n')
print(d)

d[0, :] = 2  # reemplazar todos los valores del primer reenglon
print('\n')
print(d)

d[:, [0, 1]] = 1  # reemplazar la primer y segunda columa
print('\n')
print(d)

d[0, :] = [1, 2, 3, 4, 5]  # reemplazar los valores del primer renglon
print('\n')
print(d)

d[:, 3] = [1, 2, 3, 4]  # reemplazar los valores del cuarto renglon
print('\n')
print(d)

d[1:3, 0:2] = [[10, 20], [30, 40]]  # reemplazar los valores del primer renglon
print('\n')
print(d)

___
## 5. Manipulando forma de arrays

[Ir a Inicio](#Contenido)

Para ciertos casos es necesario cambiar las dimensiones o la forma de un array para poder aplicar alguna operación algebráica o para aplicar algún método. Numpy permite cambiar la forma y el numero de dimensiones de un array con varios comandos: **reshape**, **flatten**, **transpose**.

In [None]:
# Si se tiene definido el siguiente la siguiente lista
lista = range(1, 21)  # lista de 1 a 20

array = np.array(lista)  # convertir a array de 1 dimension
print(len(array))  # numero de elementos del array

print('Uso de reshape')
print('array de 1x20')
print(array.reshape((1, 20)))
print('array de 20x1')
print(array.reshape((20, 1)))
print('array de 2x10')
print(array.reshape((2, 10)))
print('array de 4x5')
print(array.reshape((4, 5)))
print('array de 2x5x2')
print(array.reshape((2, 5, 2)))

### 5.1 Agregando renglones a un array

In [None]:
# si se tiene definidas 3 arrays de 1 dimension
d1 = np.random.rand(4)
d2 = np.random.rand(4)
d3 = np.random.rand(4)

print('Arrays originales')
print(d1)
print(d2)
print(d3)

# concatenando arrays
d = np.vstack((d1, d2))  # agrega a d2 debajo de d1
print('d1 + d2')
print(d)
d = np.vstack((d, d3))  # agrega a d3 debajo de d
print('d + d3')
print(d)

### 5.2 Agregando columnas a un array
Este caso es un poco más complicado porque se debe de tener un vector columna para poder concatenar una columna con un array

In [None]:
# si se tiene definidas 3 arrays de 1 dimension
d1 = np.random.rand(4)
d2 = np.random.rand(4)
d3 = np.random.rand(4)

print('Arrays originales')
print(d1)
print(d2)
print(d3)

# concatenando arrays
n = d1.size  # numero de elementos
d = np.hstack((d1.reshape((n, 1)), d2.reshape((n, 1))))  # agrega a d2
# debajo de d1
print('d1 + d2')
print(d)
d = np.hstack((d, d3.reshape((n, 1))))  # agrega a d3 debajo de d
print('d + d3')
print(d)

# Cuando se tienen dos arrays con el mismo numero de renglones
# se pueden concatenar directamente
d4 = np.random.rand(4, 2)
d = np.hstack((d, d4))
print('d + d4')
print(d)

### 5.3 Eliminar renglones y columnas de un array

In [None]:
# Si se tiene definido un array
d = np.random.rand(5, 4)
print('Original')
print(d)

# Eliminar un renglon
print('\n')
print(np.delete(d, 0, axis=0))  # eliminar primer renglon
print('\n')
print(np.delete(d, 0, axis=1))  # eliminar primer columna
print('\n')
print(np.delete(d, [0, 3], axis=1))  # eliminar primer y cuarta columna


___
## 6. Crear arrays usando métodos de numpy

[Ir a Inicio](#Contenido)

Frecuentemente es necesario crear arrays con ciertos valores, ya sea para probar algún código o para almacenar resultados en la variable, para ello numpy cuenta con funciones que nos permiten crear arrays definiendo únicamente la forma del array:

In [None]:
print(np.zeros((3, 2), dtype=float))  # crea un array de 3x2 de ceros (flotantes)
print(np.ones((2, 2), dtype=int))     # crea un array de 2x2 de unos (enteros)
print(np.full((2, 3, 2), 2.0))        # crea un array de 2x3x2 relleno de 2 flotantes
print(np.eye(3))                      # crea un array de 3x3 cuya diagonal principal contiene 1
print(np.random.rand(2, 3))           # crea un array de 2x3 relleno de numeros aletorios de 0 a 1
print(np.random.rand(4))              # crea un array de 1 dimension con 4 numeros aletorios de 0 a 1
print(np.random.rand(2, 3, 4))        # crea un array de 2x3x4 relleno de numeros aletorios de 0 a 1

In [None]:
# Adicionalmente existen algunos métodos que nos permiten crear arrays con las mismas dimensiones que
# un array existente
array1 = np.random.rand(3, 4)  # array de 3x4 de numeros aleatorios

array2 = np.zeros_like(array1)     # copia las dimensiones de array1 para crear un array de 0
array3 = np.ones_like(array1)      # copia las dimensiones de array1 para crear un array de 1
array4 = np.full_like(array1, 3.)  # copia las dimensiones de array1 para crear un array de 3.0

print(array1)
print(array2)
print(array3)
print(array4)

In [None]:
# Para generar arrays con valores con un incremento/decremento constante
# podemos usar el comando np.arange de forma similar a range
inicio = 1
final = 10
incremento = 0.5
array1 = np.arange(inicio, final + incremento, incremento)
array1

In [None]:
# una de las ventajas de np.arange sobre range es que podemos utilizar
# incrementos negativos
array = np.arange(10, 1 - 0.5, -0.5)
array

In [None]:
# se debe de tener en cuenta que la mayoría de las funciones de numpy tienen
# el parametro dtype para seleccionar el tipo de datos
d1 = np.arange(1, 30, 3, dtype=int)
d2 = np.arange(1, 30, 3, dtype=float)

print(d1)
print(d2)

In [None]:
# la forma mas simple de usar np.arange es indicando unicamente el
# valor final y por defecto inicia en cero con un incremento de 1
np.arange(11)

### 6.1 Crear matrices de coordenadas
Uno de los comandos más útiles para crear arreglos de coordenadas es meshgrid:

In [None]:
# Si se tienen definidos dos arreglos, uno de longitudes y otro de latitudes
lon = np.linspace(-99, -101, 5)  # array que va de -101 a -99 con 20 vertices
lat = np.linspace(24, 26, 10)  # array que va de 25 a 26 con 30 vertices

X, Y = np.meshgrid(lat, lon)
print(X.round(3))
print('\n')
print(Y.round(3))

___
## 7. Estadísticos

[Ir a Inicio](#Contenido)

Para la estimación de los estadísticos de un array se deben de contemplar varios puntos:
 - **Dimension sobre la cual se ejecutan las operaciones**. En este caso es necesario utilizar el parametro opcional **axis**.

In [None]:
# Suponiendo que se tiene definido un array de 2 dimensiones
array = np.random.rand(10, 4)
print(array)

# que sucede si se ejecuta un comando estadistico sin ningun parametro adicional
print('Promedio')
print(array.mean())  # o tambien se puede usar np.mean()
# en el caso anterior se obtuvo el promedio de TODO el array

# para obtener el estadistico ya sea por renglones o columnas se debe de utilizar el parametro adicional axis
print('Promedio por columnas')
print(array.mean(axis=0)) # calcula el promedio por columnas
print('Promedio por renglones')
print(array.mean(axis=1)) # calcula el promedio por renglones

In [None]:
# El caso anterior aplica para el resto de los metodos estadisticos
print('Suma por columnas')
print(array.sum(axis=0))
print('Maximo por renglones')
print(array.max(axis=1))
print('Suma acumulada por renglones')
print(array.cumsum(axis=1))
print('Suma acumulada por columnas')
print(array.cumsum(axis=0))

In [None]:
# Que pasa ahora si tenemos un arary de 3 dimensiones
array = np.random.rand(3, 2, 4)  # array de 3x2x4
print(array)

# ahora el estadistico de todos los elementos
print('Promedio general')
print(array.mean())
print('Promedio por matriz')
print(array.mean(axis=0))  # promedio de cada elemento en todas los arrays
print('Promedio por columna')
print(array.mean(axis=1))  # promedio por columna en cada matriz
print('Promedio por renglon')
print(array.mean(axis=2))  # promedio por renglon en cada matriz

# Si queremos operar unicamente en una matriz la llamamos con su correspondiente indice
print('Promedio matriz 0')
print(array[0].mean(axis=0))

- **Presencia de nans**. Para ese caso es necesario hacer uso de funciones espaciales que ignoran la ocurrencia de nans.

In [None]:
# Supongamos que tenemos un array dado por
array = np.random.rand(4, 5)
array[[1, 2 , 3], [0, 3, 2]] = np.nan
print(array)

# Ahora tratemos de obtener el promedio del array
print('Promedio por columna')
print(array.mean(axis=0))

Como se observó en el ejemplo, cuando hay presencia de nans, los estadísticos estimados se toman como nans. Para evitarlo, se requieren funciones especiales de numpy, como: np.nanmean(), np.nanmin(), np.nanmax, etc. La mayoría de los estadísticos tienen alguna variante con nan que ayuda a prevenir los problemas:

In [None]:
# Supongamos que tenemos un array dado por
array = np.random.rand(4, 5)
array[[1, 2 , 3], [0, 3, 2]] = np.nan
print(array)

# Ahora tratemos de obtener el promedio del array
print('Promedio por columna')
print(np.nanmean(array, axis=0))
print('Maximo por columna')
print(np.nanmax(array, axis=0))
print('Desviacion estandar por columna')
print(np.nanstd(array, axis=0))

___
## 8. Crear funciones

[Ir a Inicio](#Contenido)

Cuando se crean funciones para que trabajen con arrays es necesario considerar que se verifique el tipo de objeto que se ingresa a la función y convertir a arrays en caso de no ser de ese tipo, por ejemplo:

In [None]:
def suma(x, y):
    # covertir objetos a arrays numpy
    if not isinstance(x, np.ndarray):
        x = np.array(x)
    if not isinstance(y, np.ndarray):
        y = np.array(y)
    return x + y

# Evaluar funcion
suma([1, 4, 5], [-2, 3, 2])

___
## 9. Estructuras de contol

[Ir a Inicio](#Contenido)

In [None]:
# Si tenemos definida un array
array = np.random.rand(4, 3)

# Ahora aplicamos una condicion
cond = array > 0.5

cond

Vemos en el ejemplo anterior que cuando se aplica una condición a un array obtenemos una array de booleanos. Este tipo de arrays es muy util para obtener los valores que cumplen cierta condicion, por ejemplo:

In [None]:
array[cond]

### 9.1 Condicionales
Se debe tener claro que las condicionales sólo aceptan un True o False, mientras que un array almacena una serie de boolenos. 

In [None]:
array = np.random.rand(4, 3)

# Ahora aplicamos una condicion
cond = array > 0.5

print('Array de booleanos')
print(cond)
print('Verificar si al menos existe un verdadero en el array ')
print(cond.any())
print('Verificar si todos los booleanos son verdaderos')
print(cond.all())
print('Invertir el valor de los booleanos')
print(~cond)
print('Sumar numero de elementos verdadero')
print(cond.sum())

Ahora que sabemos lo anterior podemos establecer condicionales:

In [None]:
array = np.random.rand(4, 5)

if (array > 0.98).any():
    print('Al menos algun elemento es mayor a 0.98')
elif np.sum(array<0.5) >= 2:
    print('Al menos 2 elementos son menores a 0.5')
else:
    print('Ninguno de los casos anteriores')

### 9.2 Condicionales múltiples
Cuando de arrays se trata se puede aplicar operadores áramúltiples condicionales:

| Operador | Descrpción |
| :-: | :- |
| & | Verifica si el booleano con el mismo indice es verdadero en dos diferenes arrays |
|  | Verifica si almenos un booleano con el mismo indice es verdadero en dos diferenes arrays |
| ~ | Invierte el valor de los boolanos en un array |


In [None]:
array = np.random.rand(4, 5)
array

In [None]:
# verificar datos que estan en el rango 0.2 a 0.8
(array > 0.2) & (array < 0.8)

In [None]:
# verificar datos que estan fuera del rango 0.2 a 0.8
(array < 0.2) | (array > 0.8)

In [None]:
# verificar si almenos un elemento esta fuera del rango 0.2 a 0.8
((array < 0.2) | (array > 0.8)).any()

### 9.3 Ciclo For
El ciclo for es sumamente útil cuando de arrays se trata, ya que nos permite realizar iteraciones sobre sus elementos.
Aunque en la mayoría de los casos realizar iteraciones en arrays es más lento que realizar operaciones binarias, en ocaciones será impresindible el uso de ciclos.

- **Iterando por renglón y columna**:

In [None]:
array = np.random.rand(4, 5)
r, c = array.shape  # obener renglones y columnas

for i in range(r):
    for j in range(c):
        print('Columna: {}, Renglon: {}, Valor: {}'.format(i, j, array[i, j]))

- **Iterando por renglón**:

In [None]:
array = np.random.rand(4, 5)
r, c = array.shape  # obener renglones y columnas

for i in range(r):
    print('Renglon: {}'.format(i))
    print(array[i, :])

- **Iterando por columna**:

In [None]:
array = np.random.rand(4, 5)
r, c = array.shape  # obener renglones y columnas

for j in range(c):
    print('Columna: {}'.format(j))
    print(array[:, j])