---
Escuela de Ingeniería de Sistemas y Computación  
Universidad del Valle  
INTRODUCCIÓN A LA PROGRAMACIÓN PARA ANALÍTICA  
Profesor: Ph.D, Robinson Duque (robinson.duque@correounivalle.edu.co)  
Última modificación: Julio de 2020  

---

# Consideraciones:

Este material presenta textos y ejemplos orientados al propósito del curso de _Introducción a la Programación para Analítica_ de la Universidad del Valle.

## Funciones de agregación
| Function Name | NaN-safe Version | Description                               |
|---------------|------------------|-------------------------------------------|
| np.sum        | np.nansum        | Compute sum of elements                   |
| np.cumsum     | np.nancumsum     | Compute the cumulative sum of elements    |
| np.prod       | np.nanprod       | Compute product of elements               |
| np.cumprod    | np.nancumprod    | Compute the cumulative product of elements|
| np.mean       | np.nanmean       | Compute mean of elements                  |
| np.std        | np.nanstd        | Compute standard deviation                |
| np.var        | np.nanvar        | Compute variance                          |
| np.min        | np.nanmin        | Find minimum value                        |
| np.max        | np.nanmax        | Find maximum value                        |
| np.argmin     | np.nanargmin     | Find index of minimum value               |
| np.argmax     | np.nanargmax     | Find index of maximum value               |
| np.median     | np.nanmedian     | Compute median of elements                |
| np.percentile | np.nanpercentile | Compute rank-based statistics of elements |
| np.any        | N/A              | Evaluate whether any elements are true    |
| np.all        | N/A              | Evaluate whether all elements are true    |

In [None]:
import numpy as np

In [None]:
a = np.array([2,3,4,5,6,7,8])
print(a.sum())
print(a.cumsum())
print(a.std())
print(np.median(a))
print(np.percentile(a,50))

a = np.array([2,3,4,5,6,np.nan,8])
print(np.sum(a))
print(np.nansum(a))

> ### Agregaciones en múltiples dimensiones
>En ocasiones es deseable aplicar las funciones de agregación por columnas o filas de un determinado array. Para este propósito utilizaremos el parámetro `axis`:
> * `axis = 0`, realiza las operaciones por columnas
> * `axis = 1`, realiza las operaciones por filas

In [None]:
a = np.arange(1,11).reshape((2,5))
print(a)

print(a.sum())
print(a.sum(axis=0))
print(a.sum(axis=1))

## Filtrado de un array (máscaras y lógica booleana)
> Una característica muy útil de los arrays es que es muy fácil obtener otro array con los elementos que cumplen una condición.
>
> `a[condicion]` : Devuelve una lista con los elementos del array a que cumplen la condición `condicion`.

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6], [8,2,1]])
print(a[ a%2 == 0 ])
print(a[ a>5 ])
print(a[ a<=2 ])
print(a[(a % 2 == 0) & (a > 2)])
print(a[(a % 2 == 0) | (a > 2)])
print(a[(a % 2 == 0) ^ (a > 2)])


# ¿Recuerdas los operadores bit a bit o elemento a elemento '&', '|', "^"?
# Los operadorer 'and' y 'or' no se debe utilizar en estos casos

> **¿Cómo funciona esto?**, en realidad lo que sucede es que se crea un índice o máscara booleana que funciona como filtro. Observa cuando lo hacemos por partes:

In [None]:
names = np.array(['Bob', 'Joe', 'Will', 'Boby', 'Rob', 'Mary', 'Ann'])
mascara= np.array([True,  False,  False,  True,  True,  True,  False])
print(names[mascara])
print(names[~mascara])

In [None]:
a = np.array([[3,5,1,8],
              [6,9,4,8]])
print(a)
mascara = a>5
print(mascara)

print(a[mascara])
print(a[a>5])

> Estas máscaras, además de ser útiles para filtar arrays, también pueden ser útiles para contar elementos:

In [None]:
a = np.array([[3,5,1,8],
              [6,9,4,8]])

mascara = a>5
print("Cantidad de elementos >=5:",mascara.sum())

# Otra forma válida sería:
print("Cantidad de elementos >=5:",a[mascara].size)

# Lo interesante de hacerlo con 'sum' es que puedo averiguar el resultado
# por filas y columnas
print("Cantidad de elementos >=5 por filas: ",mascara.sum(axis=1))
print("Cantidad de elementos >=5 por columnas: ",mascara.sum(axis=0))


In [None]:
#Observa esto:
print(np.any(a%2==0))
print(np.all(a%2==0))
print(np.any(a>8, axis=1))
print(np.any(a>8, axis=0))
print(np.all(a>=1, axis=1))

> ## Modificación de valores de un arreglo
Se puede modificar el contenido de uno o varios elementos del arreglo siempre y cuando se tengan los índices o referencias de los elementos a modificar:

In [None]:
#Modificar 1 elemento
x = np.arange(10)
print(x)
x[3]=-5
print(x)

#Modificar todos los elementos
x[:]=5
print(x)

#Modificar varios elementos utilizando un índice de posiciones
x = np.arange(10)
print(x)
i = [2, 1, 8, 4]
x[i] += 1
print(x)
x[i]=9
print(x)


In [None]:
# Se pueden modificar elementos que cumplan con una condición
a = np.array([[3,4,1,8],
              [6,9,4,8]])
print(a)
a[a==4] = -4 #Cambiar los números 4 por -4
print(a)

a[a%2==0] = a[a%2==0]/2 #Dividir entre 2 los múltiplos de 2
print(a)

#Quizá el ejemplo anterior te quede más claro si lo ves así:
#mascara = a%2==0
#a[mascara] = a[mascara]/2
#print(a)

mascara = (a>3)
a[mascara] = a[mascara]*4 #multiplicar por 4 los números mayores de 3
print(a)

---

# Preguntas Socrative

1. Oculta aquí (MC).

<!--  
Cuál es el resultado de ejecutar:  

a = np.arange(1,11)

a[a%2==1] = 0

print(a)


a) [ 0  2  0  4  0 6  0 8  0 10]

b) [ 0  4  0  8  0 12  0 16  0 20]

c) [ 2  0  6  0  10 0  14 0  18 0]

d) [0 0 0 0 0 0 0 0 0 0]

e) [0]
-->

2. Oculta aquí (MC).

<!--  
Cuál es el resultado de ejecutar:  

a = np.arange(1,11)

a[a%2==1] = 0

m1 = (a%2==0)

a[m1] = a[m1] * 2

print(a)


a) error

b) [ 0  4  0  8  0 12  0 16  0 20]

c) [ 2  0  6  0  10 0  14 0  18 0]

d) [0 0 0 0 0 0 0 0 0 0]

e) [0]
-->

---