# **Obtenci√≥n y preparaci√≥n de datos**
# OD04. Operaciones con Array

In [None]:
import numpy as np

## <font color='blue'>**Ordenar y agregar elementos a una matriz**</font>

Ordenar un elemento es simple con `np.sort()`. Puede especificar el eje, el tipo y el orden cuando llama a la funci√≥n.

In [None]:
arr = np.array([2, 1, 5, 10, 3, 7, 4, 9, 6, 8])
arr_var=np.sort(arr)
arr_var

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([5, 6, 7, 8])
a.shape

(4,)

Para agregar elementos, se utiliza la funci√≥n `np.concatenate()`:

In [None]:
c = np.concatenate((a, b))
print(c.shape)
c

(8,)


array([1, 2, 3, 4, 5, 6, 7, 8])

In [None]:
x = np.array([[1, 2], [3, 4]])
y = np.array([[5, 6],[5, 6]])

In [None]:
print(x)
print()
print(y)
print()
np.concatenate((x, y), axis=1)

[[1 2]
 [3 4]]

[[5 6]
 [5 6]]



array([[1, 2, 5, 6],
       [3, 4, 5, 6]])

## <font color='blue'>**Forma y Tama√±o de una matriz**</font>

`ndarray.ndim` entrega el n√∫mero de ejes, o dimensiones, de la matriz.

`ndarray.size` entrega el n√∫mero total de elementos de la matriz.

`ndarray.shape` entrega una tupla de n√∫meros enteros que indican el n√∫mero de elementos almacenados a lo largo de cada dimensi√≥n de la matriz. Si, por ejemplo, tiene una matriz 2D con 2 filas y 3 columnas, la forma de su matriz es (2, 3).

Por ejemplo:

In [None]:
arr_ejemplo = np.array([[[0, 1, 2, 3],[4, 5, 6, 7]],
                        [[0, 1, 2, 3],[4, 5, 6, 7]],
                        [[0 ,1 ,2, 3],[4, 5, 6, 7]]])

In [None]:
arr_ejemplo.ndim

3

In [None]:
arr_ejemplo.size

24

In [None]:
arr_ejemplo.shape

(3, 2, 4)

## <font color='blue'>**Redimensionamiento de matrices**</font>

El m√©todo de `reshape()` le dar√° una nueva forma a una matriz sin cambiar los datos. Recuerde que cuando usa el m√©todo de redimensionamiento, la matriz que desea generar debe tener la misma cantidad de elementos que la matriz original. Si comienza con una matriz con 12 elementos, deber√° asegurarse de que su nueva matriz tambi√©n tenga un total de 12 elementos.

In [None]:
a = np.arange(6)
print(a)

[0 1 2 3 4 5]


In [None]:
b = a.reshape(3, 2)
print(b)

[[0 1]
 [2 3]
 [4 5]]


## <font color='blue'>**Transponer una matriz**</font>

In [None]:
arr = np.arange(6).reshape((2, 3))
arr

array([[0, 1, 2],
       [3, 4, 5]])

In [None]:
arr.transpose()

array([[0, 3],
       [1, 4],
       [2, 5]])

## <font color='blue'>**¬øC√≥mo agregar nuevos ejes (dimensiones) a una matriz?**</font>

Con las funcionaes `np.newaxis` y `np.expand_dims` se puede aumentar las dimensiones de su matriz existente.

El uso de `np.newaxis` aumentar√° las dimensiones de su matriz en una dimensi√≥n cuando se use una vez. Esto significa que una matriz 1D se convertir√° en una matriz 2D, una matriz 2D se convertir√° en una matriz 3D, y as√≠ sucesivamente. Por ejemplo:

In [None]:
a = np.array([1, 2, 3, 4, 5, 6, 7])
print(a)
a.shape

[1 2 3 4 5 6 7]


(7,)

In [None]:
a2 = a[np.newaxis, :]
#print(a2)
#a2.shape
a3 = a2[np.newaxis, :]
print(a3)
a3.shape

[[[1 2 3 4 5 6 7]]]


(1, 1, 7)

Es posible convertir expl√≠citamente una matriz 1D a un vector de fila o a un vector de columna usando `np.newaxis`. Por ejemplo, puede convertir una matriz 1D en un vector de fila insertando un eje a lo largo de la primera dimensi√≥n:

In [None]:
row_vector = a[np.newaxis, :]
print(row_vector)
row_vector.shape

[[1 2 3 4 5 6 7]]


(1, 7)

o convertirlo en un vector columna, insertando un eje en la segunda dimensi√≥n:

In [None]:
col_vector = a[:, np.newaxis]
print(col_vector)
col_vector.shape

[[1]
 [2]
 [3]
 [4]
 [5]
 [6]
 [7]]


(7, 1)

Tambi√©n es posible expandir una matriz insertando un nuevo eje en una posici√≥n espec√≠fica con la funci√≥n `np.expand_dims()`:

In [None]:
a = np.array([1, 2, 3, 4, 5, 6])
a.shape

(6,)

In [None]:
b = np.expand_dims(a, axis=1)
print(b.shape)
b

(6, 1)


array([[1],
       [2],
       [3],
       [4],
       [5],
       [6]])

In [None]:
c = np.expand_dims(a, axis=0)
print(c.shape)
c

(1, 6)


array([[1, 2, 3, 4, 5, 6]])

## <font color='blue'>**Elementos √∫nicos y conteo**</font>

In [None]:
a = np.array([11, 11, 12, 13, 14, 15, 16, 17, 12, 13, 11, 14, 18, 19, 20])
valores_unicos = np.unique(a)
print(valores_unicos)

[11 12 13 14 15 16 17 18 19 20]


Para obtener los √≠ndices de los valores √∫nicos en una matriz NumPy se debe usar el argumento `return_index` en la funci√≥n `np.unique()`:

In [None]:
valores_unicos, indices_list = np.unique(a, return_index=True)
print(indices_list)

[ 0  2  3  4  5  6  7 12 13 14]


Puede pasar el argumento `return_counts` en `np.unique()` junto con su matriz para obtener el recuento de frecuencia de valores √∫nicos en una matriz de NumPy:

In [None]:
valores_unicos, contar_ocurrencia = np.unique(a, return_counts=True)
print(contar_ocurrencia)

[3 2 2 2 1 1 1 1 1 1]


## <font color='blue'>**Aplicar una funci√≥n sobre una fila o columna de una matriz**</font>

La funci√≥n `np.apply_along_axis()` permite aplicar una funci√≥n sobre una de las dimisiones de un matriz. Por lo que es una herramienta con muchas posibilidades. La funci√≥n tiene tres par√°metros, en el primero se indica la funci√≥n que se desea aplicar, en la segunda el eje sobre el que se desea aplicar la funci√≥n y finalmente la matriz. Obteni√©ndose como salida de la funci√≥n una matriz con un eje menos que el original.

Por ejemplo:

In [None]:
arr = np.arange(1, 10).reshape(3,3)
print(arr)
np.apply_along_axis(sum, 0, arr)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


array([12, 15, 18])

In [None]:
# Funci√≥n que calcula el promedio entre el primero y el √∫ltimo elemento de un vector
def my_func(a):
    return (a[0] + a[-1]) * 0.5

b = np.array([[1,2,3], [4,5,6], [7,8,9]])
print(b)
np.apply_along_axis(my_func, 1, b)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


array([2., 5., 8.])

In [None]:
np.apply_along_axis(my_func, 1, b)

array([2., 5., 8.])

### <font color='green'>Actividad 1</font>

Crear un matriz bidimensional _A_ de 5x5 con todos los valores cero. Usando el indexado de matrices, asignar 1 a todos los elementos de la √∫ltima fila y 5 a todos los elementos de la primera columna. Finalmente, asignar el valor 100 a todos los elementos de la submatriz central de 3x3 de la matriz de 5x5.


In [None]:
matriz_5x5=np.zeros((5, 5)) # creamos la matriz 5x5 con ceros
np.shape(matriz_5x5) # verificamos su estructura
matriz_5x5[4]=1 #asignamos 1 a todos los elementos de la √∫ltima fila
matriz_5x5[:4,0]=5 #asignamos 5 a todos los elementos de la primera columna
matriz_5x5[1:4,1:4]=100 #asignar el valor 100 a todos los elementos de la submatriz central de 3x3 de la matriz de 5x5
matriz_5x5 # mostrar la matriz




array([[  5.,   0.,   0.,   0.,   0.],
       [  5., 100., 100., 100.,   0.],
       [  5., 100., 100., 100.,   0.],
       [  5., 100., 100., 100.,   0.],
       [  1.,   1.,   1.,   1.,   1.]])

<font color='green'>Fin actividad 1</font>

### <font color='green'>Actividad 2</font>

Los di√°metros de las esporas del lycopodium pueden medirse por m√©todos interferom√©tricos ü§ì ü§ì ü§ì. Los resultados de uno de estos experimentos son los siguientes:Los di√°metros de las esporas del _lycopodium_ pueden medirse por m√©todos interferom√©tricos &#129299; &#129299; &#129299;. Los resultados de uno de estos experimentos son los siguientes:

<img src='https://drive.google.com/uc?export=view&id=1te4LaaTF_WzyjPShqDOMnP9qDiswwZGG' width="600" align="center" style="margin-right: 50px">

donde $k$ = 5880.

Calcular, usando funciones de NumPy, el di√°metro medio de las esporas y la desviaci√≥n est√°ndar de la muestra. Separar, en matrices independientes, las medidas de los di√°metros:

* Que tengan valores inferiores a la media ($\mu$) menos la desviaci√≥n est√°ndar ($\sigma$), es decir $d < \mu_{d} - \sigma_{d}$
* Que tengan valores superiores a la media m√°s la desviaci√≥n est√°ndar, es decir $d > \mu_{d} + \sigma_{d}$
* Que tengan valores entre $\mu_{d} - \sigma_{d} < d < \mu_{d} + \sigma_{d}$

*Fuente: Adaptado de Curso de Computaci√≥n Cient√≠fica, J. P√©rez, T. Roca y C. L√≥pez*

In [None]:
# Di√°metros de las esporas
diametros = np.arange(14, 24)/5880
# N√∫mero de las esporas
nro_esporas = np.array([1, 1, 8, 24, 48, 58, 35, 16, 8, 1])

# Calcular el di√°metro medio ponderado
diametro_medio = np.sum(diametros * nro_esporas) / np.sum(nro_esporas)

# Calcular la desviaci√≥n est√°ndar ponderada
desviacion_estandar = np.sqrt(np.sum((diametros - diametro_medio)**2 * nro_esporas) / np.sum(nro_esporas))

# Separar las medidas de di√°metros seg√∫n los criterios especificados
diametros_inferiores = diametros[diametros < (diametro_medio - desviacion_estandar)]
diametros_superiores = diametros[diametros > (diametro_medio + desviacion_estandar)]
diametros_entre = diametros[(diametros >= (diametro_medio - desviacion_estandar)) & (diametros <= (diametro_medio + desviacion_estandar))]

# Imprimir los resultados

print("Di√°metros Inferiores a la Media - Desviaci√≥n Est√°ndar:", diametros_inferiores)
print("Di√°metros Superiores a la Media + Desviaci√≥n Est√°ndar:", diametros_superiores)
print("Di√°metros entre Media - Desviaci√≥n Est√°ndar y Media + Desviaci√≥n Est√°ndar:", diametros_entre)


Di√°metros Inferiores a la Media - Desviaci√≥n Est√°ndar: [0.00238095 0.00255102 0.00272109 0.00289116]
Di√°metros Superiores a la Media + Desviaci√≥n Est√°ndar: [0.00357143 0.0037415  0.00391156]
Di√°metros entre Media - Desviaci√≥n Est√°ndar y Media + Desviaci√≥n Est√°ndar: [0.00306122 0.00323129 0.00340136]


<font color='green'>Fin actividad 2</font>