<div align="center">
    <h1>Taller de Computación Científica en Python - 2025</h1>
    <img src="https://www.iycr2014.org/__data/assets/image/0014/133052/logo_cenat.png" alt="Logo CENAT" style="width: 200px;"/>
    
</div>

---

## NumPy: Fundamento de Python científico  

<center> <img src="https://upload.wikimedia.org/wikipedia/commons/thumb/3/31/NumPy_logo_2020.svg/1280px-NumPy_logo_2020.svg.png" alt="image info" width="300"/> </center>

En esta sección, se estudiará el uso de la librería NumPy como una herramienta para el manejo de arreglos de datos, matrices, y otros tipos de estructuras. Además, se revisarán las operaciones básicas involucradas y cómo obtener el mejor provecho de los recursos computacionales.

---

**Realizado por:**  
Johansell Villalobos y Julián Sánchez

In [None]:
!git clone https://github.com/jkhansell/sc_notebooks

In [None]:
# celda para acceder a archivos en Google Drive
from google.colab import drive
drive.mount('/content/drive')

La utilización de arreglos, matrices y otros arreglos multi-dimensionales
son comunes en la computación numérica y científica.

- Idealmente, al operar sobre los elementos de un arreglo queremos evitar ciclos explícitos que complican legibilidad y lógica del código.
- Operaciones basadas en arreglos (vectorizadas)
- Código más conciso y ejecución más rápida



---



* En Python, NumPy es el "estándar" para trabajar con arreglos.
* Su núcleo está escrito en C, por lo que es más eficiente en el almacenamiento de datos.
* Tiene una implementación de arreglos muy poderosa, de carácter multidimensional.
* Engloba funciones de álgebra lineal, transformada de Fourier, etc.

# Arreglos (*arrays*) de NumPy

* Los arrays de NumPy son estructuras de datos **ordenadas**, de **cantidad fija de elementos** y un tipo de **dato uniforme**.
* Son los equivalentes a las matrices y los vectores en álgebra, por lo que se les puede aplicar operaciones.
* Por su implementación, son **más eficientes** que otras estructuras de datos nativas de Python. El código, además, es más conciso.

In [None]:
#Se debe importar la biblioteca NumPy
#Por covención se usa el alias np
import numpy as np

In [None]:
#Con el signo de ? podemos consultar la documentación de NumPy
np?

## ¿Por qué se dice que es más conciso y eficiente?

In [None]:
array = np.arange(1e6) #Creamos un arreglo de 1 millón de elementos
                       #Queremos multiplicar por 5 cada elemento del arreglo

lista = list(array) #Lo convertimos en una lista | [1, 2, 3, 4] | y = [1*5]

#Medimos el tiempo de 10 loops ejecutados 5 veces

%timeit -n10 y = [val*5 for val in lista] #List comprehension, multiplicar por 5 cada valor

%timeit -n10 y = array*5 #NumPy ofrece operaciones aplicables directamente sobre el arreglo

## Creación de arreglos

Varias funciones sirven para crear arreglos de NumPy, entre ellas las siguientes:

| Función | Resultado |
| :---: | :---: |
| array() | Crea un arreglo con los datos especificados como estructuras de datos|
| empty() | Crea un arreglo vacío, con datos "basura"|
| zeros() | Crea un arreglo de ceros|
|ones() | Crea un arreglo de unos|
| full() | Crea un arreglo lleno del valor especificado|
| arange() | Crea un arreglo de valores indicando un valor inicial, un final y un step|
| linspace() | Crea un arreglo de valores indicando un valor inicial, un final y una cantidad deseada|
| logspace() |Crea un arreglo de valores con espaciado logarítmico|
| geomspace() |Crea un arreglo de valores con espaciado logarítmico en una progresión geométrica|
| random() | Crea una matriz de números entre 0.0 y 1.0|



In [None]:
arr = np.array([1,2,3]) #Array de dimensiones 1x3

print(arr,'\n')
print(np.array([[1],[2],[3]]),'\n') #Array de dimensiones 3x1
print(np.array([[1,2],[3,4]]),'\n') #Matrix 2x2

print(np.random.random([7,4]), '\n')
print("----------")

print(np.random.randn(3,3,3), '\n')


In [None]:
np.random.randn?

* Observe que los arreglos se encierran entre **[]**, pero que al imprimir sus valores no están separados por comas como en las listas.
* Las dimensiones siempre se indican como **filas x columnas**.

### Crear arreglos con distintos valores iniciales

In [None]:
import numpy as np
np.empty?

In [None]:
arr1 = np.empty([3,4]) # Se indican [numero de filas, numero de columnas]
print(arr1,'\n')

arr1.fill(3)
print(arr1,'\n')

print(np.ones([5]),'\n') # Si se indica solo un número, supondrá que son columnas

print(np.full([2,2], np.inf)) # Crea una matriz rellena de "infinito"

### Arreglos con secuencias incrementales

Un caso de uso muy común es crear un arreglo incremental desde 0 hasta algún valor arbitrario.

- Crearlo manualmente con np.array([0,1,2,...,N]) puede resultar inviable para arreglos muy grandes.



In [None]:
#La función de construcción arange provee esta funcionalidad.
np.arange?

In [None]:
np.arange(100)

In [None]:
np.arange(50,100)

In [None]:
#El tercer argumento de arange representa el incremento deseado o step
arr2 = np.arange(0,10,1.5) #Arreglo entre 0 y 10 (exceptuando al 10), con valores cada 1.5
print(arr2)

In [None]:
np.linspace?

In [None]:
#El tercer argumento de linspace representa la cantidad de datos deseados en el arreglo
arr3 = np.linspace(0,10,21) #Arreglo entre 0 y 10 (con 10), con 21 valores
print(arr3)

La diferencia entre arange y linspace es que en el primero se define el intervalo o espaciado entre valores; mientras que con linspace se define la cantidad de valores


### Arreglos matriciales

Con las funciones anteriores se pueden crear matrices, pero existen también funciones para crear matrices con características específicas.

| Comando | Resultado |
| :---: | :---: |
| identity() | Crea una matriz identidad|
| eye() |Crea una matriz con unos en una diagonal (offset)|
| diag() |Crea una matriz con un arreglo arbitrario en la diagonal|


In [None]:
identidad = np.identity(4)
print(identidad)

In [None]:
np.eye?
offset = np.eye(4, k=1)
print(offset)

El parámetro k hace la diagonal superior (k=1), inferior (k=-1) o principal.

In [None]:
diagonal = np.diag(np.arange(1,5,1))
print(diagonal)

### *List comprehension* y creación de arreglos

Se puede crear un arreglo a partir de listas directamente obtenidas de *list comprehension*.

In [None]:
a = [4.54,844,0.23]
print([i**2 for i in a])
print(np.array([i**2 for i in a]))

## Comandos útiles para trabajar con arreglos de NumPy

Los arreglos de NumPy están acompañados de varias funciones y atributos que permiten manipularlos.

| Comando | Resultado |
| :---: | :---: |
| shape | Retorna una tupla con el número de elementos por dimensión|
| ndim | Dice el número de dimensiones|
| size | Dice cuántos elementos hay en un arreglo|
| dtype | Dice el tipo de datos que guarda un arreglo|
| T | Retorna la transpuesta de un arreglo|
|flatten() | Retorna el arreglo colapsado en una dimensión|
| fill() | Rellena el arreglo con el valor especificado|
| reshape() | Retorna un arreglo con el shape especificado|
| resize() | Cambia el tamaño y shape del arreglo|
| where() | Retorna los índices donde se cumplen las condiciones dadas|

In [None]:
arr = np.array([1,2,3]) #Array de dimension 1x3
arr

In [None]:
arr = arr.reshape([3,1]) #Otra forma de crear un array 3x1
print(arr)

en reshape se especifica una tupla con la cantidad de [filas, columnas]

In [None]:
arr.T

Algunas de estas funciones son muy útiles para entender las características de los objetos con los que estamos trabajando.

In [None]:
ident = np.identity(3) #Creando una matriz identidad de 3x3

print('Matriz: \n',ident,'\n')
print('Número de elementos: ',ident.size,'\n')
print('Forma (filas,columnas): ',ident.shape, '\n')
print('Cantidad de dimensiones: ', ident.ndim)

Otras nos permiten modificar la estructura del arreglo.

In [None]:
print(arr1)

In [None]:
arr2 = np.resize(arr1,(7,2)) #Corta o agrega elementos según el tamaño especificado
print(arr2)

In [None]:
arr1 #resize() no modifica el arreglo original

Se pueden hacer operaciones sofisticadas como la búsqueda en arreglos según ciertas condiciones y la aplicación de operaciones sobre los elementos que cumplen la condición.

In [None]:
original = np.random.rand(3,3) #matriz 3x3 con números aleatorios entre 0 y 1
original

In [None]:
np.where(original < 0.5) #Retorna los índices donde los valores son menores a 0.5, como array([filas]), array([columnas])

In [None]:
np.where?

In [None]:
#Para los números que cumplen la condición calculamos el cuadrado, para los otros el cubo

np.where(original < 0.5, original**2, original**3)

In [None]:
#Tal vez solamente necesitamos calcular el cuadrado de los que cumplen

np.where(original < 0, original**2, original)

## <font color='purple'>**Ejercicio**</font>

Suponga que usted quiere graficar los valores de un modelo que depende de dos variables $X$ y $Y$ usando Python. Para ello, usted desea generar los valores de entrada de $X_0$ de $X_1$  **en dos columnas separadas de un solo arreglo**, considerando lo siguiente:

* El modelo es válido para $300 \leq X \leq 540$ y $300 \leq Y \leq 540$.
* Usted sabe que necesita 100 valores o más de ambas variables para obtener una buena resolución en la respuesta del modelo.

¿De qué forma podría crear este arreglo?


In [None]:
import numpy as np
ar=np.empty([100,2])
ar1=np.linspace(300,540,100) #se crea X y Y

ar.ndim
ar.size

#arreglo = np.array([ar1],[ar1])  no sirve, no se pueden combinar así
#ar.fill(ar1) no sirve porque solo se puede llenar así con un escalar

arreglo=np.column_stack((ar1,ar1)) #operación para combinar 2 arreglos 1-dim en 1 2-dim, uniéndolos como columnas
print(arreglo)

## Operaciones con arreglos de NumPy

* Se pueden hacer operaciones tanto con escalares como entre matrices y vectores.
* Estas operaciones se realizan según las reglas de álgebra lineal.

In [None]:
import numpy as np
arr = np.array([[1,2],[3,4]])
print(arr, '\n')

print(arr*2, '\n\n', arr/2, '\n\n', arr-10,'\n\n', arr+5, '\n') #Elemento por elemento

In [None]:
print(np.full([2,2],2), '\n')
arr * np.full([2,2],2) # Multiplicación de arreglos

In [None]:
print(np.identity(2))
arr.dot(np.identity(2)) # Multiplicación de matrices
np.dot?

## <font color='purple'> **Analicemos las funciones de NumPy vistas hasta ahora. ¿Cómo crearía un arreglo de elementos aleatorios tipo float entre 0 y 100?**</font>

In [None]:
a = np.random.rand(10)*100
print(a)

### Operadores de reducción

En general, son operaciones que tienen como objetivo reducir las dimensiones del arreglo. *Ejemplo*: Producto punto.

| Comando | Resultado que retorna |
|:----------:|:------------:|
| argmax() | Índice donde ocurren los valores máximos |
| min()    | Valor mínimo |
| argmin() | Índice donde ocurren los valores mínimos |
| conj()   | Conjugado complejo de todos los elementos |\
| round()  | Valor redondeado de cada elemento |
| trace()  | Suma de las diagonales del arreglo |
| sum()    | Suma del arreglo |
| cumsum() | Suma acumulativa |
| mean()   | Media aritmética |
| var()    | Varianza|
| std()    | Desviación estándar |
| prod()   | Producto |
| cumprod()| Producto acumulativo |


In [None]:
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
a

In [None]:
a.prod() #Producto de todos los elementos de un arreglo, en este caso sería 12!

In [None]:
b = np.array([[1+2j,2+2j],[1-2j,5-12j]]) #Matriz con números complejos
b

In [None]:
b.conj() #Conjugado del complejo

In [None]:
datos = np.array([402.23,384.60,384.21,409.58,374.42,402.06])

#Estadísticos descriptivos

print('Media: ', np.mean(datos))
print('Desviación estándar: ',np.std(datos))

## Indexación y slicing

* Se puede acceder al índice o posición del elemento de un array con la sintaxis **[fila,columna]**.
* El slicing se consigue con **[inicio:final:step,inicio:final:step]** en el orden **[filas,columnas]**.

In [None]:
A = np.random.rand(6,6)
print(A)

In [None]:
A[:, 2] #Extraer la tercera columna (índice 2)

In [None]:
A[0:2,0:2]
A[:2, :2] #es lo mismo

In [None]:
A[4:6, 4:6]
A[-2:, -2:]

In [None]:
print(a,'\n')
print(a[1,1]) #se indica índice, devuelve valor en esa posición

a[:, 0:2] #todas las filas, primera y segunda columna

¡Cuidado! Al hacer *slicing*, no se copian los datos subyacentes.

In [None]:
original = np.array([1,2,3])
original

In [None]:
trozo_Dif = original.copy()[:2]
trozo_Dif

In [None]:
trozo_Dif[0] = 9

In [None]:
original

In [None]:
trozo = original[:2]
trozo

In [None]:
trozo[0] = 9 #modificar el primer elemento
trozo

In [None]:
original #¡Cambiamos el arreglo original!

Los subarreglos que se extraen a través de *slicing* son vistas (views) de los datos originales. Hacen referencia a los mismos datos en memoria.



In [None]:
original = np.array([1,2,3])
trozo = original[:2]

modificado = np.copy(trozo) #básicamente una copia de la copia
modificado[0] = 9

print(original)
print(modificado)

## Broadcasting

*   Existen maneras de realizar cálculos con arreglos de diferente dimensionalidad en NumPy.
*   Se puede pensar en la analogía de una transmisión de datos a todos los elementos de un arreglo.

<center> <img src="https://numpy.org/doc/stable/_images/broadcasting_1.png" alt="image info" width="500"/> </center>


El tema broadcasting es un poco complejo pero útil, ya que puede reducir la cantidad de líneas de código en un cálculo. En el sitio oficial de [NumPy](https://numpy.org/doc/stable/user/basics.broadcasting.html) existe una explicación detallada de esta funcionalidad.

### Ejemplos:


In [None]:
a = np.array([1,2,3])
b = 2
print(a*b)

In [None]:
a = np.ones((3,5))
b = np.array([1,2,3])
print(a, '\n')
print(b, '\n')
print(a+b)

In [None]:
# Para que el broadcasting funcione debe haber la misma cantidad de dimensiones
a = np.ones((3,5))
b = np.array([[1],[2],[3]]) # dims (3,1)
print(a, '\n')
print(b, '\n')
print(a+b)

## Manejo de archivos con NumPy

* NumPy permite cargar datos de un archivo de texto con la función. Los datos se guardan en un array.
* **loadtxt()** es una de las funciones más usadas.



In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
datos = np.loadtxt(open('./sc_notebooks/Numpy/entrada.csv','r'),delimiter=',')

In [None]:
datos

In [None]:
np.sqrt(datos)

Con **skiprows** se puede omitir tantas filas como se desee.

In [None]:
datos = np.loadtxt(open('./sc_notebooks/Numpy/entrada.csv','r'),delimiter=',',skiprows=4) #Ignora las primeras 4 filas
datos

### Archivos con encabezados

Para cargar datos con encabezados en las columnas se utiliza **genfromtxt()**. Con esta función también se pueden leer archivos sin encabezado usando **names=False**.

In [None]:
#datos2 = np.loadtxt(open('./sc_notebooks/Numpy/sismos.csv','r'),delimiter=',')
#datos2
#como hay encabezados, en vez de loadtxt se usa genfromtxt

datos2 = np.genfromtxt("./sc_notebooks/Numpy/sismos.csv", dtype=float, delimiter=',', names=True)
np.genfromtxt?
datos2

 * Se puede acceder a los nombres con el atributo **dtype.names**.
 * Para conocer los datos se puede usar el nombre de las columnas en vez del índice.

In [None]:
datos2.dtype.names


In [None]:
datos2['escala']

### Guardar datos
**savetxt()** sirve para guardar datos.

In [None]:
arr = np.arange(0, 1000, 0.01)
arr

In [None]:
np.savetxt('salida.csv',arr, delimiter=',', fmt='%.2f') #fmt indica el formato de los decimales para cada float

*Pregunta: todo esto se aplica de la misma manera en un IDE o editor de código regular?*

In [None]:
np.linalg?