# Introducción a las ciencias de la computación *y programación en Python*

*Banco de Guatemala*  
*PES 2025-2026*  
*Programación I*  
*Septiembre de 2025*  

## Abstract

> "*I do not fear computers. I fear lack of them.*" **Isaac Asimov**

- Paquete de computación científica NumPy

    - Introducción
    
    - Conceptos básicos de utilización
    
    - Ejercicios

# NumPy

- Paquete de Python para **computación científica** de **alto desempeño** sobre vectores, matrices y estructuras de mayores dimensiones (tensores).

- Implementado en C y Fortran, por lo que cuando se **vectorizan** las oepraciones, el desempeño es muy bueno.

- Ofrece una estructura de datos `ndarray` para procesar de forma **eficiente** datos homogéneos.

- Capacidades de algebra lineal, transformada de Fourier y generación de números aleatorios.

## Pero, ¿y las listas de Python?

- Las listas son muy generales, pueden contener cualquier tipo de objeto.

    - Implementan tipos dinámicos.
    
    - No permiten operaciones matemáticas como la *multiplicación matricial* o *producto punto*.
    
- Los vectores de NumPy son de tipado estático y homogéneo. El tipo del arreglo se determina cuando se crea el vector.

    - Son eficientes en memoria.
    
    - Es posible implementar **funciones universales** (ufuncs). 
    
    - El tipado estático permite implementar operaciones matemáticas de forma eficiente a través de C y Fortran.
    

### Comparación entre lenguajes de programación

![julia-benchmarks.svg](figs/numpy/julia-benchmarks.svg)

[5 Razones para aprender NumPy](https://insights.dice.com/2016/09/01/5-reasons-know-numpy/): 

    It's fast
    It works very well with SciPy and other Libraries
    It lets you do matrix arithmetic
    It has lots of built-in functions
    It has universal functions


## Importando NumPy

In [None]:
import numpy as np

- Revisamos la versión de NumPy (importante al ver la documentación)

In [None]:
np.__version__

### Obteniendo ayuda

In [None]:
# Obtiene una ventana de ayuda
np.ndarray?

In [None]:
# Función help para una función
help(np.array)

***
## La clase `ndarray`

- La clase básica de NumPy se llama `ndarray` (alias `array`). Sus atributos más importantes son: 

    - `ndarray.ndim` : número de dimensiones del arreglo.

    - `ndarray.shape` : dimensiones del arreglo. Esta es una **tupla de enteros** que indica el tamaño de la matriz en cada dimensión. Para una matriz con $n$ filas y $m$ columnas, la forma será $(n, m)$. La longitud de la tupla de forma es, por lo tanto, el número de ejes, `ndim`.

    - `darray.size` : el número total de elementos del arreglo. Es igual al producto de los elementos de la tupla `shape`.

    - `ndarray.dtype` : un **objeto** que describe el **tipo** de los elementos en el arreglo. Es posible crear y especificar `dtypes` propios.
        - Adicionalmente, NumPy provee algunos tipos propios muy utilizados: `numpy.int32`, `numpy.int16`, and `numpy.float64`.

    - `ndarray.itemsize` : el tamaño en bytes de cada elemento en el arreglo. Por ejemplo, un arreglo de tipo `float64` tiene tamaño en bytes de $8 (=64/8)$. Equivalente a `ndarray.dtype.itemsize`.

    - `ndarray.data` : el búfer que contiene los elementos del arreglo. Aunque normalmente, no accedemos al atributo directamente, ya que hacemos uso de los elementos con *slicing*.



In [None]:
a = np.arange(15).reshape(3, 5)
a

In [None]:
a.shape

In [None]:
a.ndim

In [None]:
a.dtype

In [None]:
a.dtype.name

In [None]:
a.itemsize

In [None]:
a.size

In [None]:
type(a)

***
# Creando arreglos N-dimensionales de NumPy

- Hay varias formas de inicializar nuevas matrices numpy, por ejemplo desde

    - Una lista de Python o tuplas.
    
    - Utilizando funciones dedicadas a **generar** arreglos de NumPy.

      - Es común inicializar vectores de ceros o con valores aleatorios.
    
    - Leer información de archivos. 

In [None]:
a = np.array([2,3,4])
a

In [None]:
a.dtype

In [None]:
b = np.array([1.2, 3.5, 5.1])
b

In [None]:
b.dtype

### Error frecuente

Crear el arreglo con varios argumentos en vez de proveer una sola lista o secuencia como argumento

In [None]:
# Error frecuente
a = np.array(1,2,3,4)

## A partir de listas o tuplas 
`ndarray` transforma secuencias de secuencias en matrices bidimensionales, secuencias de secuencias de secuencias en matrices tridimensionales, etc.

In [None]:
b = np.array([[1.5,2,3], [4,5,6]])
b

El tipo de matriz también se puede especificar explícitamente en el momento de la creación:

In [None]:
c = np.array( [ [1,2], [3,4] ], dtype=complex )
c

## Funciones de generación de arreglos

In [None]:
np.arange(10, 30, 5)

In [None]:
# A diferencia de range
np.arange(0, 2, 0.3)

#### Evaluación de funciones

Notar que la evaluación de funciones es "vectorizada", es decir, sobre todos los elementos del arreglo a la vez. 

- ¡Evitamos los ciclos `for` de Python porque son más lentos!

In [None]:
x = np.linspace(0, 2*np.pi, 20)
x

In [None]:
y = np.sin(x)
y 

##  Variables aleatorias

In [None]:
b = np.random.random((5, 5))
b

## Unos, ceros

In [None]:
np.zeros([10, 10])

In [None]:
np.ones([5, 5])

In [None]:
# Copiando la forma de x
np.ones_like(x)

In [None]:
np.identity(5)

## Desde archivos

In [None]:
data = np.loadtxt("data/data.csv", delimiter=',', skiprows=1)
data

***
# Impresión de arreglos

Cuando imprimes una matriz, NumPy la muestra de forma similar a las listas anidadas, pero con el siguiente diseño:

- el último eje se imprime de izquierda a derecha,

- el penúltimo se imprime de arriba a abajo,

- el resto también se imprime de arriba a abajo, con cada corte separado del siguiente por una línea vacía.

Las matrices unidimensionales se imprimen como filas, bidimensionales como matrices y tridimensionales como listas de matrices.

In [None]:
a = np.arange(6)
print(a)

In [None]:
b = np.arange(12).reshape(4,3)
print(b)

In [None]:
c = np.arange(24).reshape(2,3,4) 
print(c)

In [None]:
# Si es muy grande, se suprime parte de la salida
print(np.arange(10000))

In [None]:
print(np.arange(10000).reshape(100,100))

***
# Operaciones básicas

Las operaciones básicas son aplicadas elemento a elemento (*elementwise*). Se crea un nuevo arreglo lleno con el resultado

In [None]:
a = np.array( [20,30,40,50] )
b = np.arange(4)
a, b

In [None]:
c = a - b
c

`*` opera en sentido elemento a elemento sobre los arreglos.

In [None]:
# Constante por arreglo
10 * np.sin(a)

In [None]:
# Arreglos lógicos
a < 35

La multiplicación matricial puede hacerse utilizando `@` o el método `dot`

In [None]:
A = np.array( [[1, 1], [0, 1]] )
B = np.array( [[2, 0], [3, 4]] )

In [None]:
A * B

In [None]:
A @ B

In [None]:
A.dot(B)

In [None]:
np.matmul(A, B)

In [None]:
b = np.random.random((2,3))
b

Operadores `+=` y `*=` son válidos para modificar arreglos existentes.

In [None]:
a = np.ones((2,3), dtype=int)
a *= 3
a

In [None]:
b = np.random.random((2,3))
b +=a 
b

## Métodos útiles

In [None]:
a = np.random.random((2, 3))
a

In [None]:
a.sum() # equivalente a np.sum(a)

In [None]:
a.min()

In [None]:
a.max()

Por defecto operan sobre el arreglo como si fueran una lista de números. Es posible especificar el eje sobre el cuál se desea aplicar la operación con el parámetro `axis`

In [None]:
b = np.arange(12).reshape(3,4)
b

In [None]:
# Suma de las columnas 
b.sum(axis=0)   

In [None]:
# Mínimo de cada fila
b.min(axis=1)

In [None]:
# Suma acumulada en las columnas 
b.cumsum(axis=1)

***
## Funciones universales (*ufuncs*)

In [None]:
a = np.arange(5)
a

In [None]:
np.exp(a)

In [None]:
np.sqrt(a)

Podemos definir funciones de usuario que sean universales: $$ f(x) = 2x + e^x - \sqrt{x} $$

In [None]:
def f(x):
    return 2*x + np.exp(x) - np.sqrt(x)

In [None]:
f(a)

***
## Indexing, Slicing and Iterating

Los arreglos unidimensionales se pueden indexar, dividir e iterar, al igual que las listas y otras secuencias de Python.

In [None]:
a = np.arange(10)**3
a

In [None]:
a[2]

In [None]:
a[2:5]

In [None]:
# Asignación múltiple
a[0:6:2] = -1000
a

In [None]:
def f(x,y):
    return 10*x + y

In [None]:
b = np.fromfunction(f, (5,4), dtype=int)
b

In [None]:
b[2, 3]

In [None]:
b[0:5, 1]

In [None]:
b[:, 1]

Cuando se proporcionan menos índices que el número de ejes, los índices faltantes se consideran segmentos completos `:`

In [None]:
# Ultima fila, todas las columnas
b[-1]

In [None]:
np.ones((4,3,2,1))

La iteración sobre arreglos multidimensionales se realiza con respecto al primer eje

In [None]:
for row in b:
    print(row)

Sin embargo, si se desea realizar una operación en cada elemento de la matriz, se puede usar el atributo `flat` que es un iterador sobre todos los elementos de la matriz:

In [None]:
for element in b.flat:
    print(element)

In [None]:
b.flatten()

***
## Manipulación del `shape` (forma) del arreglo

Una matriz tiene una forma dada por el número de elementos a lo largo de cada eje:

In [None]:
a = np.floor ( 10 * np.random.random (( 3 , 4 )))
a

In [None]:
a.shape

La forma de una matriz se puede cambiar con varios comandos. Tenga en cuenta que los siguientes tres comandos devuelven una matriz modificada, pero **no cambian la matriz original**:

In [None]:
a.ravel()  # returns the array, flattened

In [None]:
a.flatten()

In [None]:
a.reshape(6,2)  # returns the array with a modified shape

In [None]:
a.T

In [None]:
a.T.shape

- El orden de los elementos en la matriz resultante de `ravel()` es normalmente "estilo `C`", es decir, el índice de la derecha "cambia más rápido", por lo que el elemento después de un `[0,0]` es un `[0,1]`. 

- Si la matriz se reforma a otra forma, nuevamente la matriz se trata como "estilo `C`". NumPy normalmente crea matrices almacenadas en este orden, por lo que `ravel()` generalmente no necesitará copiar su argumento, pero si la matriz se hizo tomando segmentos de otra matriz o se creó con opciones inusuales, es posible que deba copiarse. 

- Las funciones `ravel()` y `reshape()` también se pueden instruir, utilizando un argumento opcional, para usar matrices de estilo FORTRAN, en las que el índice más a la izquierda cambia más rápido.

La función de `reshape` devuelve su argumento con una forma modificada, mientras que el método `ndarray.resize` modifica la matriz en sí:

In [None]:
a

In [None]:
a.resize((2, 6))
a

***
## Concatenación de arreglos
Se pueden apilar varios arreglos a lo largo de diferentes ejes:

In [None]:
a = np.floor(10*np.random.random((2,2)))
a

In [None]:
b = np.floor(10*np.random.random((2,2)))
b

In [None]:
# np.vstack pide una tupla de ndarrays 
np.vstack((a,b))

In [None]:
# np.hstack pide una tupla de ndarrays 
np.hstack((a,b))

In [None]:
np.column_stack((a,b)) # Equivalente a np.hstack para arreglos 2D

In [None]:
np.hstack((a,b)) 

- Cuando los arreglos son 1D, `np.column_stack()` y `np.hstack()` se comportan diferente

In [None]:
a = np.array([4.,2.])
b = np.array([3.,8.])

In [None]:
np.column_stack((a,b))

In [None]:
np.hstack((a,b)) 

- Podemos crear nuevas dimensiones en el arreglo con `np.newaxis` o con `None`

In [None]:
a[:, np.newaxis]

In [None]:
a[:, None]

In [None]:
np.column_stack((a[:, np.newaxis], b[:, np.newaxis]))

- Por otro lado, la función `row_stack` es equivalente a `vstack` para cualquier arreglo de entrada. De hecho, `row_stack` es un alias para `vstack`

In [None]:
np.row_stack is np.vstack

- En general, para arreglos con más de dos dimensiones:
    
    - `hstack` apila a lo largo del segundo eje, 
    
    - `vstack` apila a lo largo del primer eje y 
    
    - `concatenate` permite argumentos opcionales que dan el número del eje (`axis`) a lo largo del cual debe ocurrir la concatenación.

***
## Separar un arreglo en varios más pequeños

In [None]:
a = np.floor(10*np.random.random((2,12)))
a

In [None]:
np.hsplit(a,3)   # Split a into 3

In [None]:
np.hsplit(a, (3,4))   # Split a after the third and the fourth column

In [None]:
help(np.hsplit)

***
# Mutabilidad y clonado

Al operar y manipular arreglos, los datos a veces se copian en un nuevo arreglo y otras no. Esto es a menudo una fuente de confusión para los principiantes. 

Hay tres casos:

In [None]:
a = np.arange( 12 )
b = a
b is a

In [None]:
b.shape = 3, 4
a.shape

1. Cortar una matriz devuelve una vista de ella:

In [None]:
a

In [None]:
s = a[:, 1:3]
s

In [None]:
s is a

## Copia profunda 

El método de copy hace una copia completa de la matriz y sus datos.

In [None]:
# a new array object with new data is created
d = a.copy()
d

In [None]:
d is a

In [None]:
d == a

***
# Rutinas de NumPy

[Rutinas y funcionalidad](https://numpy.org/devdocs/reference/routines.html#routines)

***
# Para usuarios ***pro*** (como ustedes)

## *Broadcasting* (difusión)

- Este mecanismo permite que las funciones universales manejen de manera significativa entradas que no tienen exactamente la misma forma.

[General Broadcasting Rules](https://numpy.org/devdocs/user/basics.broadcasting.html)

- Un ejemplo:

In [None]:
x = np.arange(4)
x

In [None]:
xx = x.reshape(4,1)
xx

In [None]:
x + xx

In [None]:
x.shape

In [None]:
xx.shape

- El *broadcasting* proporciona una forma conveniente de tomar el producto externo (o cualquier otra operación externa) de dos matrices. El siguiente ejemplo muestra una operación de adición externa de dos matrices 1D:

In [None]:
a = np.array([0.0, 10.0, 20.0, 30.0])
b = np.array([1.0, 2.0, 3.0])

In [None]:
a[:, None] + b

Aquí, `None` inserta un nuevo eje en `a`, haciéndolo un arreglo bidimensional de `4x1`. Al combinar este arreglo de `4x1` con `b`, que tiene forma `(3,)`, resulta un arreglo de `4x3`

### ¿Por qué funciona?

- Cuando se operan dos arreglos, NumPy compara sus formas (`shape`) elemento a elemento, empezando por la última dimensión y hacia arriba. 

- Dos dimensiones son compatibles cuando:
    
    - Son iguales, o
    
    - Una de ellas es 1
    
- Cuando alguna de las dos dimensiones es uno, **se utiliza la otra**. 

    - En otras palabras, las dimensiones con tamaño 1 son "estiradas" o "copiadas" para ajustarse a la otra.

***
## *Fancy indexing* y trucos de indexación

- NumPy ofrece más funciones de indexación que las secuencias regulares de Python. Además de la indexación por enteros y sectores, como vimos antes, las matrices se pueden indexar por matrices de enteros y matrices de booleanos.

In [None]:
a = np.arange(11)**2
a

In [None]:
i = np.array( [ 1,1,3,8,5 ] )
i

In [None]:
a[i]   # the elements of a at the positions i

In [None]:
j = np.array([[ 3, 4], [ 9, 7 ]])  # a bidimensional array of indices
j

In [None]:
a[j] # the same shape as j

- También podemos dar índices para más de una dimensión. Las matrices de índices para cada dimensión deben tener la misma forma.

In [None]:
a = np.arange(12).reshape(3,4)
a

In [None]:
i = np.array([[0,1], [1,2]])
j = np.array([[2,1], [3,3]])

In [None]:
i

In [None]:
j

In [None]:
a[i,j] # i and j must have equal shape

In [None]:
a[i,2]

In [None]:
a[:,j]

***
### Búsqueda del máximo

In [None]:
data = np.sin(np.arange(20)).reshape(5,4)
data

In [None]:
# index of the maxima for each series
ind = data.argmax(axis=0)
ind

***
###  Asignación múltiple con indexación

In [None]:
a = np.arange(5)
a

In [None]:
a[[1,3,4]] = 0
a

In [None]:
# Se queda la última asignación
a = np.arange(5)
a[[0,0,2]] = [1,2,3]
a

***
### Indexado con arreglos booleanos

- Cuando indexamos arreglos con otros arreglos de índices (enteros), proporcionamos la lista de índices para elegir. Con los índices booleanos, el enfoque es diferente; **elegimos explícitamente qué elementos de la matriz queremos y cuáles no**.

La forma más natural en la que uno puede pensar para la indexación booleana es usar matrices booleanas que tengan la misma forma que la matriz original:

In [None]:
a = np.arange(12).reshape(3,4)
a

In [None]:
b = a > 4
b

In [None]:
a[b]

- También se puede utilizar en asignaciones:

In [None]:
a[b] = 0
a

***
# Álgebra lineal

In [None]:
a = np.array([[1.0, 2.0], [3.0, 4.0]])
a

In [None]:
a.transpose()

In [None]:
np.linalg.inv(a)

In [None]:
np.eye(2)

In [None]:
j = np.array([[0.0, -1.0], [1.0, 0.0]])

j @ j

In [None]:
y = np.array([[5.], [7.]])
y

In [None]:
np.linalg.solve(a, y)

In [None]:
# eigenvalores y eigenvectores
np.linalg.eig(a)

***
# Ejercicios propuestos

1. De las siguientes secciones, revisa las funciones de NumPy disponibles para darte una idea de lo que es posible hacer. 

    - [Array creation routines](https://numpy.org/devdocs/reference/routines.array-creation.html)

    - [Array manipulation routines](https://numpy.org/devdocs/reference/routines.array-manipulation.html)

    - [Binary operations](https://numpy.org/devdocs/reference/routines.bitwise.html)

    - [String operations](https://numpy.org/devdocs/reference/routines.char.html)
    

2. Crear un ejemplo de cómo guardar y cargar arreglos de un archivo binario `.npy` y `.npz`:

    - [NumPy binary files (NPY, NPZ)](https://numpy.org/devdocs/reference/routines.io.html#numpy-binary-files-npy-npz)
    
3. Crear un ejemplo de cómo guardar y cargar arreglos de un archivo de texto `.txt`:

    - [NumPy Text files](https://numpy.org/devdocs/reference/routines.io.html#text-files)    
    
4. Crear una función llamada `estimate` que lea un archivo CSV con 7 columnas, que corresponden a las variables $(x_{1i}, \ldots, x_{6i})$ y $y_i$. 

    - La función debe computar matricialmente los parámetros del modelo de regresión lineal: $y = X\beta$. 

    - Estos parámetros deben ser devueltos como un arreglo de NumPy. 

    - Utilice la función de lectura de archivos de NumPy.