# Fundamentos 2: Listas, tuples, diccionarios, y arreglos

Una secuencia es una colección ordenada de elementos. En el primer módulo de este curso vimos nuestra primera secuencia, la variable de tipo `str`, que es una colección ordenada de caracteres. En este segundo módulo, veremos dos nuevas secuencias: listas y tuples. También veremos un nuevo tipo de variable llamada diccionario, que es una colección de pares clave-valor (key-value). Finalmente veremos una variable muy útil en computación y álgebra lineal, el arreglo. Esta no es parte de Python, sino de la librería `numpy`.

## Listas

Una lista es una colección ordenada de elementos que pueden ser de diferent tipo. Para crear una lista, debemos incluir los elementos de la lista dentro de paréntesis cuadrados. Por ejemplo:

In [1]:
periodos = [252 ,"Triásico", 201, "Jurásico", 145, "Cretácico", 66, "Paleoceno"] # lista de números y strings
print(periodos) # despliegue la lista

[252, 'Triásico', 201, 'Jurásico', 145, 'Cretácico', 66, 'Paleoceno']


En este caso, nuestra lista contiene números y strings que representan el tope de periodos geólogicos y su edad en millones de años (Ma). La lista es una variable muy versatil. Por ejemplo, podemos añadir objetos a la lista:

In [2]:
periodos.insert(0, "Pérmico") # inserte Pérmico al comienzo de la lista
periodos.append(23) # añada 23 al final de la lista
periodos.extend(["Neoceno", 2.6, "Cuaternario", 0.0, "Antropoceno"]) # añada una lista al final de la lista 
print(periodos)

['Pérmico', 252, 'Triásico', 201, 'Jurásico', 145, 'Cretácico', 66, 'Paleoceno', 23, 'Neoceno', 2.6, 'Cuaternario', 0.0, 'Antropoceno']


También podemos eliminar objetos de la lista:

In [3]:
periodos.pop(-1) # remueva el último elemento de la lista. del periodos[-1] también funciona
print(periodos)

['Pérmico', 252, 'Triásico', 201, 'Jurásico', 145, 'Cretácico', 66, 'Paleoceno', 23, 'Neoceno', 2.6, 'Cuaternario', 0.0]


Podemos invertir el orden de los elementos en la lista: 

In [4]:
periodos.reverse() # invierta el orden de los elementos en la lista
print(periodos)

[0.0, 'Cuaternario', 2.6, 'Neoceno', 23, 'Paleoceno', 66, 'Cretácico', 145, 'Jurásico', 201, 'Triásico', 252, 'Pérmico']


Y por supuesto acceder a los elementos de la lista por su indice:

In [5]:
print(f"El periodo más antiguo de mi lista es {periodos[-1]} y terminó hace {periodos[-2]} Ma")

El periodo más antiguo de mi lista es Pérmico y terminó hace 252 Ma


Finalmente para saber el número de elementos en la lista, podemos usar el método `len`:

In [6]:
print(f"El número de periodos en mi lista es: {len(periodos) // 2}")

El número de periodos en mi lista es: 7


## Tuples

Un tuple es también una colección ordenada de elementos que pueden ser de diferent tipo. Sin embargo, un tuple es *inmutable*. Esto quiere decir que el tuple no puede ser cambiado después de su creación. Para crear un tuple, debemos incluir los elementos del tuple dentro de paréntesis. Por ejemplo:

In [7]:
periodos_fijos = (252 ,"Triásico", 201, "Cretácico", 66, "Paleoceno") # tuple de números y strings
print(periodos_fijos) # despliegue el tuple

(252, 'Triásico', 201, 'Cretácico', 66, 'Paleoceno')


Como el tuple es inmutable, no es posible adicionar o remover elementos del mismo. Tampoco es posible modificar elementos. El siguiente código resulta en un error:

In [None]:
periodos_fijos[2] = 200 # OJO, el tuple es inmutable y sus elementos no se pueden modificar

Los tuples sirven para guardar datos que no requieren ser cambiados durante la ejecución del código. Más tarde veremos que la forma (shape) de un arreglo es un tuple.

## Diccionarios

Los diccionarios consisten de una colección de pares clave-valor (key-value). Para crear un diccionario, debemos incluir los pares clave-valor dentro de llaves `{}`, con los pares separados por comas, y con el símbolo de dos puntos `:` separando cada clave de su valor. En un diccionario, el orden de los pares clave-valor no es importante; para obtener un valor podemos usar su clave. Construyamos un diccionario de periodos geológicos:

In [8]:
periodos = {"Pérmico":252, "Jurásico":145, "Paleoceno":23, "Cuaternario":0} # diccionario de periodos
print(periodos)

{'Pérmico': 252, 'Jurásico': 145, 'Paleoceno': 23, 'Cuaternario': 0}


Es fácil añadir periodos usando nuevos pares clave-valor:

In [9]:
# Añada otros periodos, o sea pares clave-valor
periodos["Triásico"] = 201
periodos["Cretácico"] = 66
periodos["Neoceno"] = 2.6

print(periodos)

{'Pérmico': 252, 'Jurásico': 145, 'Paleoceno': 23, 'Cuaternario': 0, 'Triásico': 201, 'Cretácico': 66, 'Neoceno': 2.6}


Es posible también remover elementos del diccionario. Por ejemplo:

In [10]:
del periodos["Cuaternario"] # remueva el periodo Cuaternario del diccionario
print(periodos)

{'Pérmico': 252, 'Jurásico': 145, 'Paleoceno': 23, 'Triásico': 201, 'Cretácico': 66, 'Neoceno': 2.6}


Y obtener una lista de las claves, valores, y elementos del diccionario:

In [11]:
print(periodos.keys(), "\n") # despliegue claves usando el método keys()
print(periodos.values(), "\n") # despliegue valores usando el método values()
print(periodos.items(), "\n") # despliegue elementos usando el método items()

dict_keys(['Pérmico', 'Jurásico', 'Paleoceno', 'Triásico', 'Cretácico', 'Neoceno']) 

dict_values([252, 145, 23, 201, 66, 2.6]) 

dict_items([('Pérmico', 252), ('Jurásico', 145), ('Paleoceno', 23), ('Triásico', 201), ('Cretácico', 66), ('Neoceno', 2.6)]) 



El sistema clave-valor es muy útil para extraer valores del diccionario. Por ejemplo:

In [12]:
dur_mes = periodos["Pérmico"] - periodos["Cretácico"] # duración del Mesozoico
print(f"El Mesozoico tiene una duración de {dur_mes} Ma")

El Mesozoico tiene una duración de 186 Ma


## Ejercicio

La siguiente tabla contiene la conversión de diferentes unidades de presión a Pascales (Pa, $N/m^2$):

|   Unidad   |    Pa    |
|:---        |:---      |
| atm        | 101325   |
| bar        | 1e5      |
| in Hg      | 3386.39  |
| in H20     | 249.09   |
| kPa        | 1e3      |
| MPa        | 1e6      |
| mbars      | 1e2      |
| mm Hg      | 133.32   |
| mm H20     | 9.81     |
| psi        | 6894.76  |
| torr       | 133.32   |

a. Construya un diccionario que represente esta tabla. Las claves del diccionario son las unidades de presión, y los valores son las unidades en Pa.

b. El tunel de Ryfylke en Noruega tiene 14.4 km de largo y su máxima profundidad es 292 m debajo del nivel del mar (dnm). Cual es la presión a esta profundidad en Pa? Use los siguientes valores: densidad del agua = 1000 $kg/m^3$, aceleración de la gravedad = 9.81 $m/s^2$.

c. Cual es la presión a esta profundidad en atm, mm Hg, y psi? Use el diccionario en a. 

In [13]:
# a. construya el diccionario de unidades de presión y valores en Pa
un_pres = {"atm":101325, "bar":1e5, "in Hg":3386.39, "in H2O":249.09, "kPa":1e3, 
         "MPa":1e6, "mbars":1e2, "mm Hg":133.32, "mm H2O":9.81, "psi":6894.76, "torr":133.32} 

# b. calcule la presión en el tunel a su máxima profundidad
dens_agua = 1000.0 # densidad del agua en kg/m^3
gravedad = 9.81 # gravedad en m/s^2
profundidad = 292 # máximal profundidad en m
pascal = dens_agua * gravedad * profundidad # presión en Pa

# c. presión en atm, mm Hg, y psi, utilizando nuestro diccionario
atm = pascal / un_pres["atm"]
mm_hg = pascal / un_pres["mm Hg"]
psi = pascal / un_pres["psi"]

# muestre los resultados
print(f"La presión en el tunel de Ryfilke a 292 m dnm es {pascal:.2f} Pa")
print(f"La presión en el tunel de Ryfilke a 292 m dnm es {atm:.2f} atm")
print(f"La presión en el tunel de Ryfilke a 292 m dnm es {mm_hg:.2f} mm Hg")
print(f"La presión en el tunel de Ryfilke a 292 m dnm es {psi:.2f} psi")

La presión en el tunel de Ryfilke a 292 m dnm es 2864520.00 Pa
La presión en el tunel de Ryfilke a 292 m dnm es 28.27 atm
La presión en el tunel de Ryfilke a 292 m dnm es 21486.05 mm Hg
La presión en el tunel de Ryfilke a 292 m dnm es 415.46 psi


## Arreglos

De forma similar a las listas, los arreglos son colecciones ordenadas de objetos. Los arreglos al igual que las listas son mutables (pueden modificarse después de su creación). Sin embargo, a diferencia de las listas, los arreglos contienen elementos del mismo tipo.

Los arreglos son parte fundamental de la librería `numpy`. Para construirlos debemos cargar la librería `numpy`, usar el método `array`, y pasar a este método una lista con los elementos del arreglo:

In [14]:
import numpy as np # cargue la libreria numpy con el alias np
arreglo = np.array([10, 20, 30, 40, 50]) # cree un arreglo con una lista de cinco números
print(arreglo)

[10 20 30 40 50]


A primera vista el arreglo se parece a una lista, es una colección de elementos dentro de paréntesis cuadrados. Cual es entonces su propósito? Porque no utilizar sólamente listas? Para responder esta pregunta, calculemos el seno de los elementos en el arreglo:

In [15]:
senos = np.sin(np.deg2rad(arreglo)) # senos de los elementos en arreglo
print(np.round(senos, 3)) # senos redondeados a 3 decimales

[0.174 0.342 0.5   0.643 0.766]


En una sola línea calculamos el seno de TODOS los elementos del arreglo. Con una lista no podemos hacer lo mismo. Imagine que tenemos cientos de elementos en un arreglo. En una sola línea de código es posible operar sobre todos ellos. Esto se llama vectorización y permite ejecutar operaciones en Python de una forma muy rápida.

Existen varios métodos en `numpy` para crear rápidamente arreglos:

In [16]:
ceros = np.zeros(10) # arreglo de 10 ceros
unos = np.ones(10) # arreglo de 10 unos
cincos = np.ones(10) * 5 # arreglo de 10 cincos
serie_1 = np.arange(1,11,1) # arreglo de 1 a 10 (11 - 1) con incremento de 1
serie_2 = np.linspace(1,10,10) # arreglo de 10 elementos entre 1 y 10, con incremento constante (1)

print(ceros)
print(unos)
print(cincos)
print(serie_1)
print(serie_2)

[0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]
[5. 5. 5. 5. 5. 5. 5. 5. 5. 5.]
[ 1  2  3  4  5  6  7  8  9 10]
[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]


Note que `serie_1` y `serie_2` son iguales, pero fueron construidos con dos métodos diferentes. `arange` construye una serie entre un número inicial (1) y un número final (11), con un incremento dado (1). Note que la serie no llega hasta el número final, sino hasta el número final menos el incremento (11 - 1 = 10). `linspace` construye una serie entre un número inicial (1) y un número final (10), con un número especificado de elementos (10), y un incremento constante (1). Note que la serie llega hasta el número final. 

## Arreglos en 2D

Los arreglos bidimensionales son colecciones de arreglos unidimensionales:

In [17]:
arreglo = np.array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9], [10, 11, 12, 13, 14], [15, 16, 17, 18, 19], 
                    [20, 21, 22, 23, 24], [25, 26, 27, 28, 29]]) # un arreglo 2D con 6 filas y 5 columnas
print(arreglo)

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]
 [20 21 22 23 24]
 [25 26 27 28 29]]


Podemos construir el mismo arreglo de una forma más sencilla a partir de un arreglo 1D y usando el método `reshape`:

In [18]:
arreglo_1d = np.arange(0, 30) # arreglo de 0 a 29 en incrementos de 1
arreglo = np.reshape(arreglo_1d, (6, 5)) # reorganice arreglo_1d a un arreglo 2D con 6 filas y 5 columnas
print(arreglo)

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]
 [20 21 22 23 24]
 [25 26 27 28 29]]


Un gabinete de biblioteca es una buena representación de un arreglo 2D:

![arreglos-2.jpg](attachment:arreglos-2.jpg)

El gabinete representa un arreglo de 6 filas y 5 columnas, similar al arreglo que construimos anteriormente. Note que las filas y las columnas comienzan en `0`.  Es posible, seleccionar elementos individuales del arreglo (figura izquierda), una fila (figura centro), o una columna (figura derecha):

In [19]:
print(arreglo[2,2]) # despliegue elemento en la tercera fila y tercera columna del arreglo
print(arreglo[3,:]) # despliegue la cuarta fila del arreglo
print(arreglo[:,3]) # despliegue la cuarta columna del arreglo

12
[15 16 17 18 19]
[ 3  8 13 18 23 28]


Al seleccionar filas y columnas, estamos rebanando (slicing) el arreglo. Asi mismo, es posible seleccionar algunos elementos de una fila o columna:

In [20]:
print(arreglo[3,1:4]) # despliegue segunda a cuarta columnas de la cuarta fila del arreglo
print(arreglo[1:4,3]) # despliegue segunda a cuarta filas de la cuarta columna del arreglo

[16 17 18]
[ 8 13 18]


Finalmente, para saber el número de filas y columnas de un arreglo podemos usar su atributo `shape`. Este provee un tuple, donde el primer elemento del tuple es el número de filas, y el segundo elemento es el número de columnas:

In [21]:
print(f"Número de filas en arreglo = {arreglo.shape[0]}") # número de filas en el arreglo
print(f"Número de columnas en arreglo = {arreglo.shape[1]}") # número de columnas en el arreglo

Número de filas en arreglo = 6
Número de columnas en arreglo = 5


## Arreglos en 3D

Los arreglos tridimensionales funcionan de la misma forma; son arreglos de arreglos 2D:

In [22]:
arreglo = np.arange(24).reshape(2,3,4) # arreglo de 2 x 3 x 4 
print(arreglo)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]


`arreglo` contiene dos arreglos 2D. El código siguiente extrae elementos del arreglo:

In [23]:
print(arreglo[0], "\n") # despliegue primer arreglo 2D
print(arreglo[1], "\n") # despliegue segundo arreglo 2D
print(arreglo[0,1], "\n") # despliegue segunda fila del primer arreglo 2D  
print(arreglo[1,:,2], "\n") # despliegue tercera columna del segundo arreglo 2D  

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]] 

[[12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]] 

[4 5 6 7] 

[14 18 22] 



Finalmente, podemos encontrar la forma del arreglo usando su atributo `shape`:

In [24]:
# capas (layers), filas, y columnas en arreglo
print(f"No. capas = {arreglo.shape[0]}, filas = {arreglo.shape[1]} y columnas {arreglo.shape[2]}")

No. capas = 2, filas = 3 y columnas 4


Un buen ejemplo de un arreglo 3D es un cubo sísmico, el cual contiene amplitudes en `i` secciones de tiempo, `j` secciones en línea, y `k` secciones en cruce.

## Operaciones con arreglos

### Operaciones elemento por elemento

Estas son operaciones que involucran un arreglo y un escalar, o dos arreglos de igual forma. Por ejemplo:

In [25]:
a = np.array([[1, 2, 3], [4, 5, 6]]) # arreglo de 2 filas y 3 columnas
print(a + 2, "\n") # arreglo más un escalar
print(a - 2, "\n") # arreglo menos un escalar
print(a * 2, "\n") # arreglo por un escalar
print(a / 2, "\n") # arreglo dividido un escalar
print(a ** 2, "\n") # arreglo elevado a un escalar

[[3 4 5]
 [6 7 8]] 

[[-1  0  1]
 [ 2  3  4]] 

[[ 2  4  6]
 [ 8 10 12]] 

[[0.5 1.  1.5]
 [2.  2.5 3. ]] 

[[ 1  4  9]
 [16 25 36]] 



In [26]:
b = np.array([[6, 5, 4], [3, 2, 1]]) # otro arreglo de 2 filas y 3 columnas
print(a + b, "\n") # arreglo más otro arreglo
print(a - b, "\n") # arreglo menos otro arreglo
print(a * b, "\n") # arreglo por otro arreglo
print(a / b, "\n") # arreglo dividido otro arreglo
print(a ** b, "\n") # arreglo elevado a otro arreglo

[[7 7 7]
 [7 7 7]] 

[[-5 -3 -1]
 [ 1  3  5]] 

[[ 6 10 12]
 [12 10  6]] 

[[0.16666667 0.4        0.75      ]
 [1.33333333 2.5        6.        ]] 

[[ 1 32 81]
 [64 25  6]] 



## Algebra lineal

El álgebra lineal es muy importante en geociencias. La librería `numpy` contiene varios métodos de álgebra lineal, algunos de ellos en el módulo `linalg`. Veamos algunos ejemplos:

In [27]:
u = np.array([1, 2, 3]) # vector u (1x3)
v = np.array([4, 5, 6]) # vector v (1x3)

mag_u = np.linalg.norm(u) # magnitud de u -> numpy método linalg.norm()
print(f"Magnitud de u = {mag_u:.3f}") # despliegue magnitud de u

Magnitud de u = 3.742


In [28]:
uu = u / mag_u # divida el vector u por su magnitud para convertirlo en un vector unitario uu
print(f"Magnitud de uu = {np.linalg.norm(uu):.3f}") # la magnitud de uu debe ser 1.0

Magnitud de uu = 1.000


In [29]:
producto_punto = np.dot(u, v) # producto punto de u y v -> numpy método dot(), resultado es un escalar
print(f"u . v = {producto_punto:.3f}")

u . v = 32.000


In [30]:
producto_cruz = np.cross(u, v) # producto cruz de u y v -> numpy método cross(), resultado es un vector
print(f"u x v = {producto_cruz}")

u x v = [-3  6 -3]


In [31]:
# cree dos matrices conformables
# columnas en ma = filas en mb
ma = np.array([[1, 2, 3], [4, 5, 6]]) # 2 x 3 matrix
mb = np.array([[7, 8], [9, 10], [11, 12]]) # 3 x 2 matrix

mc = np.dot(ma, mb) # multiplique las matrices -> numpy método dot(), resultado es una matriz 2 x 2
print(mc)

[[ 58  64]
 [139 154]]


In [32]:
# cree una matriz cuadrada (no. filas = no. columnas) de 3 x 3
md = np.array([[1, 7, 9], [3, 5, 8], [4, 2, 6]]) # matriz 3 x 3

# calcule la determinante de la matriz -> numpy método linalg.det(), resultado es un escalar
determinante = np.linalg.det(md) 
print(f"{determinante:.3f}") 

-14.000


In [33]:
inversa = np.linalg.inv(md) # calcule la inversa de la matriz
print(np.round(inversa,3)) 

[[-1.     1.714 -0.786]
 [-1.     2.143 -1.357]
 [ 1.    -1.857  1.143]]


In [34]:
# La matriz multiplicada por su inversa es igual a la matriz de identidad
# esta es una matriz con 1s en la diagonal y 0s fuera de la diagonal
identidad = np.dot(md, inversa)
print(np.round(identidad, 3))

[[ 1.  0. -0.]
 [ 0.  1.  0.]
 [ 0.  0.  1.]]


## Ejercicio (opcional)

El problema de los tres puntos es un problema básico de geología. La idea es determinar la orientación de un plano, a partir de las coordenadas x (este), y (norte), y z (arriba) de tres puntos en el plano. El método es sencillo. Primero, necesitamos describir el plano con una ecuación:

$z=m_xx+m_yy+z_0$

$x$, $y$, $z$ son las coordenadas este, norte, y arriba, $m_x$ y $m_y$ son las pendientes del plano en las direcciones este y norte, y $z_0$ es la elevación del plano en el origen de coordenadas. Para los tres puntos en el plano tenemos las siguientes ecuaciones:

$z_1=m_xx_1+m_yy_1+z_0$

$z_2=m_xx_2+m_yy_2+z_0$

$z_3=m_xx_3+m_yy_3+z_0$

las cuales pueden ser escritas como matrices:

$\left [\begin{matrix}z_1  \\ z_2  \\z_3 \end{matrix}\right ]=\left [\begin{matrix}x_1 & y_1 & 1 \\ x_2 & y_2 & 1 \\x_3 & y_3 & 1\end{matrix}\right ]\left [\begin{matrix}m_x \\ m_y \\z_0\end{matrix}\right]$

y usando una notación más corta como:

$\mathbf{b}=\mathbf{A}\mathbf{x}$

Debemos encontrar el vector $\mathbf{x}$. Para eso, podemos hacer lo siguiente:

$\mathbf{x}=\mathbf{A}^{-1}\mathbf{b}$

donde $\mathbf{A}^{-1}$ es la inversa de la matriz $\mathbf{A}$. 

Consideremos el siguiente problema: Tres pozos cruzan una capa rica en hierro en las siguientes coordenadas (este, norte, y arriba en metros):

pozo_1 = [393, 2374, 550];    pozo_2 = [1891, 2738, 650];  pozo_3 = [2191, 1037, 450]

1. Calcule la pendiente (en grados) de la capa en las direcciones este y norte.  
2. Un nuevo pozo se planea construir en una localidad con coordenadas [500, 500, 1000] (este, norte, y arriba en metros). A que profundidad encontrará el pozo la capa?

In [35]:
# Solución
b = np.array([550, 650, 450]) # vector b con las coordenadas z de los pozos
A = np.array([[393, 2374, 1], [1891, 2738, 1], [2191, 1037, 1]]) # matriz A con las coordenadas x, y de los pozos

A_inv = np.linalg.inv(A) # calcule la inversa de la matriz A

x = np.dot(A_inv, b) # determine el vector x, multiplicando A_inv por b

pendientes = np.degrees(np.arctan(x)) # 1. calcule las pendientes en grados

# despliegue las pendientes en grados
print(f"Pendiente hacia el este = {pendientes[0]:.1f} grados, y hacia el norte = {pendientes[1]:.1f} grados")

pozo = np.array([500, 500, 1000]) # coordenadas del nuevo pozo
z_capa = x[0]*pozo[0] + x[1]*pozo[1] + x[2] # calcule la elevación de la capa en el nuevo pozo
d_capa = pozo[2] - z_capa # 2. calcule la profundidad de la capa en el nuevo pozo

# despliegue la profundidad de la capa en el nuevo pozo
print(f"Profundidad de la capa en el nuevo pozo = {d_capa:.1f} m")

Pendiente hacia el este = 2.1 grados, y hacia el norte = 7.1 grados
Profundidad de la capa en el nuevo pozo = 678.5 m
