<span style="color:lightgreen; font-size:30px">**PG001 - Fundamentos de Python**</span>
***
<span style="color:gold; font-size:30px">**Estructuras de datos**</span>
***

<span style="font-size:20px"> **Autor: Kevin Alexander Gómez** </span>

<span style="font-size:16px"> **Contacto: kevinalexandr19@gmail.com | [Linkedin](https://www.linkedin.com/in/kevin-alexander-g%C3%B3mez-2b0263111/) | [Github](https://github.com/kevinalexandr19)** </span>
***

Bienvenido al curso PG001 - Fundamentos de Python!!!

Vamos a revisar las bases de la programación en el lenguaje Python a través de <span style="color:gold">ejemplos en Geología</span>.\
Es necesario que tengas un conocimiento previo en geología general, matemática y estadística.

<span style="color:lightgreen"> Este notebook es parte del proyecto [**Python para Geólogos**](https://github.com/kevinalexandr19/manual-python-geologia), y ha sido creado con la finalidad de facilitar el aprendizaje en Python para estudiantes y profesionales en el campo de la Geología. </span>

En el siguiente índice, encontrarás los temas que componen este notebook:

<span style="font-size:20px"> **Índice** </span>
***
- [¿Por qué debemos aprender a usar estructuras de datos?](#parte-1)
- [Listas, tuplas y conjuntos](#parte-2)
- [Indexing y Slicing](#parte-3)
- [Diccionarios](#parte-4)
- [En conclusión...](#parte-5)
***

Antes de empezar tu camino en programación geológica...\
Recuerda que puedes ejecutar un bloque de código usando `Shift` + `Enter`:

In [None]:
2 + 2

Si por error haces doble clic sobre un bloque de texto (como el que estás leyendo ahora mismo), puedes arreglarlo usando también `Shift` + `Enter`.
***

<a id="parte-1"></a>

### <span style="color:lightgreen">**¿Por qué debemos aprender a usar estructuras de datos?**</span>
***

Aprender a usar estructuras de datos en Python es importante por varias razones.

Primero, las estructuras de datos son fundamentales en la programación, ya que permiten almacenar, organizar y acceder a grandes cantidades de datos de manera eficiente.\
Al elegir la estructura de datos correcta, podemos mejorar significativamente la eficiencia y el rendimiento de nuestro código.

En segundo lugar, las estructuras de datos son importantes en Python para la geología, ya que los geólogos a menudo manejan grandes cantidades de datos geoespaciales, como datos de sensores remotos, modelos geológicos, información sobre terremotos y volcanes, etc.

<span style="color:#43c6ac">Si empleamos las estructuras de datos adecuadas, lograremos procesar y analizar datos de manera más eficiente, lo que puede llevar a descubrimientos y conclusiones más precisas y significativas.</span>

Las principales estructuras de datos usados en Python son: <span style="color:gold">listas, tuplas, diccionarios y conjuntos</span>.

<a id="parte-2"></a>

### <span style="color:lightgreen">**Listas, tuplas y conjuntos**</span>
***

Las <span style="color:gold">listas</span> son uno de los tipos de datos más útiles en Python para la manipulación de datos en Geología y en cualquier otra ciencia que involucre grandes conjuntos de datos.

Una lista es una **colección ordenada de elementos**, donde cada elemento puede ser de cualquier tipo de datos, incluyendo números, cadenas de texto, listas, diccionarios, entre otros.\
<span style="color:#43c6ac">Las listas se pueden crear utilizando corchetes `[]` y separando los elementos con comas.</span>

En Geología, las listas son útiles para almacenar datos como coordenadas geográficas, mediciones de propiedades físicas y químicas de rocas y minerales, y registros de eventos geológicos.\
Además, las listas se pueden utilizar para realizar operaciones matemáticas y estadísticas en conjuntos de datos geológicos.

Existe una gran cantidad de funciones y métodos incorporados para manipular listas, como agregar o eliminar elementos, ordenar y buscar elementos, y realizar operaciones en cada elemento de una lista

***
**Ejemplo: Colección de minerales** \
Supongamos que tenemos una colección con los siguientes minerales: pirita, cuarzo, galena y calcopirita.\
Podemos representar esta lista en Python de la siguiente manera:

In [None]:
minerales = ["pirita", "cuarzo", "galena", "calcopirita"]
print(minerales)

Si a la colección le agregamos el mineral esfalerita, podemos usar el método `append` para añadir dicho elemento a la lista:

In [None]:
minerales.append("esfalerita")
print(minerales)

> Si volvemos a ejecutar otra vez el bloque anterior, la lista tendrá dos veces el elemento "esfalerita".

In [None]:
minerales.append("esfalerita")
print(minerales)

Para eliminar un elemento de la lista, podemos usar el método `remove`:
> Este método remueve el primer elemento dentro de la lista que contenga el término señalado.

In [None]:
minerales.remove("esfalerita")
print(minerales)

Si queremos agregar dos minerales nuevos a la colección: acantita y muscovita, podemos usar el método `extend`:

In [None]:
minerales.extend(["acantita", "muscovita"])
print(minerales)

Por último, si quiero saber cuantos minerales tiene la colección en total, usamos la función `len`:
> La función `len` se utiliza para calcular el total de elementos en cualquier tipo de estructura.

In [None]:
len(minerales)

***
**Pregunta: ¿Podemos evaluar si un elemento pertenece a una lista?** \
Respuesta: Sí, evaluaremos si un mineral se encuentra dentro de una lista de minerales usando la palabra reservada `in`:

In [None]:
minerales = ["pirita", "cuarzo", "galena"]

"cuarzo" in minerales

De igual forma, podemos evaluar si un caracter específico pertenece a un string:

In [None]:
"presente" in "El presente es la clave del pasado"

También podemos evaluar la cantidad de caracteres que contiene un string:

In [None]:
len("El presente es la clave del pasado")

***
**Ejemplo: Datos geoquímicos** \
Tenemos la siguiente lista con concentraciones de Au en ppm:

In [None]:
au_ppm = [10.1, 2.0, 0.4, 11.7, 6.3, 1.3, 0.1, 2.6, 8.1, 7.0]

Vamos a calcular el promedio de las concentraciones dividiendo la suma de los elementos entre la cantidad total.

Para calcular la suma de todos los elementos, usaremos la función `sum`:

In [None]:
suma = sum(au_ppm)
print(suma)

Ahora lo dividiremos entre el total de elementos (calculado con la función `len`) para obtener el promedio:

In [None]:
promedio = suma / len(au_ppm)
print(f"El promedio de concentración de Au es {promedio} ppm")

También podemos mostrar el valor mínimo y máximo de concentración de Au en la lista usando las funciones `min` y `max` respectivamente:

In [None]:
print(f"El valor mínimo de concentración de Au en la lista es de {min(au_ppm)} ppm")
print(f"El valor máximo de concentración de Au en la lista es de {max(au_ppm)} ppm")

También podemos ordenar los elementos en la lista de menor a mayor y viceversa, usando la función `sorted`:

In [None]:
sorted(au_ppm)

Para ordenarlos al revés (de mayor a menor), agregaremos el parámetro `reverse=True`:

In [None]:
sorted(au_ppm, reverse=True)

***
**Pregunta: ¿Una lista puede tener elementos repetidos?** \
Respuesta: Sí, y podemos usar el método `count` para contar el número de elementos repetidos:

In [None]:
rocas = ["diorita", "granito", "diorita", "granodiorita", "diorita", "granito", "basalto"]

rocas.count("diorita")

***

Las <span style="color:gold">tuplas</span> se utilizan para almacenar colecciones ordenadas e inmutables de elementos.

En Geología, las tuplas pueden ser útiles para almacenar datos geográficos que no cambian, como coordenadas geográficas, fechas y nombres de regiones geológicas.

<span style="color:#43c6ac">Las tuplas se pueden crear utilizando paréntesis `()` y separando los elementos con comas.</span>

Al ser inmutables, las tuplas no se pueden modificar una vez son creadas.\
Esto los hace seguros para su uso en aplicaciones donde la integridad de los datos es importante.

> Nota: Podemos usar algunas funciones como `len`, `sum`, `min`, `max`, etc. en las tuplas.

***
**Ejemplo: Coordenadas geográficas** \
Las tuplas se pueden utilizar para almacenar las coordenadas geográficas de un lugar específico.\
Por ejemplo, una tupla de dos elementos se puede usar para almacenar la latitud y longitud de un lugar en grados decimales:

In [None]:
coordenadas = (32.715, -117.161)
print(coordenadas)

***
**Ejemplo: Fechas geológicas** \
Las tuplas también se pueden utilizar para almacenar fechas geológicas.\
Por ejemplo, una tupla de tres elementos se puede usar para almacenar la edad, el período y la época de un evento geológico:

In [None]:
fecha_geologica = (145, "Jurásico", "Oxfordiense")
print(fecha_geologica)

***
Los <span style="color:gold">conjuntos</span> son estructuras de datos utilizadas para almacenar colecciones de elementos únicos e inmutables.

Por ejemplo, podemos crear un conjunto a partir de una lista con minerales repetidos:

In [None]:
minerales = set(["pirita", "cuarzo", "galena", "cuarzo", "calcopirita", "cuarzo", "pirita"])

Notaremos que el conjunto solamente almacenó los elementos únicos:

In [None]:
print(minerales)

***
**Ejemplo: Ensambles minerales** \
Tenemos dos diferentes ensambles de alteración mineral, podemos realizar operaciones de conjuntos como la unión o intersección para averiguar que minerales hay en total o en común:

In [None]:
ensamble_A = {"cuarzo", "pirita", "epídota", "cloritas", "calcita", "sericita"}
ensamble_B = {"cuarzo", "cloritas", "feldespato", "biotita", "pirita", "sericita"}

In [None]:
# Minerales en total para ambos ensambles
print(ensamble_A.union(ensamble_B))

In [None]:
# Minerales en común en ambos ensambles
print(ensamble_A.intersection(ensamble_B))

También podemos usar los operadores `|` para la unión, `&` para la intersección, `-` para la diferencia y `^` para la diferencia simétrica:

In [None]:
# Unión
print(ensamble_A | ensamble_B)

In [None]:
# Intersección
print(ensamble_A & ensamble_B)

In [None]:
# Diferencia entre A y B
print(ensamble_A - ensamble_B)

In [None]:
# Diferencia entre B y A
print(ensamble_B - ensamble_A)

In [None]:
# Diferencia simétrica
print(ensamble_A ^ ensamble_B)

***

<a id="parte-3"></a>

### <span style="color:lightgreen">**Indexing y Slicing**</span>
***

**¿Podemos seleccionar elementos específicos dentro de una lista?** \
La respuesta es sí, para esto usamos dos técnicas conocida en inglés como <span style="color:gold">indexing</span> y <span style="color:gold">slicing</span>:

Estas técnicas consisten en extraer una sección de una secuencia (como una lista, una cadena o una tupla) utilizando un conjunto de índices específicos.\
Cuando se extrae un solo elemento estamos haciendo **indexing** y cuando son varios elementos estamos haciendo **slicing**.\
Los índices se utilizan para seleccionar un subconjunto de elementos de la secuencia, y se pueden utilizar para extraer una porción de la secuencia de varias formas.

Para hacer "slicing", debemos utilizar el operador de corchetes `[]` y dos puntos `:`.\
El operador de corchetes se utiliza para acceder a un elemento individual de la secuencia, mientras que el uso del operador de corchetes con dos puntos indica que se está realizando un "slicing".

```python
secuencia[(índice inicial) : (índice final) : (número de pasos entre posición)]
```

El operador de corchetes con dos puntos, usado en slicing, puede recibir hasta tres valores: índice inicial, índice final (sin incluir este elemento) y el número de índices a saltar en cada paso.

El índice inicial determina el primer elemento de la sección, mientras que el índice final señala la posición inmediatamente posterior al último elemento que se desea incluir. El tercer valor, también llamado paso, define el intervalo de selección entre los elementos, es decir, cuántos elementos se omitirán en la secuencia antes de seleccionar el siguiente.

<span style="color:#43c6ac">Es importante tener en cuenta que el elemento cuya posición corresponde al índice final no entrará en la secuencia resultante.</span>

***
**Ejemplo: Selección de minerales** \
Supongamos que tenemos una colección de minerales: cuarzo, pirita, galena, esfalerita, muscovita y feldespato.

In [None]:
minerales = ["cuarzo", "pirita", "galena", "esfalerita", "muscovita", "feldespato"]

Podemos seleccionar uno o varios elementos de la lista de la siguiente forma:
> El orden numérico de los índices en una secuencia empieza desde el cero (0, 1, 2, 3, ...) y en sentido inverso, empieza desde -1.

In [None]:
# Primer elemento: cuarzo
minerales[0]

In [None]:
# Segundo elemento: pirita
minerales[1]

In [None]:
# Último elemento: feldespato
minerales[-1]

In [None]:
# Del segundo al cuarto elemento: pirita, galena y esfalerita
minerales[1:4]

In [None]:
# Del antepenúltimo al último elemento: esfalerita, muscovita, muscovita
minerales[-3:]

In [None]:
# Elementos seleccionados de 2 en 2: cuarzo, galena, muscovita
minerales[::2]

Podemos invertir el orden de la lista de la siguiente forma:

In [None]:
# Elementos del último al primero: feldespato, muscovita, esfalerita, galena, pirita, cuarzo
print(minerales)
print(minerales[::-1])

Podemos hacer slicing de la nueva lista seleccionada agregando otro par de corchetes `[]` y los índices a usar:

In [None]:
# Del segundo al cuarto elemento, en sentido inverso: muscovita, esfalerita, galena, pirita
minerales[1:4][::-1]

***

<a id="parte-4"></a>

### <span style="color:lightgreen">**Diccionarios**</span>
***

Los <span style="color:gold">diccionarios</span> nos permiten almacenar y acceder a datos de una manera eficiente y flexible.


<span style="color:#43c6ac">En geología, los diccionarios pueden ser muy útiles para almacenar información sobre muestras de roca, yacimientos, fósiles, etc.</span>

Un diccionario se define con llaves `{}` y pares clave-valor separados por dos puntos `:`.\
Cada par clave-valor representa un elemento del diccionario, donde la clave es un identificador único que se utiliza para acceder al valor correspondiente.

***
**Ejemplo: Muestra de roca** \
El siguiente diccionario contiene información acerca de una muestra de roca:

In [None]:
muestra = {"id": 1234, "tipo": "sedimentaria", "edad": 300, "localidad": "Cerro Negro"}
print(muestra)

El diccionario `muestra` contiene 4 llaves: `id`, `tipo`, `edad` y `localidad`, con sus respectivos valores asociados.\
Si queremos saber la edad de la muestra, usaremos corchetes `[]` y el nombre de la llave para extraer dicho valor:

In [None]:
muestra["edad"]

Este código mostrará la edad asociada a la clave `edad` en el diccionario `muestra`.

<span style="color:#43c6ac">Los diccionarios también pueden ser utilizados para almacenar información más compleja, como listas o diccionarios anidados.</span>

Por ejemplo, podemos modificar el diccionario anterior para incluir una lista de minerales presentes en la muestra:

In [None]:
muestra = {"id": 1234, "tipo": "sedimentaria", "edad": 300, "localidad": "Cerro Negro", 
           "minerales": ["cuarzo", "feldespato", "mica"]}
print(muestra)

En este caso, `minerales` es la clave y la lista de tres minerales es el valor correspondiente.\
Podemos acceder a los elementos de la lista utilizando la clave `minerales`, de la siguiente manera:

In [None]:
muestra["minerales"]

In [None]:
# El primer mineral de la muestra
muestra["minerales"][0]

***
**Ejemplo: Mineralogía de una roca** \
Crearemos un diccionario que contenga la composición mineralógica de una muestra:

In [None]:
muestra = {"cuarzo": 35, "feldespato": 20, "plagioclasas": 30, "micas": 10}
print(muestra)

Como podemos ver, cada elemento de la muestra está compuesto por una **clave** (nombre del mineral) y un **valor** (porcentaje en la muestra).\
Podemos seleccionar el porcentaje de un mineral de la siguiente forma:

In [None]:
muestra["cuarzo"]

Y también podemos modificar el valor del porcentaje:

In [None]:
print(muestra)
muestra["cuarzo"] = 40
print(muestra)

Podemos obtener el porcentaje de un mineral incluso si no ha sido indicado previamente (por ejemplo, pirita).\
Para esto, usaremos el método `get` e incluiremos un valor de porcentaje por defecto:

In [None]:
muestra.get("pirita", 0)

Ahora, crearemos un nuevo elemento en el diccionario:

In [None]:
print(muestra)
muestra["pirita"] = 0
print(muestra)

Puedo extraer las claves del diccionario con el método `keys`:

In [None]:
print(muestra.keys())

Y los valores con `values`:

In [None]:
print(muestra.values())

También podemos extraer las claves y valores agrupados en una secuencia de tuplas con `items`:

In [None]:
print(muestra.items())

Para transformar este resultado a una lista, podemos usar la función `list`:

In [None]:
list(muestra.keys())

***
**Ejemplo: F-strings en Muestra de roca** \
Crearemos un diccionario para almacenar información sobre una muestra de roca:

In [None]:
roca = {"nombre": "Granito", 
        "textura": "Fina a media",
        "color": "Blanco, rosa, gris", 
        "composición": ["Cuarzo", "Feldespato", "Mica"], 
        "edad": "Proterozoico", 
        "yacimiento": "Sierra de Nevada"}
print(roca)

Y usaremos f-strings para mostrar información de la muestra como su color y edad:

In [None]:
nombre = roca["nombre"]
color = roca["color"]
edad = roca["edad"]

print(f"El color de la muestra de {nombre} es {color}")
print(f"La edad de la muestra de {nombre} es {edad}")

Para evitar errores de interpretación en Python, es preferible usar comillas diferentes a las del f-string cuando se extraiga un elemento de un diccionario:

In [None]:
print(f"El color de la muestra de {roca['nombre']} es {roca['color']}")

***
**Ejemplo: Estimación de reservas minerales** \
Supongamos que tenemos un diccionario con información de yacimientos minerales de cobre:

In [None]:
yacimientos = {"yacimiento A": {"mineral": "cobre", "reservas": 100000, "ubicación": "Chile"},
               "yacimiento B": {"mineral": "cobre y plata", "reservas": 50000, "ubicación": "Perú"},
               "yacimiento C": {"mineral": "cobre y oro", "reservas": 20000, "ubicación": "Ecuador"}}
print(yacimientos)

En este diccionario, las claves son los nombres de los yacimientos, y los valores son diccionarios anidados que contienen información sobre el tipo de mineral encontrado, las reservas estimadas y la ubicación del yacimiento.

Podemos calcular las reservas totales sumando las reservas de cada uno de los tres yacimientos:

In [None]:
reservaA = yacimientos["yacimiento A"]["reservas"]
reservaB = yacimientos["yacimiento B"]["reservas"]
reservaC = yacimientos["yacimiento C"]["reservas"]

reservas = reservaA + reservaB + reservaC
print(f"Las reservas totales de los yacimientos de Cu son de {reservas:,} tn.")

***

<a id="parte-5"></a>

### <span style="color:lightgreen">**En conclusión...**</span>
***

*Las listas, tuplas, diccionarios y conjuntos son herramientas muy útiles para almacenar y acceder a información en Python.*
- *Las listas son modificables, lo que significa que se pueden agregar, eliminar y actualizar elementos en la lista.*
- *Las tuplas son similares a las listas, pero a diferencia de estas, son inmutables, lo que significa que no se pueden modificar después de su creación.*
- *Los diccionarios son útiles para almacenar datos estructurados en pares de clave-valor.*
- *Los conjuntos almacenan valores únicos y se pueden operar de acuerdo a la teoría de conjuntos.*

<span style="color:#43c6ac">*En Geología, las estructuras de datos pueden ser utilizadas para almacenar y manipular información sobre muestras de roca, yacimientos, fósiles, entre otros.*</span>
    
<span style="color:#43c6ac">*Cada estructura de datos tiene sus propias ventajas y desventajas, y la elección dependerá del tipo de datos y el propósito de la aplicación.\
    La comprensión y la habilidad de trabajar con estas estructuras pueden mejorar significativamente la eficiencia y la capacidad de análisis en la investigación geológica.* </span>

***