# **Manual de Python aplicado a la Geología**
***

### **Editado por: Kevin Alexander Gómez**
#### Contacto: kevinalexandr19@gmail.com | [Linkedin](https://www.linkedin.com/in/kevin-alexander-g%C3%B3mez-2b0263111/) | [Github](https://github.com/kevinalexandr19)
***

### **Versión: 1.1 (Noviembre 2021)**

<br>

***
### **Introducción**

El [**Manual de Python aplicado a la Geología**](https://github.com/kevinalexandr19/manual-python-geologia) ha sido creado con la finalidad de facilitar el aprendizaje en Python para estudiantes y profesionales en el campo de la Geología.

### **¿Qué voy a hacer?**
Usando este manual, desarrollarás código en Python orientado al campo de la Geología.

### **¿Qué voy a aprender?**

- Aprenderás a desarrollar código usando Python.
- Desarrollarás el pensamiento algorítmico.
- Aprenderás a usar Python para solucionar problemas en Geología.

### **¿Qué voy a necesitar?**

- Este manual.
> **Nota**: Este documento es un archivo de formato `.ipynb` y solo puedes interactuar con este notebook siguiendo alguna de estas opciones:
> 
> - A través de un navegador web, usando la aplicación de `Google Colab`.
> - Usando `Binder`, una aplicación web que permite ejecutar código arbitrario dentro de un entorno virtual (similar a `Google Colab`).
> - A través de un editor de código instalado en tu computadora, como por ejemplo: `Jupyter Lab`, `Jupyter Notebook` o `Visual Studio Code`.\
> Si no tienes instalado `Python`, puedes seguir las indicaciones del archivo `Anexos.ipynb`.
- Conocimientos básicos en geología, estadística y álgebra lineal.
- Perseverancia para aprender cada tema y creatividad para resolver problemas.

<br>

## **Índice**
***

1. [Tipos de datos e identificadores](#parte1)
2. [Matemáticas en Python](#parte2)
3. [Funciones input y print](#parte3)
4. [Condicionales](#parte4)
5. [Listas](#parte5)
6. [Tuplas](#parte6)
7. [Diccionarios](#parte7)
8. [Bucles](#parte8)
9. [Funciones](#parte9)
10. [Clases y objetos](#parte10)
11. [Numpy](#parte11)
12. [Matplotlib](#parte12)
13. [Pandas](#parte13)
14. [Ejercicios](#parte14)

***

<a id="parte1"></a>

## **1. Tipos de datos e identificadores**
***

**Los datos son unidades de información, recogidas a través de la observación de un objeto o proceso.**

En Python, existen diferentes formas de representar datos (tanto numéricos como no numéricos).\
Por ejemplo, si queremos representar el número de muestras analizadas en un laboratorio, usaremos un **integer**:

> **Nota: para ejecutar un bloque con código (como el que está debajo), presiona `shift` + `Enter`.**

In [None]:
25

> **¿Qué es un integer?** \
> Un integer es un objeto en Python que representa a los números enteros.

Si queremos asignar este número a una variable, usaremos un **identificador** llamado `muestras`.\
El símbolo `=` se usa para indicar la acción de asignarle nombre a un objeto:

In [None]:
muestras = 25

Un **identificador** es un nombre usado para *identificar* un objeto dentro de Python.\
**Nota:** Los identificadores deben empezar con una letra (de la A hasta la Z) o con un guión abajo `_`.

Para observar el número de muestras debemos de llamar el identificador:

In [None]:
muestras

Ahora, ¿cómo representamos la *concentración elemental de oro (Au)* en una muestra?\
Para este caso, usaremos un **float** y lo asignaremos a una variable llamada `ley_au`.\
**Nota:** Ten en cuenta que `ley_au` guarda el número mas no indica el tipo de unidad (que para este caso, serían *partes por millón* o *ppm*).

In [None]:
ley_au = 0.56

> **¿Qué es un float?** \
> Un float es un objeto en Python que representa números con fracción decimal.

Ahora ya sabemos como crear valores numéricos dentro de Python usando integers y floats.

¿Y qué pasa si queremos guardar un dato no numérico como por ejemplo, el nombre de una roca?, ¿qué tipo de dato debemos usar?\
En ese caso, usaremos un **string** y lo asignaremos a una variable llamada `roca`:

In [None]:
roca = "andesita"

> **¿Qué es un string?** \
> Un string es un objeto en Python que representa todo tipo de caracteres.\
> Para crear un string debemos encasillarlo usando comillas dobles ("") o simples ('').\

También podemos colocar frases dentro de un string:

In [None]:
frase = "El presente es la clave del pasado"

In [None]:
frase

El último tipo de dato que debemos conocer es el **lógico**.

> **¿Qué es un dato lógico?** \
> Es un objeto en Python usado para representar el valor de verdad en una expresión.\
> Los datos lógicos pueden ser **True** (verdadero) o **False** (falso).

Por ejemplo, el resultado de comparar dos números:

In [None]:
12 > 5

devuelve el valor **True**, pues la expresión es verdadera.

En conclusión, tenemos 4 tipos de datos fundamentales en Python: **integer**, **float**, **string** y **lógico**.

***

<a id="parte2"></a>

## **2. Matemáticas en Python**
***

**La lógica matemática es uno de los componentes principales detrás del funcionamiento de todo algoritmo.**

### **2.1. Aritmética básica**
Revisaremos las operaciones aritméticas básicas a través del siguiente ejemplo:

Una *mina de cobre* produjo durante 4 semanas las siguientes toneladas de concentrado: 910, 825, 1070, 940.\
Calcularemos el total producido en un mes sumando las 4 cantidades y asignándolas a la variable `total`:

In [None]:
total = 910 + 825 + 1070 + 940
total

En un mes (4 semanas), la mina produjo 3745 toneladas de concentrado.

También calcularemos el promedio de concentrado producido por la mina cada semana y la asignaremos a la variable llamada `promedio`:

In [None]:
promedio = total / 4
promedio

Ahora, calcularemos la ganancia producida por la mina teniendo en cuenta que el precio de concentrado por tonelada es de 5 dólares y el costo de operación en ese mes fue de 10 000 dólares. Usaremos la siguiente fórmula:
<center> $\Large ganancia = total_{concentrado} \times precio_{concentrado} - costo_{operacion}$ </center>

\
Asignaremos el precio de concentrado a la variable `precio_concentrado` y el costo de operación a la variable `costo_operacion`:

In [None]:
precio_concentrado = 5
costo_operacion = 10000

La ganancia será asignada a la variable `ganancia` y también usaremos la variable `total` calculada anteriormente:

In [None]:
ganancia = total * precio_concentrado - costo_operacion
ganancia

La ganancia de la mina en ese mes fue de 8725 dólares.

Ahora, calcularemos la varianza de la producción usando la siguiente fórmula:

<center> $\Large s^{2} = \frac{\sum (x - \bar{x})^{2}}{n - 1}$ </center>

Donde:

> $s^{2}$ : varianza\
> $\bar{x}$ : promedio\
> $x$ : dato\
> $n$ : número de datos

Recordemos que la producción semanal en la mina fue de 910, 825, 1070 y 940 toneladas. Por lo tanto `n` será igual a 4.

In [None]:
n = 4

Calcularemos la diferencia entre la producción obtenida cada semana y el promedio semanal, y lo elevaremos al cuadrado:

In [None]:
x1 = (910 - promedio)**2
x2 = (825 - promedio)**2
x3 = (1070 - promedio)**2
x4 = (940 - promedio)**2

Ahora sumaremos todas estas cantidades:

In [None]:
sumatoria = x1 + x2 + x3 + x4

Y finalmente, calcularemos la varianza:

In [None]:
varianza = sumatoria / (n - 1)
varianza

### **2.2. Comparación entre valores**

Usaremos comparadores para *comparar* dos valores y determinar la relación que existe entre ambos.

Tenemos las *edades radiométricas* de dos muestras A y B en millones de años:

In [None]:
muestra_A = 100
muestra_B = 250

Podemos comparar las edades y obtener como resultado un dato de tipo lógico (True o False).\
Por ejemplo, evaluaremos si la muestra A es más antigua que B:

In [None]:
muestra_A > muestra_B

Vemos que el resultado es falso, por lo tanto, la muestra A es más reciente que B:

In [None]:
muestra_A < muestra_B

También evaluaremos si la muestra B tiene una edad menor a 500 millones de años:

In [None]:
muestra_B <= 500

Ahora, evaluaremos si las muestras tienen la misma edad radiométrica:

In [None]:
muestra_A == muestra_B

Nuevamente obtenemos un resultado falso, es decir, las muestras tienen edades diferentes:

In [None]:
muestra_A != muestra_B

Por último, evaluaremos el valor de verdad de la siguiente frase: **"La edad de la muestra A es mayor a 50 Ma y la edad de la muestra B es menor a 200 Ma"**.\
Para eso, uniremos las comparaciones:

In [None]:
(muestra_A > 50) and (muestra_B < 200)

Podemos juntar varias comparaciones en una sola expresión usando `and` y `or`:

In [None]:
(muestra_A == 50) or (muestra_B > muestra_A) and (muestra_A + 50 > muestra_B)

### **2.3. Otros operadores en Python**
Para obtener el residuo de dividir un número entre otro, usaremos el símbolo del porcentaje (%). Por ejemplo:

In [None]:
20 % 3

Un número es par si el residuo de dividir dicho número entre 2 es 0:

In [None]:
12 % 2

Para obtener el valor absoluto de un número, usaremos la función `abs`:

In [None]:
abs(-7.5)

***

<a id="parte3"></a>

## **3. Funciones input y print**
***

Usaremos la función `input` para ingresar información dentro del sistema.\
Los datos ingresados usando esta función serán representados como un **string**.

Por ejemplo, ingresaremos el nombre de una roca al sistema:

In [None]:
input("Ingrese el nombre de una roca:")

Por otro lado, tenemos la función `print`, que nos muestra información dentro del sistema.

Por ejemplo, mostraremos el nombre de la roca:

In [None]:
roca = input("Ingrese el nombre de una roca:")

In [None]:
print(roca)

La función `print` es comúnmente usada para establecer puntos de control en un algoritmo o para mostrarnos el resultado de alguna tarea.

Por ejemplo, calcularemos el RQD de un tramo de testigo de perforación y usaremos `print()` para que nos muestre el valor del RQD.\
La longitud de cada fragmento de testigo (en cm) es: $8, 12, 15, 9, 25, 19, 11, 4$.

Empezaremos calculando la longitud total y la longitud de los fragmentos mayores a 10 cm:

In [None]:
total = 8 + 12 + 15 + 9 + 25 + 19 + 11 + 4
mayor_10 = 12 + 15 + 25 + 19 + 11

Ahora, calcularemos el RQD dividiendo la suma entre el total:

In [None]:
rqd = (mayor_10 / total) * 100

Ahora que ya tenemos calculado el RQD, lo uniremos a un **string** para formar una frase:
> Usaremos la función `str` para transformar el valor del RQD en un string.

In [None]:
resultado = "El RQD del tramo es de " + str(rqd) + " %"

Y usaremos `print` para observar el resultado:

In [None]:
print(resultado)

Como podemos ver, la función `print` devuelve un resultado en formato de lectura.\
Sin embargo, podemos mejorar un detalle adicional: *el número de decimales en el RQD*. Para esto, tenemos dos opciones:

#### **Opción 1:** Usar la función `round` para redondear el valor del RQD:
> La función `round` usa  2 parámetros: el valor a redondear y el número de decimales que quedarán luego del redondeo.
>
> Redondeando el RQD:

In [None]:
rqd_redondeado = round(rqd, 1)

> Unimos los strings y mostramos el resultado:

In [None]:
resultado = "El RQD del tramo es de " + str(rqd_redondeado) + " %"
print(resultado)

#### **Opción 2:** Usar un **f-string** (string con formato literal), que contiene espacio reemplazable por variables:
> Se debe agregar una **f** antes de empezar a escribir el string entre comillas.\
> La variable se debe agregar dentro de un espacio separado por llaves `{}`.\
> Editaremos el formato del valor de la variable usando dos puntos `:` seguido del tipo de formato (en este caso es `.1f`).
>
> Juntando la información:

In [None]:
resultado = f"El RQD del tramo es de {rqd:.1f} %"

> Mostramos el resultado:

In [None]:
print(resultado)

***

<a id="parte4"></a>

## **4. Condicionales**
***

Para evaluar el camino que seguirá un algoritmo, estableceremos una **condición** que devolverá un valor lógico (True o False).\
El algoritmo continuará por el camino que devuelva `True`.\
Las palabras reservadas usadas en una condicional son:

- `if`: toda condicional inicia con esta palabra:
- `elif`: en caso la condición principal o anterior no se cumpla, `elif` ejecutará el bloque de código que tenga asignado.
- `else`: en caso ninguna condición se cumpla, `else` ejecutará el bloque de código que tenga asignado.

La estructura de una condicional es la siguiente:

`if [condición]:`\
`   [bloque de código]`\
`elif [condición]:`\
`   [bloque de código]`\
`else:`\
`   [bloque de código]`

Por ejemplo, crearemos una condicional que evalúe si una roca es ígnea (y si se trata específicamente, de una andesita):

In [None]:
roca = input("Ingrese el nombre de una roca:")

if roca == "andesita":
    print("La andesita es una roca ígnea.")

> El algoritmo devuelve la frase **"La andesita es una roca ígnea"** solo cuando la variable asignada a `roca` es **"andesita"**.

Podemos agregar una opción adicional, en caso de que la roca no se trate de una andesita:

In [None]:
roca = input("Ingrese el nombre de una roca:")

if roca == "andesita":
    print("La andesita es una roca ígnea.")
else:
    print("La roca no es una andesita.")

> Cuando la condición establecida no se cumple, el algoritmo devuelve la frase **"La roca no es una andesita"**.

También podemos agregar otras opciones con los nombres de otras rocas ígneas:

In [None]:
roca = input("Ingrese el nombre de una roca:")

if roca == "andesita":
    print("La andesita es una roca ígnea.")
elif roca == "basalto":
    print("El basalto es una roca ígnea.")
elif roca == "granito":
    print("El granito es una roca ígnea.")
else:
    print("La roca no es andesita, basalto o granito.")

Ahora, agruparemos las condiciones en una sola expresión:

In [None]:
roca = input("Ingrese el nombre de una roca:")

if (roca == "andesita") or (roca == "basalto") or (roca == "granito"):
    print("La roca es ígnea.")
else:
    print("La roca no es andesita, basalto o granito.")

***

<a id="parte5" ><a/>

## **5. Listas**
***

Las listas son colecciones de datos modificables que se caracterizan por estar encerrados entre corchetes `[]`.

Por ejemplo, si tenemos una colección con los siguientes minerales: pirita, cuarzo, galena y calcopirita.\
Podemos agrupar los minerales en una **lista** llamada `minerales`:

In [None]:
minerales = ["pirita", "cuarzo", "galena", "calcopirita"]

Ahora, mostraremos el contenido de la lista:

In [None]:
print(minerales)

Si en la colección también tuvieramos *esfalerita*, ¿cómo la agregamos dentro de la lista?\
Para eso usaremos el método `.append`:

In [None]:
minerales.append("esfalerita")

print(minerales)

¿Cómo agregaríamos los siguientes minerales en la lista: acantita y molibdenita?\
Para eso usaremos el método `.extend`:

In [None]:
minerales.extend(["acantita", "molibdenita"])

print(minerales)

¿Cuántos tipos de minerales tengo en la colección?\
Para saber esto usaremos la función `len`:

In [None]:
len(minerales)

> La colección contiene 7 tipos de minerales.

¿Cómo hago para seleccionar partes de la lista de minerales?\
A través de un método en Python conocido como **slicing**:
> Para realizar slicing se sigue el siguiente formato: `lista[inicio:final:paso]`\
> El orden número en Python empieza desde 0, 1, 2, 3...

Para seleccionar todos los elementos de la lista:

In [None]:
print(minerales[:])

El primer elemento:

In [None]:
print(minerales[0])

Los 3 primeros elementos:

In [None]:
print(minerales[:3])

El último elemento:

In [None]:
print(minerales[-1])

Los últimos 3 elementos:

In [None]:
print(minerales[-3:])

Por último, seleccionamos elementos de la lista de 2 en 2:

In [None]:
print(minerales[::2])

Imaginemos que ahora en la colección solo queda cuarzo, pirita, esfalerita y calcopirita. ¿Cómo removemos los otros minerales de la lista?\
Los removeremos usando el método `.remove`:

In [None]:
minerales.remove("galena")
minerales.remove("acantita")
minerales.remove("molibdenita")

print(minerales)

Como siguiente ejemplo, tenemos las concentraciones de Au (en ppm) de varias muestras agrupadas en una lista:

In [None]:
au_ppm = [10.1, 2.0, 0.4, 11.7, 6.3, 1.3, 0.1, 2.6, 8.1, 7.0]

Si queremos obtener el promedio de concentración de las muestras, dividiremos la suma de los elementos entre el total:
> La suma de los elementos en una lista se puede calcular con la función `sum`.

In [None]:
suma = sum(au_ppm)
total = len(au_ppm)

promedio = suma / total
promedio

> El promedio de concentración de oro en las muestras es de 4.96 ppm.

Ahora calcularemos los valores máximos y mínimos usando las funciones `max` y `min`:

In [None]:
print(f"La concentración máxima de Au en las muestras es de {max(au_ppm)} ppm")

Por último, ordenaremos los elementos en la lista de menor a mayor usando la función `sorted`:

In [None]:
sorted(au_ppm)

Y también ordenados de mayor a menor activando la opción `reverse=True`:

In [None]:
sorted(au_ppm, reverse=True)

***

<a id="parte6"></a>

## **6. Tuplas**
***

Las tuplas son colecciones de datos **no modificables** que se caracterizan por estar encerrados entre paréntesis `()`.

Por ejemplo, las coordenadas de un punto se pueden guardar en una tupla:

In [None]:
punto = (10, 25, 15)

Calcularemos la distancia del punto a las coordenadas **(5, 15, 4)**.\
Primero, asignaremos las coordenadas por separado:

In [None]:
x, y, z = punto

Usaremos estas variables para calcular la distancia euclidiana:

In [None]:
distancia = ((x - 5)**2 + (y - 15)**2 + (z - 4)**2)**(1/2)

print(f"La distancia del punto a la coordenada es de {distancia:.1f}")

***

<a id="parte7"></a>

## **7. Diccionarios**
***

Los diccionarios son colecciones de datos modificables que se caracterizan por estar encerrados entre llaves `{}`.\
Además, cada elemento en un diccionario está compuesto por una llave **(key)** y un valor **(value)**.

Por ejemplo, crearemos un diccionario que contenga la composición mineralógica de una muestra:

In [None]:
muestra = {"cuarzo": 35, "feldespato": 20, "plagioclasas": 30, "micas": 10}

Como podemos ver, cada elemento de la muestra está compuesto por una **llave** (nombre del mineral) y un **valor** (porcentaje en la muestra):

In [None]:
print(muestra)

Podemos seleccionar el porcentaje de un mineral de la siguiente forma:

In [None]:
muestra["cuarzo"]

Y también podemos modificar el valor de un porcentaje:

In [None]:
muestra["cuarzo"] = 40

print(muestra)

Podemos obtener el porcentaje de un mineral incluso si no ha sido indicado previamente (por ejemplo, pirita).\
Para esto, usaremos la función `get` e incluiremos un valor de porcentaje por defecto:

In [None]:
muestra.get("pirita", 0)

Ahora, crearemos un nuevo elemento en el diccionario:

In [None]:
muestra["pirita"] = 0

print(muestra)

Si quiero obtener solamente las llaves del diccionario:

In [None]:
muestra.keys()

O solamente los valores:

In [None]:
muestra.values()

También podemos seleccionar los elementos separados en tuplas:

In [None]:
muestra.items()

### **7.1. Sets**
Los sets o conjuntos son colecciones de datos desordenados que no pueden tener valores repetidos. Se encasillan entre llaves `{}`.

Por ejemplo, probaremos a crear un set y añadiendo minerales repetidos:

In [None]:
minerales = {"pirita", "cuarzo", "galena", "cuarzo", "calcopirita", "cuarzo", "pirita"}

Observaremos que el set solamente guardó los elementos únicos:

In [None]:
minerales

***

<a id="parte8"></a>

## **8. Bucles**
***

Usaremos **bucles** si queremos realizar una tarea de manera repetitiva, iterativa, o cíclica.\
Existen dos tipos de bucles: definidos e indefinidos.

### **8.1. Bucles definidos**
Este tipo de bucle realiza una iteración por cada elemento dentro de un conjunto.\
Las palabras reservadas usadas en un bucle definido son `for` e `ìn` y siguen la siguiente estructura:

`for [elemento] in [conjunto]:`\
`    [bloque de código]`

Es importante **indentar** el bloque de código que seguirá luego de la primera línea del bucle.

Por ejemplo, crearemos un bucle que muestre los elementos de la función `range`:
> **Nota:** La función `range` devuelve una secuencia de **integers** ordenados.

In [None]:
for numero in range(5):
    print(numero)

Si tengo una lista de minerales, podemos mostrar cada elemento de la lista usando un bucle:

In [None]:
minerales = ["cuarzo", "biotita", "ortoclasa", "muscovita"]

for mineral in minerales:
    print(mineral)

Podemos usar la función `enumerate` para enumerar cada elemento en el conjunto:
> La función `enumerate` devuelve los elementos usando tuplas que contienen el número de orden de cada elemento.

In [None]:
for mineral in enumerate(minerales):
    print(mineral)

Por último, podemos usar la función `zip` para agrupar conjuntos de elementos en grupos de tuplas:

In [None]:
minerales = ["pirita", "galena", "cuarzo"]
dureza = [6, 2, 7]

for grupo in zip(minerales, dureza):
    print(grupo)

### **8.2. Bucles indefinidos**

Este tipo de bucle permanece activo hasta que la condición principal deja de ser verdadera (True), por lo cual puede ser ejecutada de manera indefinida.\
Para detener un bucle indefinido, debemos establecer una medida que termine con la ejecución del bucle.\
Las palabras reservadas usadas en un bucle indefinido son:

- `while`: repite el bucle mientras se mantenga la condición principal.
- `continue`: termina la secuencia del bucle y empieza desde el inicio.
- `pass`: continúa con la secuencia del bucle.
- `break`: termina con el bucle y pasa a la siguiente línea de código fuera de este.

La estructura de un bucle indefinido es el siguiente:

`while [condición]:`\
`      [bloque de código]`

Recuerda que es importante **indentar** el bloque de código dentro del bucle.

Por ejemplo, usaremos un bucle indefinido para crear un algoritmo que nos pida el nombre de una roca y solo termine de ejecutarse cuando el nombre pertenezca a la lista indicada:

In [None]:
rocas = ["andesita", "diorita", "basalto", "sienita"]

while True:
    roca = input("Ingrese el nombre de la roca:")
    if roca in rocas:
        break
    else:
        print("El nombre ingresado no pertenece a la lista, intente denuevo.")

print(f"Bucle terminado, la roca ingresada es {roca}")

***

<a id="parte9"> </a>

## **9. Funciones**
***

Una función es una pieza de código que puede ser reutilizada en diferentes algoritmos. Para usar una función debemos llamarla por su nombre.\
Para crear una función en Python debemos usar las siguientes palabras reservadas:

- `def`: define el nombre de la función, le siguen los parámetros en paréntesis.
- `assert`: evalúa una condición dentro de la función, de ser falsa, devolverá un `AssertionError`.
- `return`: devuelve el resultado de la función.

La estructura para crear una función es la siguiente:

`def [función](parámetros):`\
`    [bloque de código]`\
`    return [resultado]`

Es importante tener en cuenta que la estructura de la función debe ir **indentada** luego de la primera línea.

Por ejemplo, crearemos una función llamada `frase` que devolverá un comentario:
> **Nota:** En este primer ejemplo, usaremos `print` en vez de `return` para devolver el resultado.

In [None]:
def frase():
    print("Una roca es un agregado de minerales.")

Y ahora llamaremos la función:

In [None]:
frase()

Ahora crearemos una función un poco más compleja, esta vez usando un **parámetro**:

In [None]:
def tipo_roca(tipo):
    if tipo == "ígnea":
        print("Es una roca ígnea.")
    elif tipo == "sedimentaria":
        print("Es una roca sedimentaria.")
    elif tipo == "metamórfica":
        print("Es una roca metamórfica.")

Un parámetro puede tener diferentes valores, representa una variable dentro de la función:

In [None]:
tipo = "sedimentaria"
tipo_roca(tipo)

También podemos llamar la función usando el string directamente:

In [None]:
tipo_roca("metamórfica")

O también, señalando el valor del parámetro:

In [None]:
tipo_roca(tipo="ígnea")

Ahora que tenemos una mejor idea acerca de las funciones, crearemos una función llamada `normalizar`.\
Usando 3 números como **parámetros**, la función normalizará estos valores con la finalidad de que su suma sea igual a 1.\
Por último, la función devolverá una tupla conteniendo los 3 números normalizados:

In [None]:
def normalizar(a, b, c):
    suma = a + b + c
    a /= suma
    b /= suma
    c /= suma
    return (a, b, c)

Usaremos los valores 1, 5 y 10:

In [None]:
normalizar(1, 5, 10)

### **9.1. La función lambda**

Si queremos definir una función breve y que solo será usada una sola vez, podemos usar la función `lambda`.\
Por ejemplo, definiremos la sumatoria de los **n** primeros números naturales y la asignaremos a la variable `sumatoria`:

In [None]:
sumatoria = lambda n: n*(n + 1)/2

Ahora, calcularemos la suma de los **20** primeros números naturales:

In [None]:
sumatoria(20)

### **9.2. Las funciones filter y map**

Tenemos una lista con las concentraciones de Au de unas muestras en ppm:

In [None]:
au = [3, 10, 5, 6, 8, 15, 24, 4, 2, 12, 7, 7, 5, 11, 21, 9, 10]

Para crear una lista con aquellas concentraciones de Au mayores a 10 ppm, usaremos la función `filter`:

In [None]:
list(filter(lambda x: x > 10, au))

Ahora, clasificaremos la lista de acuerdo a sus valores, `"bajo"` si es menor o igual a 10 ppm y `"alto"` si es mayor.\
Para esto, usaremos la función `map` y asignaremos la nueva lista a una variable llamada `valores`:

In [None]:
valores = list(map(lambda x: "alto" if x > 10 else "bajo", au))

In [None]:
print(valores)

Por último, para obtener el número de valores altos y bajos, usaremos el método `.count`.
> Nota: `.count` solo se puede aplicar a listas y tuplas.

In [None]:
valores.count("bajo")

In [None]:
valores.count("alto")

***

<a id="parte10"></a>

## **10. Clases y objetos**
***

***Python es un lenguaje de programación orientado a objetos.*** \
Un **objeto** es una colección de datos y funciones que representan a una entidad de la vida real. Cada objeto pertenece a una **clase**.\
Todo dentro de Python es tratado como un objeto: variables, funciones, listas, tuplas, diccionarios, etc.\
La palabra reservada usada para crear una clase es `class`.

Por ejemplo, crearemos una clase que represente a una roca: 
> Nota: por convención, el nombre de una clase debe empezar con mayúscula.

In [None]:
class Roca:
    def __init__(self):
        print("Has creado una roca dentro de Python!!")

La función `__init__` representa el estado inicial del objeto, se ejecuta al mismo tiempo que el objeto es creado.\
El parámetro `self` es una referencia del mismo objeto y se usa para establecer los métodos y atributos de la clase creada.

> Un **método** es una función específica creada dentro de una clase.\
> Un **atributo** es un valor específico almacenado dentro de una clase.

Crearemos una instancia de la clase `Roca`:

In [None]:
roca = Roca()

Ahora agregaremos algunos atributos:

In [None]:
class Roca:
    def __init__(self, nombre, textura):
        self.nombre = nombre
        self.textura = textura
        print("Has creado una roca dentro de Python!!")

Y crearemos una nueva instancia:

In [None]:
roca = Roca("andesita", "afanítica")

Ahora observaremos sus atributos:

In [None]:
roca.nombre

In [None]:
roca.textura

Por último, crearemos un método llamado `resumen` que resuma los atributos de la roca en una frase:

In [None]:
class Roca:
    def __init__(self, nombre, textura):
        self.nombre = nombre
        self.textura = textura
        print("Has creado una roca dentro de Python!!")
    def resumen(self):
        print(f"La roca es una {self.nombre} de textura {self.textura}.")

Volvemos a crear la instancia:

In [None]:
roca = Roca("andesita", "afanítica")

Y usaremos el método para observar el resumen:

In [None]:
roca.resumen()

***

<a id="parte11"></a>

## **11. Numpy**
***

**Usaremos esta librería para operar información en forma de vectores y matrices (álgebra lineal).**

Empezaremos importando la librería: 
> Usaremos `np` como una referencia abreviada de la librería.\
> Para usar una función de Numpy, debemos anteponer su referencia (ejemplo: `np.log` para calcular el logaritmo de un número).\
> Para saber más sobre la importación de librerías, revisar el [Anexo 2](#anexo2).

In [None]:
import numpy as np

### **11.1. Vectores**

Usaremos la función `array` y una **lista** para crear un vector:

In [None]:
vector = np.array([1, 2, 3, 4, 5, 6])

In [None]:
print(vector)

Este **vector** contiene el mismo tipo de información en cada posición. Lo verificamos usando el atributo `.dtype`:

In [None]:
vector.dtype

Para transformar los valores del vector de **integer** a **float**, usaremos la función `astype`:

In [None]:
vector.astype(float)

De manera similar a una lista o tupla, podemos seleccionar partes del vector haciendo **slicing**:

In [None]:
vector[0]

In [None]:
vector[2:5]

También podemos reemplazar valores dentro del vector:

In [None]:
vector[-1] = 10

In [None]:
vector

Si establecemos una condición, obtendremos un vector con datos de tipo lógico:

In [None]:
vector > 2

Podemos crear una copia del vector usando el método `.copy`:

In [None]:
copia = vector.copy()

De esta forma, si modificamos un valor de la copia, el original permanecerá igual:

In [None]:
copia[0] = 0

In [None]:
print(vector)
print(copia)

### **11.2. Matrices**

Usaremos la función `array` y una **lista de listas** para crear una matriz:

In [None]:
matriz = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

In [None]:
print(matriz)

Para observa la forma de la matriz, usaremos el atributo `.shape`:

In [None]:
matriz.shape

Podemos usar el método `.reshape` para cambiar la forma de la matriz:

In [None]:
matriz.reshape((1, 9))

La transpuesta de una matriz se calcula usando el atributo `.T`:

In [None]:
print(matriz.T)

Para el siguiente ejemplo, tenemos dos matrices de 2 x 2, llamadas A y B:

In [None]:
A = np.array([[1, 1], [1, 1]])
B = np.array([[-1, 0], [0, -1]])

In [None]:
print(A)

In [None]:
print(B)

Podemos agrupar las matrices horizontalmente usando la función `hstack`:

In [None]:
np.hstack([A, B])

O verticalmente usando `vstack`:

In [None]:
np.vstack([A, B])

También podemos usar la función `concatenate` para agruparlos de acuerdo a un eje (0 para vertical y 1 para horizontal).

In [None]:
np.concatenate([A, B], axis=0)

In [None]:
np.concatenate([A, B], axis=1)

### **11.3. Álgebra lineal en Numpy**

Tenemos dos vectores $v_{1}$ y $v_{2}$:

In [None]:
v1 = np.array([1, 2, 3, 4])
v2 = np.array([5, 6, 7, 8])

Podemos sumar y restar los vectores:

In [None]:
print(v1 + v2)

In [None]:
print(v1 - v2)

Multiplicar y dividirlos:

In [None]:
print(v1 * v2)

In [None]:
print(v1 / v2)

Calcular el producto escalar:

In [None]:
np.dot(v1, v2)

También podemos calcular la suma de componentes, máximo, mínimo, media, varianza y desviación estándar de cada vector:

In [None]:
print(v1)

#### Suma

In [None]:
v1.sum()

#### Máximo

In [None]:
v1.max()

#### Mínimo

In [None]:
v1.min()

#### Media

In [None]:
v1.mean()

#### Varianza

In [None]:
v1.var()

#### Desviación estándar

In [None]:
v1.std()

### Espacios lineales

Podemos crear espacios lineales usando la función `arange`:

In [None]:
np.arange(1, 10, 1)

Y también usando `linspace`:

In [None]:
np.linspace(1, 10, 10)

También podemos obtener números aleatorios usando el módulo `random`.\
El resultado puede ser un número, vector o matriz, dependiendo de la forma dentro del paréntesis:

Por ejemplo, eligiremos un número aleatorio entre 0 y 1:

In [None]:
np.random.random()

Un número aleatorio de una distribución uniforme entre 0 y 5:

In [None]:
np.random.uniform(0, 5)

Una matriz de 2 $\times$ 2 compuesta por números aleatorios de una distribución normal de media 0 y varianza 1

In [None]:
np.random.randn(2, 2)

Por último, podemos establecer condiciones y devolver resultados en base a estos usando la función `where`.\
Por ejemplo, reemplazaremos los valores de $v_{1}$ mayores a 2 por el valor de 0 y los menores por el valor de 1:

In [None]:
np.where(v1 > 2, 0, 1)

***

<a id="parte12"></a>

## **12. Matplotlib**
***

**Esta librería es frecuentemente usada para elaborar gráficos en Python.**

Empezaremos importando el módulo de figuras de `matplotlib`: 
> Usaremos `plt` como una referencia abreviada del módulo librería.\
> También importaremos `numpy`.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

Para los ejemplos de visualización, usaremos las siguientes funciones:
- `subplots`: crea el espacio para una o varias figuras ordenadas en filas y columnas.
- `scatter`: crea un diagrama de dispersión de puntos.
- `plot`: crea una figura de líneas.
- `bar`: crea un diagrama de barras.
- `hist`: crea un histograma.
- `boxplot` y `violinplot`: crean figuras que nos ayudan a visualizar la distribución de los datos.

Matplotlib es una librería fuertemente orientada a objetos, por lo tanto, usaremos identificadores.\
Para identificar las figuras, usaremos los siguientes nombres:
- `fig`: referencia el cuadro general de la figura.
- `axs` o `ax`: referencian a las subfiguras creadas.

### **12.1. Diagrama de dispersión**

In [None]:
x = np.random.randn(1, 50)
y = 3*x + np.random.randn(1, 50)


fig, ax = plt.subplots(figsize=(6, 6))
ax.scatter(x, y)
plt.show()

### **12.2. Figura de líneas**

Usaremos además el método `legend` para agregar una leyenda y `fontsize` para modificar el tamaño de letra.

In [None]:
x = np.arange(1, 11, 1)
y = x ** 2
z = x ** 3

fig, ax = plt.subplots(figsize=(6, 6))
ax.plot(x, y, label="$x^{2}$")
ax.plot(x, z, label="$x^{3}$")

ax.legend(fontsize=16)
plt.show()

### **12.3. Diagrama de barras**

In [None]:
x = np.array(["A", "B", "C"])
y = np.random.randint(1, 100, (3,))

fig, ax = plt.subplots(figsize=(6, 6))
ax.bar(x, y)
plt.show()

### **12.4. Histograma**

In [None]:
x = np.random.randn(10000,)

fig, ax = plt.subplots(figsize=(6, 6))
ax.hist(x, bins=20)
plt.show()

### **12.5. Boxplot**

In [None]:
x = np.random.randn(10000,)
y = 2*x + 1
z = 2 - x

fig, ax = plt.subplots(figsize=(6, 6))
ax.boxplot([x, y, z])
plt.show()

### **12.6. Violinplot**

In [None]:
x = np.random.randn(10000,)
y = 2*x + 1
z = 2 - x

fig, ax = plt.subplots(figsize=(6, 6))
ax.violinplot([x, y, z])
plt.show()

<a id="parte13"></a>

## **13. Pandas**
***

**Esta librería es fundamental para el análisis, tratamiento y manipulación de datos estructurados (i.e. en filas y columnas).** 

Empezaremos importando la librería:

> Usaremos `pd` como una referencia abreviada de la librería.\
> También usaremos Numpy para generar información.

In [None]:
import pandas as pd
import numpy as np

### **13.1. Series**

Empezaremos creando un objeto llamado `Series`, que es similar a un `array` de Numpy, excepto que llevan un **índice (index)**:

In [None]:
pd.Series(np.random.random((4,)))

Los objetos de tipo `Series` representan unidades de filas y columnas.

También podemos crear una serie usando un diccionario:

In [None]:
rocas = pd.Series({"A": "andesita", "B": "basalto", "C": "diorita", "D": "granito"})

In [None]:
rocas

Podemos obtener el índice a través del atributo `.index`:

In [None]:
rocas.index

Y los valores a través del atributo `.values`:

In [None]:
rocas.values

Modificaremos el último valor de la serie `rocas` y la cambiaremos por `andesita`:

In [None]:
rocas[-1] = "andesita"
rocas

Por último, seleccionaremos el tercer elemento de la serie. Podemos hacer esto de dos formas:\
Usando el método `iloc` para ubicarlo a partir del número de posición en el índice:

In [None]:
rocas.iloc[2]

O podemos usar el método `loc` para ubicarlo a partir del nombre asignado al índice:

In [None]:
rocas.loc["C"]

### **13.2. DataFrame**

El otro tipo de objeto usado en Pandas es el `DataFrame`, que agrupa objetos de tipo `Series` en una tabla de filas y columnas.\
Cada fila y columna del DataFrame puede llevar un nombre específico.

Como ejemplo, crearemos un DataFrame de 2 filas y 3 columnas usando un `array` y una lista de columnas A, B y C:

In [None]:
df = pd.DataFrame(np.random.random((2, 3)), columns=["A", "B", "C"])
df

Podemos modificar los índices usando el atributo `.index`:

In [None]:
df.index = ["Fila 1", "Fila 2"]
df

Y por último, agregaremos una columna D con valores de tipo string:

In [None]:
df["D"] = ["abcdef", "ghijkl"]
df

***

<a id="parte14"></a>

## **14. Ejercicios**
***

### **14.1. Reporte de resultados en una mina**

Una mina de Au obtuvo los siguientes resultados de producción para un determinado semestre:

| Mes | Au (onzas) |
| --- | --- |
| Enero | 80 |
| Febrero | 105 |
| Marzo | 45 |
| Abril | 80 |
| Mayo | 75 |
| Junio | 125 |

Para obtener un reporte general de los resultados, se pide:
 - El total de onzas Au producidas en el semestre. Asignarlo a la variable `total`.
 - El costo de operación mensual de la mina fue de 40000 dólares. Asignarlo a la variable `costo_operacion`.
 - El precio de una onza de Au es de 1000 dólares. Asignarlo a la variable `precio`.
 - Usando estas tres variables, calcular la ganancia semestral de la mina asignándola a la variable `ganancia`.
 - Mostrar el resultado general usando la función `print`, usando el siguiente formato:\
 `"Durante el semestre, la mina produjo ___ onzas de Au con una ganancia total de ___ dólares"`

### **14.2. Riesgo geológico en una edificación**
¿Cuál es la probabilidad de que un edificio sufra un terremoto de magnitud 7 teniendo en cuenta que su vida útil es de 100 años, y el período de retorno del terremoto es de 500 años?. Usar la siguiente fórmula para el cálculo de la probabilidad de excedencia:

<center> $\Large p = 1 - (1 - \frac{1}{T})^{t}$ </center>

Donde:

- $p$ : probabilidad de excedencia
- $t$ : vida útil de la estructura
- $T$ : período de retorno

Respuesta: la probabilidad de que la edificación sufra un terremoto de magnitud 7 es de $18\%$.

### **14.3. Mineralogía de una muestra de roca (Parte 1)**

Una muestra de granodiorita tiene la siguiente composición mineralógica: cuarzo $(48\%)$, plagioclasas $(27\%)$, feldespato $(11\%)$, biotita $(8\%)$, pirita $(6\%)$.\
Crear un diccionario en Python que guarde la mineralogía de la muestra, el porcentaje debe ser representado en fracción (ejemplo: 25% es igual a 0.25).

### **14.4. Mineralogía de una muestra de roca (Parte 2)**

Usando el diccionario obtenido en el ejercicio **11.3**, crear un bucle definido que muestre el nombre y el porcentaje de cada mineral.\
Usar el siguiente formato: `Abundancia de ____ en la muestra: _____ %`
> Nota: usar la función `print` para mostrar los resultados de cada mineral.

### **14.5. Normalización de porcentajes para clasificación petrográfica**

Crear una función con nombre `streckeisen` con las siguientes características:
- La función usará como parámetro de entrada a un **diccionario**.
- La función tomará los porcentajes de `cuarzo`, `feldespato` y `plagioclasas` del diccionario y los normalizará.
- La función debe devolver como resultado un diccionario conteniendo solamente los 3 minerales y sus respectivos porcentajes normalizados.

Usar el diccionario del ejercicio **11.3** en la función y mostrar el resultado final.

### **14.6. Prueba de algoritmo**

Usar la función `streckeisen` creada en el ejercicio **11.5** para normalizar una muestra con la siguiente mineralogía:\
Cuarzo $(41\%)$, plagioclasas $(25\%)$, anfíboles $(17\%)$, biotita $(12\%)$, pirita $(5\%)$.
> Nota:  en caso la función no evalúe la muestra de forma correcta o indique error, se deberá modificar la función hasta que pueda resolverla.

### **14.7. Buzamiento aparente en un talud**
Un estrato rocoso que aflora en el talud de una carretera tiene un azimut de 150° y un buzamiento aparente de 33°. Calcular el buzamiento real del estrato teniendo en cuenta que el azimut del talud de carretera es de 180°. Usar la siguiente fórmula:
<center> $ \Large \phi_{real} = arctan(\frac{tan(\phi_{aparente})}{cos(\beta)})$ </center>
Donde:

- $\phi_{real}$ : buzamiento real
- $\phi_{aparente}$ : buzamiento aparente
- $\beta$ : ángulo entre el azimut del estrato y el azimut del talud

> **Nota:** usar la librería `math` o `numpy` para realizar el cálculo trigonométrico.

Asignando los valores de buzamiento aparente a `dip_aparente` y el ángulo $\beta$ a `beta`:

In [None]:
dip_aparente = 33
beta = abs(180 - 150)

Ahora, importaremos la librería `math` para poder usar las funciones tangente, seno y arcotangente.\
Primero usaremos la función `math.radians()` para transformar los ángulos de grados sexagesimales a radianes.

In [None]:
import math

In [None]:
dip_aparente = math.radians(dip_aparente)
beta = math.radians(beta)

Ahora, usaremos `math.atan()`, `math.tan()` y `math.sin()` para calcular el buzamiento real en radianes:

In [None]:
dip_real = math.atan((math.tan(dip_aparente) / math.cos(beta)))
dip_real

El buzamiento está en radianes, debemos transformarlo a grados sexagesimales:

In [None]:
math.degrees(dip_real)

Respuesta: el buzamiento real del estrato rocoso es de aprox. 37°.