<div align="center">
    <span style="font-size:30px">
        <strong>
            <!-- Símbolo de Python -->
            <img
                src="https://cdn3.emoji.gg/emojis/1887_python.png"
                style="margin-bottom:-5px"
                width="30px" 
                height="30px"
            >
            <!-- Título -->
            Python para Geólogos
            <!-- Versión -->
            <img 
                src="https://img.shields.io/github/release/kevinalexandr19/manual-python-geologia.svg?style=flat&label=&color=blue"
                style="margin-bottom:-2px" 
                width="40px"
            >
        </strong>
    </span>
    <br>
    <span>
        <!-- Github del proyecto -->
        <a href="https://github.com/kevinalexandr19/manual-python-geologia" target="_blank">
            <img src="https://img.shields.io/github/stars/kevinalexandr19/manual-python-geologia.svg?style=social&label=Github Repo">
        </a>
        &nbsp;&nbsp;
        <!-- Licencia -->
        <img src="https://img.shields.io/github/license/kevinalexandr19/manual-python-geologia.svg?color=forestgreen">
        &nbsp;&nbsp;
        <!-- Release date -->
        <img src="https://img.shields.io/github/release-date/kevinalexandr19/manual-python-geologia?color=gold">
    </span>
    <br>
    <span>
        <!-- Perfil de LinkedIn -->
        <a target="_blank" href="https://www.linkedin.com/in/kevin-alexander-gomez/">
            <img src="https://img.shields.io/badge/-Kevin Alexander Gomez-5eba00?style=social&logo=linkedin">
        </a>
        &nbsp;&nbsp;
        <!-- Perfil de Github -->
        <a target="_blank" href="https://github.com/kevinalexandr19">
            <img src="https://img.shields.io/github/followers/kevinalexandr19.svg?style=social&label=kevinalexandr19&maxAge=2592000">
        </a>
    </span>
    <br>
</div>

***

<span style="color:lightgreen; font-size:25px">**PG002 - Librerías fundamentales de Python**</span>

Bienvenido al curso!!!

Vamos a revisar las librerías fundamentales usadas en el lenguaje Python a través de <span style="color:gold">ejemplos en Geología</span>. <br>
Es necesario que tengas un conocimiento previo en la sintáxis de Python, geología general, matemática y estadística.


<span style="color:gold; font-size:20px">**Matplotlib**</span>

***
- [¿Qué es Matplotlib?](#parte-1)
- [Subplots](#parte-2)
- [Diagrama de dispersión](#parte-3)
- [Figura de líneas](#parte-4)
- [Diagrama de barras](#parte-5)
- [Histograma](#parte-6)
- [Boxplot y Violinplot](#parte-7)
- [Detalles adicionales en figuras](#parte-8)
- [Guardar una figura](#parte-9)

***

<a id="parte-1"></a>

### <span style="color:lightgreen">**¿Qué es Matplotlib?**</span>
***

<span style="color:gold">Matplotlib</span> es una librería de visualización de datos que permite crear gráficos de alta calidad en diversos formatos, incluyendo figuras de líneas, diagramas de dispersión, histogramas, diagramas de barras y más.

Matplotlib se utiliza comúnmente en disciplinas científicas y de ingeniería para visualizar datos y resultados de experimentos. <br>
También es una herramienta útil para la exploración de datos y la presentación de resultados en informes y presentaciones.

Además de su versatilidad, una de las fortalezas de Matplotlib es su capacidad de personalización. <br>
Los usuarios pueden controlar muchos aspectos de la apariencia de sus gráficos, incluyendo colores, etiquetas, títulos y leyendas, y pueden utilizar estilos predefinidos o crear sus propias configuraciones personalizadas.

Para usar Matplotlib en Python, empezaremos importando el módulo de figuras de `matplotlib` llamado `pyplot`: 
> Usaremos `plt` como una referencia abreviada del módulo. También importaremos `numpy`.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

Para los ejemplos de visualización, usaremos las siguientes funciones:
- `subplots`: crea el espacio para una o varias figuras ordenadas en filas y columnas.
- `scatter`: crea un diagrama de dispersión de puntos.
- `plot`: crea una figura de líneas.
- `bar`: crea un diagrama de barras.
- `hist`: crea un histograma.
- `boxplot` y `violinplot`: crean figuras que nos ayudan a visualizar la distribución de los datos.

Matplotlib es una librería fuertemente orientada a objetos, por lo tanto, usaremos identificadores. <br>
Para identificar las figuras, usaremos los siguientes nombres:
- `fig`: referencia el cuadro general de la figura.
- `axs` o `ax`: referencian a las subfiguras creadas.

El formato general para crear una figura es el siguiente:

```python
# Figura principal
fig, ax = plt.subplots(figsize=(ancho, alto))

# Gráfico (por ejemplo, plot)
ax.plot(x, y)

# Mostrar la figura
plt.show()
```

<a id="parte-2"></a>

### <span style="color:lightgreen">**Subplots**</span>
***

In [None]:
# Figura principal vacía
fig, ax = plt.subplots(figsize=(4, 4))

# Mostrar la figura
plt.show()

In [None]:
# Figura principal vacía de 2 filas y 2 columnas (en total 4 subfiguras)
fig, axs = plt.subplots(nrows=2, ncols=2, figsize=(6, 6))

# Mostrar la figura
plt.show()

<a id="parte-3"></a>

### <span style="color:lightgreen">**Diagrama de dispersión**</span>
***

In [None]:
# Creamos un input de coordenadas X e Y
x = np.random.randn(50)            # 50 valores aleatorios de una distribución normal
y = (3 * x) + np.random.randn(50)  # 50 valores aleatorios en función de x de una distribución normal

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de dispersión
ax.scatter(x=x, y=y)

# Mostrar la figura
plt.show()

<a id="parte-4"></a>

### <span style="color:lightgreen">**Figura de líneas**</span>
***

In [None]:
# Input
x = np.arange(1, 11, 1)
y = x ** 2 # Transformación de x elevado al cuadrado
z = x ** 3 # Transformación de x elevado al cubo

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Figura de líneas
ax.plot(x, y) # Primera función de x al cuadrado
ax.plot(x, z) # Segunda función de x al cubo

# Mostrar la figura
plt.show()

Usaremos además el método `legend` para agregar una leyenda y `fontsize` para modificar el tamaño de letra en la leyenda. <br>
La leyenda usará los valores asignados en el parámetro `label` de cada figura, y tendrá por título el valor asignado al parámetro `title`.

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Figura de líneas
ax.plot(x, y, label="$x^{2}$") # Primera función de x al cuadrado
ax.plot(x, z, label="$x^{3}$") # Segunda función de x al cubo

# Leyenda
ax.legend(fontsize=14, title="Funciones")

# Mostrar la figura
plt.show()

También, podemos agregar una grilla o cuadrícula con el método `grid`:

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Figura de líneas
ax.plot(x, y, label="$x^{2}$") # Primera función de x al cuadrado
ax.plot(x, z, label="$x^{3}$") # Segunda función de x al cubo

# Leyenda
ax.legend(fontsize=14, title="Funciones")

# Grilla
ax.grid()

# Mostrar la figura
plt.show()

<a id="parte-5"></a>

### <span style="color:lightgreen">**Diagrama de barras**</span>
***

In [None]:
# Input
x = np.array(["A", "B", "C"])
y = np.random.randint(1, 100, (3,))

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de barras
ax.bar(x, y)

plt.show()

<a id="parte-6"></a>

### <span style="color:lightgreen">**Histograma**</span>
***

In [None]:
# Input
x = np.random.randn(100_000,) # Vector de 100,000 valores aleatorios de una distribución normal

El parámetro `bins` indica el número total de barras dentro del histograma.

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Histograma
ax.hist(x, bins=50)

# Mostrar la figura
plt.show()

Podemos agregar bordes a cada barra con el parámetro `edgecolor`, y podemos cambiar el color de las barras con el parámetro `color` y `alpha` para la transparencia:

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Histograma
ax.hist(x, bins=50, edgecolor="black", color="red", alpha=0.5)

# Mostrar la figura
plt.show()

<a id="parte-7"></a>

### <span style="color:lightgreen">**Boxplot y Violinplot**</span>
***

In [None]:
# Input
x = np.random.randn(100_000,)                 # 100,000 valores aleatorios de una distribución normal
y = (2 * x) + 1 + np.random.randn(100_000,)   # 100,000 valores aleatorios en función de x
z = 2 - x + np.random.randn(100_000,)         # 100,000 valores aleatorios en función de x

In [None]:
# Figura principal
fig, axs = plt.subplots(nrows=1, ncols=2, figsize=(10, 5))

# Boxplot
axs[0].boxplot([x, y, z])

# Violinplot
axs[1].violinplot([x, y, z])

# Mostrar la figura
plt.show()

<a id="parte-8"></a>

### <span style="color:lightgreen">**Detalles adicionales en figuras**</span>
***

<span style="color:gold">**Diagrama de dispersión: puntos de tamaño variable**</span>

Usaremos el parámetro `s` o `size` de la función `scatter` para modificar el tamaño de los puntos. Este parámetro puede tomar un valor constante o un arreglo de valores.

In [None]:
# Input
x = np.random.randn(1000)             # 1000 valores aleatorios de una distribución normal
y = (3 * x) + np.random.randn(1000)   # 1000 valores aleatorios en función de x
s = np.random.randint(5, 100, (1000)) # 1000 valores aleatorios enteros entre 5 y 100

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de dispersión
im = ax.scatter(x, y, s=s)

# Mostra la figura
plt.show()

Para agregar un borde de color a los puntos, usaremos el parámetro `edgecolor` y para agregarles transparencia, usaremos el parámetro `alpha`:

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(6, 6))

# Diagrama de dispersión
ax.scatter(x, y, s=s, edgecolor="k", alpha=0.8)

plt.show()

Ahora, referenciaremos la figura ubicada en `ax` usando la variable `im`. <br>
Luego, usaremos el método `legend_elements` para obtener los símbolos `handles` y etiquetas `labels` que usaremos en la creación de la leyenda. <br>
Por último, crearemos la leyenda usando la función `legend` y los parámetros mencionados anteriormente.

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(6, 6))

# Diagrama de dispersión
im = ax.scatter(x, y, s=s, edgecolor="black", alpha=0.8)

# Leyenda
handles, labels = im.legend_elements(prop="sizes")
ax.legend(handles, labels)

plt.show()

***
<span style="color:gold">**Diagrama de dispersión: barra de colores**</span>

Primero, generaremos un diagrama de dispersión en el cual los puntos `x` e `y` estarán coloreados de acuerdo a un conjunto de datos `z`. <br>
Para esto, utilizaremos un mapa de colores y lo asignaremos a la variable `cmap`.

In [None]:
# Input
x = np.random.randn(1000)            # 1000 valores aleatorios de una distribución normal
y = (3 * x) + np.random.randn(1000)  # 1000 valores aleatorios en función de x
c = 5 + np.random.randn(1000)        # 1000 valores aleatorios de una distribución normal

# Mapa de colores
cmap = plt.cm.plasma

In [None]:
# Visualizar el mapa de colores
cmap

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de dispersión
im = ax.scatter(x, y, c=c, cmap=cmap, s=50, edgecolor="black")

# Mostrar la figura
plt.show()

Para agregar una barra de colores, usaremos el método `colorbar` y lo asignaremos a una variable llamada `cbar`. <br>
Este método utiliza los siguientes parámetros:
- `mappable`: figura de la cual se describirán los colores
- `ax` (opcional): la barra puede obtener espacio de una o varias figuras, estas figuras se señalan usando este parámetro

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(6, 5))

# Diagrama de dispersión
im = ax.scatter(x, y, c=c, cmap=cmap, s=50, edgecolor="black")

# Barra de colores
cbar = fig.colorbar(im, ax=ax)
cbar.ax.set_title("Cu(%)", fontsize=12, y=1.01)

# Grilla
ax.grid()
ax.set_axisbelow(True) # Colocar grilla debajo del gráfico

# Título
ax.set_title("Valores de Cobre", fontsize=13)

# Mostrar la figura
plt.show()

***
<span style="color:gold">**Diagrama de barras: colocar el valor de frecuencia encima de cada barra**</span>

Primero, crearemos un diagrama de barras básico:

In [None]:
# Input
x = ["A", "B", "C"]
y = np.random.randint(10, 100, (3,))


# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de barras
ax.bar(x, y)

plt.show()

Ahora, removeremos los ticks del eje y:

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de barras
ax.bar(x, y)

# Ticks del eje y
ax.set_yticks([])

plt.show()

Tenemos que remover el cuadro que encierra a la figura:
- Usando la función `gca`, obtenemos una referencia del espacio usado en la figura, también podemos usar `ax`.
- A partir de esta referencia, llamamos el atributo `spines`, que corresponde a las líneas del cuadro que encierran la figura.
- Luego, usaremos el método `values` para obtener una lista con las referencias de cada uno de los lados del cuadro.
- Por último, usaremos un bucle que itere a través de esta lista de lados y a través del método `set_visible(False)` pasarán a estar ocultas en la figura.

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de barras
ax.bar(x, y)

# Ticks del eje y
ax.set_yticks([])

# Removemos el cuadro
for spine in ax.spines.values():
    spine.set_visible(False)

plt.show()

Ahora que ya removimos algunos elementos innecesarios, colocaremos el texto de la frecuencia encima de cada una de las barras:
- Empezaremos referenciando el diagrama de barras usando la variable `barra`.
- Luego, usando un bucle, iteraremos a través de cada una de las barras en el diagrama `barra` para colocar el texto.
- Usando la función `text`, colocaremos un texto cuyas coordenadas serán extraídas a partir de dos funciones:
    - `get_x + get_width / 2` para la coordenada x
    - `get_height + 1` para la coordenada y
- El string del texto será una transformación de la altura de la barra (pues esta representa la frecuencia).
- Por último, centraremos el texto con el parámetro `ha` y agrandaremos el tamaño del texto con `fontsize`.

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de barras
barra = ax.bar(x, y)

# Ticks del eje y
ax.set_yticks([])

# Removemos el cuadro
for spine in ax.spines.values():
    spine.set_visible(False)
    
# Texto
for bar in barra:
    ax.text(bar.get_x() + bar.get_width()/2, # Posición del texto en x
            bar.get_height() + 1,            # Posición del texto en y
            str(int(bar.get_height())),      # Frecuencia
            ha="center", fontsize=12)

plt.show()

<a id="parte-9"></a>

### <span style="color:lightgreen">**Guardar una figura**</span>
***
Podemos guardar una figura en diferentes formatos de archivo y usando una resolución de baja o alta calidad.

> Nota: usaremos un fondo oscuro en esta imagen para que contraste con el tema oscuro de Jupyter Lab.

El formato en el cual podemos guardar una figura puede ser `png`, `jpeg`, `pdf`, `svg`, etc.

In [None]:
# Input
x = np.random.randn(50)           # 50 valores aleatorios de una distribución normal
y = (3 * x) + np.random.randn(50) # 50 valores aleatorios en función de x

In [None]:
# Fondo oscuro en una figura
plt.style.use("dark_background")

In [None]:
# Figura principal
fig, ax = plt.subplots(figsize=(5, 5))

# Diagrama de dispersión
ax.scatter(x, y)

plt.show()

Una vez creada la figura, podemos usar la función `savefig` sobre la variable `fig` que representa a toda la figura principal. <br>
El parámetro `dpi` (dots per inch) controla la resolución de la figura:

In [None]:
fig.dpi

Para figuras de alta calidad, el `dpi` recomendado es de 300. Para figuras de baja calidad, se suele usar un `dpi` de 72.

Debemos de tener en cuenta que cuanto más alto es el valor de `dpi`, más tiempo tardará Python en procesar y guardar la imagen.

> En este ejemplo, guardaremos la imagen en formato `png` usando dos valores distintos de `dpi`.

In [None]:
fig.savefig("figura_hd.png", dpi=300)

In [None]:
fig.savefig("figura.png", dpi=72)

Por último, guardaremos la figura en `pdf`:

In [None]:
fig.savefig("figura.pdf", dpi=300)

***