<span style="color:lightgreen; font-size:30px">**PG103 - Visualización de datos en Geología**</span>
***
<span style="color:gold; font-size:30px">**Visualización de sondajes en 3D**</span>
***

<span style="font-size:20px"> **Autor: Kevin Alexander Gómez** </span>

<span style="font-size:16px"> **Contacto: kevinalexandr19@gmail.com | [Linkedin](https://www.linkedin.com/in/kevin-alexander-g%C3%B3mez-2b0263111/) | [Github](https://github.com/kevinalexandr19)** </span>
***

Bienvenido al curso PG103 - Visualización de datos en Geología!!!

Vamos a revisar ejemplos de <span style="color:gold">visualización de datos</span> en Geología usando código en Python.\
Es necesario que tengas un conocimiento previo en programación con Python, estadística y geología general.

<span style="color:lightgreen"> Este notebook es parte del proyecto [**Python para Geólogos**](https://github.com/kevinalexandr19/manual-python-geologia), y ha sido creado con la finalidad de facilitar el aprendizaje en Python para estudiantes y profesionales en el campo de la Geología. </span>

En el siguiente índice, encontrarás los temas que componen este notebook:

<span style="font-size:20px"> **Índice** </span>
***
- [Sondajes de perforación diamantina](#parte-1)
- [Visualización de variables categóricas](#parte-2)
- [Visualización de variables numéricas](#parte-3)

***

Antes de empezar tu camino en programación geológica...\
Recuerda que puedes ejecutar un bloque de código usando `Shift` + `Enter`:

In [None]:
2 + 2

Si por error haces doble clic sobre un bloque de texto (como el que estás leyendo ahora mismo), puedes arreglarlo usando también `Shift` + `Enter`.
***

<a id="parte-1"></a>

### <span style="color:lightgreen">**Sondajes de perforación diamantina**</span>
***

Los sondajes de perforación diamantina se utilizan en la exploración geológica y minera para obtener muestras de roca y suelo del subsuelo.\
Estas muestras se extraen de agujeros en la tierra con un diámetro pequeño y con una precisión muy alta.

La perforación diamantina utiliza un equipo de perforación especializado que está diseñado para cortar y extraer núcleos de roca cilíndricos del subsuelo. Una broca de diamante se coloca en el extremo de un tubo hueco y se hace girar a alta velocidad para cortar el material de la roca. Los núcleos de roca se extraen a medida que se perfora y se recuperan en la superficie.

<span style="color:#43c6ac">La perforación diamantina es muy precisa y permite obtener muestras de alta calidad de la roca y el suelo del subsuelo.</span>

Esto es importante ya que proporciona información valiosa sobre la estructura geológica y las características del yacimiento que se está explorando.

Además, los núcleos de roca recuperados se pueden analizar en el laboratorio para obtener información detallada sobre la mineralogía, la geología y las propiedades físicas de la roca.
***

<a id="parte-2"></a>

### <span style="color:lightgreen">**Visualización de variables categóricas**</span>
***

Empezaremos importando `pandas` para cargar los archivos `collar.csv`, `survey.csv` y `lith.csv`, que contienen la información necesaria para graficar los sondajes.\
También importaremos la función `DrillData` del módulo `corelab`:

In [None]:
### INSTALAR CORELAB
!pip install corelab

In [None]:
import pandas as pd
from corelab import DrillData

Cargamos los archivos usando la función `read_csv`:

In [None]:
collar = pd.read_csv("files/collar.csv") # Collar
survey = pd.read_csv("files/survey.csv") # Survey
lith = pd.read_csv("files/lith.csv") # Litología (valores categóricos)
assay = pd.read_csv("files/assay.csv") # Assay (valores numéricos)

La función `DrillData` crea un objeto que almacena la información necesaria para realizar la visualización en 3D de los sondajes:
- `collar` es el parámetro que referencia al archivo `collar` de los sondajes.
- `survey` es el parámetro que referencia al archivo `survey` de los sondajes.
- `table` es el parámetro que referencia la información geológica de los sondajes.

Asignamos la información a la variable `data` y seleccionamos las columnas necesarias en collar, survey y table:
- Para `collar`, debemos seleccionar las columnas que correspondan a: `ID`, `X`, `Y`, `Z`.
    - La columna `ID` referencia el nombre del sondaje, las columnas `X`, `Y` y `Z` referencian su ubicación en superficie.
- Para `survey`, debemos seleccionar las columnas que correspondan a: `ID`, `AT`, `AZ`, `DIP`.
    - La columna `AT` referencia la profundidad del tramo, `AZ` y `DIP` referencian al rumbo y buzamiento registrado en dicho tramo.
- Para `table`, debemos seleccionar las columnas que correspondan a: `ID`, `FROM`, `TO`.
    - Las columnas `FROM` y `TO` referencian los intervalos de inicio y fin en cada tramo del sondaje.
    
En este caso, usaremos la variable `lith` que contiene información litológica de sondajes (variable categórica):

In [None]:
data = DrillData(collar=collar,
                 survey=survey,
                 table=lith)

Una vez seleccionamos las columnas correspondientes, la información es procesada de manera automática.

Durante el procesamiento, debemos tener en cuenta lo siguiente:
- Las columnas de `ID` son transformadas a datos de tipo string.
- Las columnas de `X`, `Y`, `Z`, `AT`, `AZ`, `DIP`, `FROM` y `TO` son transformadas a datos de tipo float, cualquier valor que no pueda ser transformado a número es automáticamente transformado a valor vacío o `NaN`.
- Para las columnas `AT`, `FROM` y `TO`, los valores deben ser siempre positivos.\
Por tanto, los valores negativos son automáticamente transformados a valores vacíos o `NaN`.
- Para la columna `AZ`, los valores deben variar entre 0 y 360.\
Cualquier otro valor que no cumpla con esta condición es transformado automáticamente a `NaN`.
- Para la columna `DIP`, los valores deben ser mayores o iguales a 0 y menores a 90.\
Cualquier otro valor que no cumpla con esta condición es transformado automáticamente a `NaN`.

El atributo `dtypes` devuelve un diccionario describiendo el tipo de dato asignado a cada columna de `table`:
- No tiene en cuenta las columnas `ID`, `FROM` y `TO`.
- Si la columna contiene valores numéricos, aparecerá en `dtypes` de la siguiente forma: `<columna>: "numeric"`.
- Si la columna contiene valores categóricos, aparecerá en `dtypes` de la siguiente forma: `<columna>: "categoric"`.

In [None]:
data.dtypes

Luego de generar el input, usaremos el método `interactive_plot3d` para visualizar los sondajes en 3D:
> Clic izquierdo para girar la vista en 3D.\
> Shift + click derecho para mover la posición de la vista en 3D.

In [None]:
data.interactive_plot3d()

También podemos pasar una paleta de colores usando un diccionario con la siguiente estructura:

In [None]:
data.feature_palette = {"ROCK": {"SAPR": "gray",
                                 "SGNCRLSS": "gray",
                                 "E1": "green",
                                 "DA": "red",
                                 "E3": "green",
                                 "E2": "green",
                                 "EBX2": "orange",
                                 "COLLV": "gray",
                                 "I1": "blue",
                                 "I2": "blue",
                                 "IBX": "orange",
                                 "SBX": "orange",
                                 "ASH": "purple",
                                 "H": "lightblue",
                                 "EBX1": "orange"
                                }
                       }

In [None]:
data.interactive_plot3d()

<a id="parte-3"></a>

### <span style="color:lightgreen">**Visualización de variables numéricas**</span>
***

Asignamos la información a la variable `data` y esta vez usaremos la variable `assay` que contiene información numérica de sondajes.

También podemos usar un diccionario `columns` con los nombres de cada columna del collar, survey y table para no tener que seleccionar manualmente al inicializar `DrillData`:

In [None]:
# Nombres de las columnas a usar en collar, survey y table
# El orden de la lista debe coincidir con el formato de las columnas establecidas (e.g. "hole_id" con "ID")
columns = {"collar": ["ID", "X", "Y", "Z"],
           "survey": ["ID", "AT", "AZ", "DIP"],
           "table": ["ID", "FROM", "TO"]}

In [None]:
# Inicializamos DrillData
data = DrillData(collar=collar,
                 survey=survey,
                 table=assay,
                 columns=columns)

In [None]:
data.dtypes

Una vez procesada la información, la visualizamos con el método `interactive_plot3d`:
> Nota: algunas de las variables tienen una distribución log-normal, por lo que su visualización será deficiente.\
> En tales casos, es mejor transformar la información numérica a categórica (intervalos).

In [None]:
data.interactive_plot3d()

***