# <span style='color:orange'>Un modelo Tipológico de juguete</span>




**Los cuadernos en este directorio demuestran el desarrollo y aplicación de un modelo para clasificar fragmentos cerámicos. Puedes reproducir todo el proceso, modificar o entrenar diferentes modelos que se ajusten a tus curiosidades**

**El flujo de trabajo está compuesto por los siguientes cuadernos**

---

**1. [Preproceso](./Multicollinearity.ipynb)**: Análisis estadístico exploratorio e implementación de procesos para la identificación de correlaciones y multicolinearidad entre las variables en nuestro juego de datos.

**2. [Fase No-Supervisada](./CCA_Clustering.ipynb)**: Este cuaderno presenta la implementación de los procedimientos necesarios para realizar el agrupamiento de los elementos de nuestro conjunto de datos.

**3.[Fase Supervisada](./CCA_Classif.ipynb)**: Este cuaderno presenta el desarrollo y comparación de diferentes algoritmos de clasificación supervisada. Como resultado final el modelo puede ser guardado para su posterior uso en nuevos conjuntos de datos.



<div style="text-align: justify"> Este trabajo explora la utilidad de la aplicación de un enfoque de adquisición de conocimientos al problema de la clasificación de objetos arqueológicos, particularmente fragmentos cerámicos; uno de los materiales más abundantes en el registro arqueológico y cuya gestión implica mayor costo en términos de tiempo y recursos en el marco de cualquier investigación. Para ello se construyó un modelo tipológico implementando diversas herramientas de los principales paradigmas del aprendizaje de máquinas (aprendizaje no-supervisado y supervisado). El modelo fue implementado sobre un conjunto de datos de cerámicas arqueológicas del caribe colombiano. Los resultados revelan que el modelo funciona mejor cuando se cuenta con tipologías de referencia bien definidas y criterios clasificatorios estandarizados que puedan servir para entrenar algoritmos en tareas de aprendizaje supervisado. Por el contrario, una de sus mayores debilidades es su poca utilidad comparativa. Esto no solo se debe a las herramientas utilizadas sino a la calidad de la información disponible en el contexto de estudio
</div>
 

### 1. Preproceso

Ejecuta el siguiente cuaderno para explorar estadísticamente el conjunto de datos y realizar algunos procesos básicos de preprocesamiento


[Preproceso](./Multicollinearity.ipynb)

Este cuaderno guarda el conjunto de datos pre-procesado en: `./intermediate_Data/datos_preprocesados`

### 2. Fase No-Supervisada

En el siguiente cuaderno se realizan los procedimientos necesarios para ejecutar un análisis de agrupamiento jerárquico del conjunto de datos

[Clustering](./CCA_Clustering.ipynb)

Como resultado obtenemos un nuevo dataset supervisado. Esto quiere decir que ahora cada elemento está asignado a un "tipo" cerámico determinado. Los datos se guardan en: `./intermediate_data/datos_supervisados`

### 3. Fase Supervisada

[Clasificación](./CCA_Classif.ipynb)

En este cuaderno se realiza el entrenamiento, evaluación y comparación de diferentes algoritmos de clasificación supervisada. Como resultado, un modelo entrenado se guarda para ser usado despues en la clasificación de nuevos datos

---

Software, operating system, and hardware information.

---

In [9]:
%load_ext watermark
%watermark -v -m -p ipywidgets,matplotlib,numpy,pandas,sklearn,pycaret,jupyterlab,seaborn,scipy

The watermark extension is already loaded. To reload it, use:
  %reload_ext watermark
Python implementation: CPython
Python version       : 3.8.10
IPython version      : 7.34.0

ipywidgets: 7.7.5
matplotlib: 3.6.3
numpy     : 1.23.5
pandas    : 1.4.4
sklearn   : 1.2.2
pycaret   : 3.0.4
jupyterlab: 3.6.1
seaborn   : 0.12.2
scipy     : 1.10.1

Compiler    : GCC 9.4.0
OS          : Linux
Release     : 5.15.0-105-generic
Machine     : x86_64
Processor   : x86_64
CPU cores   : 4
Architecture: 64bit



---

**Authors:** [Daniel Sanchez-Gomez](mailto:daniel-sanchez-gomez@edu.ulisboa.pt), Universidade de Lisboa, Mayo 2024

---