Tecnicatura Universitaria en Inteligencia Artificial

Trabajo Práctico Integrador

Aprendizaje Automatico 1

Equipo:

Ferrucci Constantino
Giampaoli Fabio

Fechas:

13/10/2023 (Primer entrega. Hasta item 3)
27/10/2023 (Segunda entrega. Hasta item 4)
20/11/2023 (Tercer entrega. Hasta ítem 5 y 6)
7/12/2023 (Cuarta entrega. Hasta items 7, 8, 9 y 10)

Instalación

Para ejecutar estos programas, se debe clonar el repositorio dentro de su local y posteriormente instalar las librerías necesarias para su ejecución.

Para ello, se recomienda crear un entorno virtual con python de la siguiente forma:

python -m venv venv

Luego activar el entorno virtual con:

source venv/bin/activate

(En caso de utilizar Windows, el comando anterior cambia a venv\Scripts\activate.bat)

Luego instalar las librerías mediante pip:

pip install -r requirements.txt

Una vez instaladas las librerías, se puede ejecutar el programa mediante:

streamlit run main.py

Acceso

Para poder acceder al deploy de la aplicación lo puedes visitar en el siguiente link:

Link: https://aprendizajeautomatico1-wzveamkrgdnnyqvyrbrjfp.streamlit.app/

Para visualizar el desarrollo del proyecto descrito en el resumen debajo, puede acceder al entorno de google colab:

Link: https://drive.google.com/file/d/1Itfa8GS_oLb3NQ77ukn1l7NVXI_yRzZA/view?usp=sharing

Resumen

El dataset elegido consiste de variables meteorológicas de Australia en determinado período de tiempo que serán de interes para la predición y clasificación de la cantidad y posibilidad de lluvia en algún día con ciertas características mediante modelos estudiados en el cursado de la materia.

El dataset cuenta con distintos tipos de varibables (continuas, categoricas, discretas, binarias, fechas), muchas de ellas son de utilidad para obtener información climática del registro (un día particular), y otras son de utilidad para úbicacion espacio-temporal del registro.

En la primera etapa del trabajo práctico, es de principal interés el análisis y tratamiento del conjunto de datos para conocer el contexto sobre el cual vamos a desarrollarnos. Se establecen lineamientos generales y limitaciones para contextualizar a los modelos solo en deteerminadas area de Australia para cierto periodo de tiempo.

Es claro que un el modelo por si solo no puede realizar un buen trabajo si el dataset no es preprocesado para maximizar el rendimiento del entrenamiento. Por ello, la segunda etapa es el tratamiento primario de los datos, donde se imputan, codifican, suavizan, estandarizan, se balancean las clases, se crean nuevas variables y se adapta el dataset original para optimizar el eprendizaje de los modelos.

La tercer etapa consiste en el entrenamiento y optmización de modelos de regresión lineal para la estimación de la variable continua de la cantidad de lluvia del dia posterior, utilizando gráficas, análisis y descripciones se encuentra un modelo óptimo para este contexto con la limitación de utilizar modelos lineales.

La cuarta etapa consiste en el entrenamiento y optmización de modelos de regresión logistica para la estimación de la variable binaria de la presencia de lluvia del dia posterior. Nuevamente, mediante análisis e hiperparametrización se encuentra un modelo de clasificación óptimo, que resulta ser nuestro modelo final para el problema de clasificación.

La anteultima etapa trata de resolver los dos problemas previos pero con un enfoque de modelos conexionistas de aprendizaje profundo. Para ello se han diseñado, optimizado y entrenado modelos de redes neuronales, primeramene para la estimación de la variable continua, y luego con un modelo similar, para la estimación de la variale binaria. Se han encontrado resultados positivos que mejoran los rendimientos para el problema de regresión. Por lo que este modelo es el elegido para la aplicación final. Pero no es el caso del modelo de clasifación, ya que ha demostrado mejor rendimiento el modelo de regresión logística para este problema.

Por último, se pretende desplegar una aplicación dentro de un servidor cuyo objetivo es que un usuario pueda ingresar datos metereológicos de ciudades de Australia en un formulario con datos limitados al contexto inicial, y que se pueda elejir el problema a resolver por la aplicación (clasificación o regresión) en base a los datos. Los datos ingresados se procesan y se realizan con ellos predicciones con los modelos entrenados para retornar en tiempo real una predicción.

Name		Name	Last commit message	Last commit date
Latest commit History 54 Commits
code		code
data		data
models		models
src		src
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

code

code

data

data

models

models

src

src

.gitignore

.gitignore

README.md

README.md

init.py

init.py

main.py

main.py

requirements.txt

requirements.txt

Repository files navigation

Tecnicatura Universitaria en Inteligencia Artificial

Trabajo Práctico Integrador

Aprendizaje Automatico 1

Instalación

Acceso

Resumen

About

Releases

Packages

Contributors 2

Languages

Shannon-21/Aprendizaje_Automatico_1

Folders and files

Latest commit

History

Repository files navigation

Tecnicatura Universitaria en Inteligencia Artificial

Trabajo Práctico Integrador

Aprendizaje Automatico 1

Instalación

Acceso

Resumen

About

Resources

Stars

Watchers

Forks

Languages