![Texto alternativo](https://laserud.co/wp-content/uploads/2020/05/cropped-LOGOLASER-1.jpg "Grupo LASER")

# Tutoriales de Machine Learning

Esta iniciativa impulsada por **<a href="https://laserud.co">el grupo de investigación e inteligencia computacional LASER</a>** adscrito a la facultad de ingenierías de la Universidad Distrital Francisco José de Caldas proporciona a los estudiantes y al público en general una alternativa de aprendizaje de temas clave en Machine Learning.

Dentro de los tutoriales se encuentran temas como: el análisis y procesamiento de datos, entrenamiento de modelos de inteligencia computacional, series de tiempo, etc. La metodología se basa en los ejemplos, que contienen material reproducible ejecutado en Google Colab. De esta manera, los interesados adquieren conocimientos teóricos y prácticos de Machine Learning en un solo lugar.

Dentro de la biblioteca de tutoriales podemos encontrar los siquientes tópicos:

* **Introducción a Python**
* **Preparación de los datos**
* **Análisis exploratorio**
* **Algoritmos clásicos de machine learning**
* **Algoritmos basados en árboles de decisión**
* **Redes neuronales con imágenes**
* **Procesamiento de Lenguaje Natural (NLP)**
* **Series de tiempo**


## Introducción a Python

Es un lenguaje de programación de alto nivel interpretado, muy popular entre la comunidad cientifica, permite desarrollar todo tipo de aplicaciones. Además, al ser un lenguaje interpretado, requiere un interprete para ser traducido a lenguaje maquina por lo tanto puede ejecutarse en diferentes sistemas operativos.

Ahora vamos a conocer un poco más del lenguaje haciendo click <a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/Python/Python.ipynb">aquí</a>

## Estadística Descriptiva

Esta etapa sirve para tener un conocimiento más profundo y detallado de los datos utilizando diferentes técnicas estadísticas, como lo son:

* Descripcion de los datos
* Medidas de tendencia central
* Interpretación de diagramas
* Correlación de variables

Para ver diferentes ejemplos hacer click <a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/MineriaDatos/EstadisticaDescriptiva.ipynb">aquí</a>

## Preparación de los datos

Esta es quizás la etapa más importante en los procesos de análisis de datos, puesto que las decisiones que tome el científico de datos podrían verse reflejadas en:

* Darle algún sentido a los datos para facilitar la comprensión en una etapa futura
* ¿Qué algoritmos podrian utilizarse para interactuar con los datos?

Para conocer en mayor detalle las tareas más frecuentes en esta etapa hacer click <a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/MineriaDatos/PreparacionDatos.ipynb" target="_blank">aquí</a>

## Algoritmos clásicos de ML

* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/Regresion/RegresionLineal.ipynb">Regresión lineal</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/Regresion/RegresionLogistica.ipynb">Regresion logistica</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/AlgoritmosClasicos/KNNeighbors.ipynb">KNNeighbors</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/AlgoritmosClasicos/NaiveBayes.ipynb">Naive Bayes</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/AlgoritmosClasicos/SVC.ipynb">SVC</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/AlgoritmosClasicos/DiscriminanteLineal.ipynb">Analisis de discriminante linear</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/AlgoritmosClasicos/K-Means.ipynb">KMeans</a>**


## Redes neuronales

Para el tratamiento con redes neuronales se encuentran dos grandes librerias que podríamos utilizar como lo son **Pytorch**, **Tensorflow** y **Keras**; desarrolladas por Facebook, Google y el proyecto ONEIROS (Open-ended Neuro-Electronic Intelligent Robot Operating System) respectivamente.

Para efectos de este tutorial se utilizara la combinación **Tensorflow 2.0 + Keras** puesto que constituyen una combinación muy popular al realizar deep learning

* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/TensorFlow-Neural-Network.ipynb">Red neuronal con Tensorflow</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/Imagenes/ImageClass/CNN_img_class.ipynb">Clasificación de imágenes desde cero</a>**

## Árboles de Decisión
Los árboles de decisión crean un modelo que predice las etiquetas evaluando un árbol de preguntas sobre las características del tipo if-then-else true/false. Entonces se estima el mínimo número de preguntas necesarias para evaluar la probabilidad de tomar una decisión correcta. Los árboles de decisión pueden ser usados en tareas de clasificación para predecir una categoría, o en tareas de regresión para predecir un valor numérico continuo. Tenemos los siguientes tutoriales sobre árboles de decisión:
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/BasadosArboles/ArbolesDecision.ipynb">Arboles de decisión</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/BasadosArboles/RandomForest.ipynb">Random forest</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/BasadosArboles/Class-XGBoost/XGBoost-class.ipynb">XGBoost</a>**

## Procesamiento de Lenguaje Natural
El Procesamiento de Lenguaje Natural (NLP) es un área de estudio de las ciencias de la computación que se interesa por las interacciones entre las maquinas y el lenguaje humano. El NLP ayuda a que las maquinas puedan entender e interpretar diferentes idiomas, que sean capaces de descifrar las relaciones entre palabras y su significado. Dentro de las variadas aplicaciones se encuentran: asistentes virtuales, traducción automática de texto, recuperación de información, clasificación de textos, etc. Dentro de NLP hemos desarrollado los siguientes tutoriales:

* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/NLP/CleanTextNLP/CleaningNLP.ipynb">Introducción a NLP</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/NLP/TextSummarization/summarization-seq2seq.ipynb">Síntesis de texto</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/NLP/WordLevelModel/WordLevelModel.ipynb">Generación de texto</a>**

## Series de Tiempo

Las series de tiempo son secuencias de datos, observaciones o valores, tomados en intervalos de tiempo específicos y ordenados cronológicamente. Nos encontraremos con este tipo de dato en prácticamente cualquier industria que analicemos. Para hablar de series de tiempo tenemos los siguientes tutoriales:

* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/SeriesDeTiempo/TimeSeies/TimeSeries.ipynb">Introducción a series de tiempo</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/SeriesDeTiempo/Anomaly-TimeSeries/Anomaly-TimeSeries.ipynb">Detección de anomalías en Series de Tiempo</a>**
* **<a href="https://colab.research.google.com/github/LASER-UD/machinelearning/blob/main/SeriesDeTiempo/OneStepLSTM/OneStepLSTM.ipynb">Predicción de Series de Tiempo con redes LSTM</a>**