Instituto Politécnico Nacional - Centro de Investigación en Cómputo Departamento de Diplomados y Extensión Profesional
Instructor: Alan Badillo Salas (dragonnomada123@gmail.com)
Este es el repositorio oficial del curso de Machine Learning, del IPN-CIC. En él se encuentra todo el material generado, el temario del curso y recursos adicionales como trabajos y libros.
Tema: Bienvenida, visión general del Machine Learning
Resumen
En esta clase hemos revisado los conceptos fundamentales del aprendizaje automático. Se ha discutido el concepto de máquina, la cuál se divide en la máquina abstracta o modelo matemático y la máquina aplicada o modelo de datos, la cuál envuelve al modelo matemático y realiza el cómputo de entrada y salida de datos. También se ha discutido el concepto de aprendizaje, que deriva en la toma de decisiones basado en parámetros de ajuste de algún modelo (máquina), la cuál devuelva los mejores valores ajustados y predictos para un entrada variable, según su configuración. Finalmente se ha introducido el flujo de operación de los algoritmos, exponiendo la necesidad de aprender a manipular arreglos de numpy, dataframes de pandas y visualización de datos con matplotlib.
Tema: Regresiones de Datos
Resumen
En esta clase hemos profundizado en los conceptos sobre regresiones de datos, partiendo de la Regresión Lineal, las regresiones de tipo Ridge, Lasso y Elastic-Net, la Regresión Logística, los Modelos Lineales Generalizados y finalmente la Regresión por Máquina de Soporte.
Tema: Clasificación de Datos
Introducción
La clasificación de datos consiste en programar máquinas clasificar conjuntos de datos (vectores), mediante salidas de clasificación. A diferencia de las regresiones de datos, los clasificadores usan técnicas más avanzadas para lograr aprender a qué entrada corresponde qué salida. El problema derivado de la clasificación se puede entender como un aprendizaje supervisado, dónde las máquinas son entrenadas mediante conjuntos de datos etiquetados, para lograr aprender un modelo que prediga con la mejor exactitud, cuál debería ser la categoría, clase, etiqueta o valor para un conjunto de datos de entrada. Los árboles de decisión usarán un conocimiento basado en comparación entre variables para determinar caminos de aprendizaje, las redes neuronales ajustarán pesos a neuronas de activación y las máquinas de soporte vectorial ajustarán vectores de soporte para dividir el espacio.