Material utilizado en el curso MA6202: Laboratorio de Ciencia de Datos. El curso se divide en 3 secciones:
Se comienza el curso repasando las herramientas básicas de Python, se estudia el sistema de control de versiones git y el paradigma de programación orientada a objetos. Se centra la enseñanza en técnicas de visualización, exploración y limpieza de datos.
Se estudian métodos de aprendizaje automático que extienden de manera teórica y práctica aquellas herramientas vistas en el curso de ML. Se ven librerías especificas como pyro, pytorch, sklearn y pommegranate entre otras.
Finalmente se estudian técnicas de empaquetado de aplicaciones y despliegue de estas en la nube se busca que los estudiantes sean capaces se desplegar prototipos de aplicaciones de ciencia de datos los cuales presenten resultados de manera clara e interactiva Método de evaluación
El curso se evalúa a partir de ejercicios de programación y tareas. Por medio de estas evaluaciones se controla el manejo de las diferentes técnicas y herramientas aprendidas en el curso. El examen del curso corresponde al despliegue de la solución correspondiente a la última tarea y su informe final. El esquema expuesto se reduce a:
NE = Promedio notas de ejercicios
NT = Promedio notas de tareas
NX = Nota de examen
NF =0.6* (0.4 * NE + 0.6 * NT) + 0.4*NX
La condición para aprobar el curso es NF >= 4.0