Skip to content

DataOwl-Chile/DS_1

Repository files navigation

DS_1

Introducción a la Ciencia de Datos


Este repositorio tiene todo el material correspondiente al curso Introduction to Data Science, disponible en el canal de Youtube de DataOwl.  

Esperamos les sea de utilidad y que sirva como una guía para introducirse al mundo de los datos!  

¿Qué es el Data Science?

Data Science es el estudio de la extracción generalizable de conocimiento a partir de datos, que en su gran parte resultan ser masivos (Big Data). Se presentará un conjunto de habilidades integradas que abarcan matemáticas, estadísticas, aprendizaje automático, bases de datos y otras ramas de la informática, junto con una buena comprensión del arte de la formulación de problemas para diseñar soluciones efectivas. Este curso introducirá a los participantes a este campo de rápido crecimiento y los equipará con algunos de sus principios y herramientas básicos. Además se esperá que se aprenderán los conceptos, técnicas y herramientas que necesitan para lidiar con diversas facetas de la práctica de la ciencia de datos, incluyendo recopilación e integración de datos, análisis exploratorio de datos, modelos predictivos, modelos descriptivos, creación de productos de datos, evaluación y comunicación efectiva. El enfoque en el tratamiento de estos temas estará en la amplitud, en lugar de la profundidad, y se hará hincapié en la integración y síntesis de conceptos, además en su aplicación para resolver problemas.

Requisitos para el curso

Se espera que los participantes tengan conocimientos básicos de algoritmos, una experiencia de programación razonable, y cierta familiaridad con el álgebra lineal básica (p. Ej., Solución desistemas lineales y cálculo de valores y vectores propios) y una buena base en probabilidad y estadística. Si está interesado en tomar el curso, pero no está seguro de tener los conocimientosnecesarios, es posible que aún pueda sobrellevarlo si está dispuesto a hacer un esfuerzo adicional para llenar los vacíos.  

Repositorios recomendados

Lecturas recomendadas

  1. CRISP-DM 1.0: Este documento describe el modelo de proceso CRISP-DM y contiene información sobre la metodología CRISP-DM, el modelo de referencia CRISP-DM, la guía del usuario CRISP-DM y los informes CRISP-DM, así como un apéndice con información adicional relacionada.
  2. Storytelling with Data: En su obra, Nussbaumer Knaflic logra destacar los fundamentos con los que se puede comunicar de manera efectiva los insights que se descubren del análisis de la Data.

Sitios de interés

  1. StackOverflow: Dudas de programación.
  2. Sci-Hub: Desbloquear papers y artículos.
  3. Libgen: Buscar libros.