Curso básico para análisis de tablas de datos usando python y pandas.
- Saber usar R, SAS, STATA o Excel avanzado.
- Tener anaconda instalado.
- Acceso a internet.
-
Instalación e inicio con Anaconda
- a) Instalación de anaconda
- b) Entornos (environments)
- c) Instalación de librerias
- d) Sobre la documentación
-
- a) Python y Jupyter Notebooks
- b) Valores, variables y tipos
- c) Operaciones y funciones
- d) Comentarios y errores
-
Descarga y exploración de datos
- a) Estructura de un proyecto de datos
- b) Obtención del conjunto de datos
- c) Cargar los datos en python
- d) Conjuntos de datos ordenados
- e) Exploración básica con profiles
- f) Opciones avanzadas de profiling
-
Indexación y selección de dataframes
- a) Estructura de una tabla
- b) Slicing
- c) Únicos y conteo
- d) Ordenar
- e) Subsetting
- f) Guardar datos
-
- a) Tipos de datos
- b) Eliminación de observaciones y variables
- c) Valores faltantes
- d) Limpieza de texto
- e) Limpieza de categóricos
- f) Limpieza de números
- g) Limpieza de fechas
- h) Ordenar y guardar datos
-
Graficación y visualización de datos
- a) Pandas plot
- b) Lineas
- c) Scatterplot
- d) Barras
- e) Opciones y colores
- f) Guardar figuras
- g) Distribución
- h) Boxplot
- i) Histogramas
- j) KDE
- k) Gráfico múltiple
- l) Violinplot
- m) Heatmaps y clustermaps
- n) Otros recursos de visualización
-
- a) Frecuencia
- b) Promedio, mediana y moda
- c) Asimetría
- d) Varianza y desviación estandar
- e) Valores atípicos
- f) Distribuciones estadísticas
-
- a) Tablas pivote: filas a columnas
- b) Melt: columnas a filas
- c) División-aplicación-combinación
- d) Agrupar por características
- e) Funciones de agregación
- f) Unir tablas uno a uno
- g) Unir tablas muchos a uno
-
- a) Conjunto de datos
- b) Correlaciones
- c) PCA (Análisis de Componentes Principales)
- d) Regresión logística
- e) Selección univariada
-
- a) Formatos de archivo geoespaciales
- b) Información geoespacial
- c) Mapas
-
Programación básica en python
-
Programación intermedia en python
- Guia estilo PEP8
- Docstrings numpy
- The Hacker's Guide to Python, Julien Danjou
- Computer Science Distilled, Wladston Ferreira Filho
- Estructuras de datos
-
Visualización
- Selección de colores Colorbrewer
- Fundamentals of Data Visualization
- Visualización de datos y D3
- How To Lie With Maps - Mark Monmonier
-
Estadística
- Estadistica para Dummies, Deborah J Rumsey
- Understanding Advanced Statistical Methods, Peter H. Westfall & Kevin S. S. Henning
-
Machine learning
- Machine Learning with Python: A Practical Introduction
- Data Feminism, Catherine D'Ignazio y Lauren F. Klein
-
Aprendizaje