Skip to content

mar-esther23/CursoPandas2023

Repository files navigation

Introducción al análisis y visualización de datos con python

Dra. Mariana Esther Martínez Sánchez

Instituto Nacional de Enfermedades Respiratorias Ismael Cosio Villegas

Curso básico para análisis de tablas de datos usando python y pandas.

Requisitos:

  • Saber usar R, SAS, STATA o Excel avanzado.
  • Tener anaconda instalado.
  • Acceso a internet.

Índice

  1. Instalación e inicio con Anaconda

    • a) Instalación de anaconda
    • b) Entornos (environments)
    • c) Instalación de librerias
    • d) Sobre la documentación
  2. Introducción a python

    • a) Python y Jupyter Notebooks
    • b) Valores, variables y tipos
    • c) Operaciones y funciones
    • d) Comentarios y errores
  3. Descarga y exploración de datos

    • a) Estructura de un proyecto de datos
    • b) Obtención del conjunto de datos
    • c) Cargar los datos en python
    • d) Conjuntos de datos ordenados
    • e) Exploración básica con profiles
    • f) Opciones avanzadas de profiling
  4. Indexación y selección de dataframes

    • a) Estructura de una tabla
    • b) Slicing
    • c) Únicos y conteo
    • d) Ordenar
    • e) Subsetting
    • f) Guardar datos
  5. Limpieza de datos

    • a) Tipos de datos
    • b) Eliminación de observaciones y variables
    • c) Valores faltantes
    • d) Limpieza de texto
    • e) Limpieza de categóricos
    • f) Limpieza de números
    • g) Limpieza de fechas
    • h) Ordenar y guardar datos
  6. Graficación y visualización de datos

    • a) Pandas plot
    • b) Lineas
    • c) Scatterplot
    • d) Barras
    • e) Opciones y colores
    • f) Guardar figuras
    • g) Distribución
    • h) Boxplot
    • i) Histogramas
    • j) KDE
    • k) Gráfico múltiple
    • l) Violinplot
    • m) Heatmaps y clustermaps
    • n) Otros recursos de visualización
  7. Estadística básica

    • a) Frecuencia
    • b) Promedio, mediana y moda
    • c) Asimetría
    • d) Varianza y desviación estandar
    • e) Valores atípicos
    • f) Distribuciones estadísticas
  8. Data Wrangling

    • a) Tablas pivote: filas a columnas
    • b) Melt: columnas a filas
    • c) División-aplicación-combinación
    • d) Agrupar por características
    • e) Funciones de agregación
    • f) Unir tablas uno a uno
    • g) Unir tablas muchos a uno
  9. Estadística intermedia

    • a) Conjunto de datos
    • b) Correlaciones
    • c) PCA (Análisis de Componentes Principales)
    • d) Regresión logística
    • e) Selección univariada
  10. Mapas con GeoPandas

    • a) Formatos de archivo geoespaciales
    • b) Información geoespacial
    • c) Mapas

Recursos útiles

About

Introducción al análisis de datos con python

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published