Skip to content

Un curso de introducción a Data science con Python, impartido en la Escuela Técnica Superior de Ingeniería de Telecomunicaciones de la Universidad Politécnica de Cartagena

mkesslerct/data_science_Python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

43 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Introducción a Data Science con Python

Presentación

He impartido a lo largo de varios años en la Escuela Técnica Superior de Ingeniería de Telecomunicaciones en la Universidad Politécnica de Cartagena, una asignatura optativa de introducción a Data science. Durante muchos años el lenguage de programación usado era R, pero desde el curso 2020/21, decidí pasar a Python con las librerías pandas, matplotlib y scikit-learn.

Este repositorio contiene todo el material de la asignatura, para su estudio autónomo. Encontraréis los enlaces a las unidades de aprendizaje así como trabajos propuestos para practicar los conceptos de cada tema.

Nota: las unidades digitales fueron elaboradas con UPCTforma, la herramienta de autor creada por el Centro de Producción de Contenidos Digitales de la Universidad Politécnica de Cartagena, en el seno de dos proyectos Erasmus Plus, INDIe 2018-1-ES01-KA201-050924 y INDIe4All 2020-1-ES01-KA201-083177, cofinanciados por la Comisión Europea.

Para profesores: en este repositorio podréis encontrar también los ficheros fuentes de los documentos. En el directorio utilidades, están algunos scripts útiles para generar entregables etc...

Licencia: los materiales de este curso están distribuidos con la licencia Atribución-CompartirIgual 4.0 Internacional de Creative Commons. CC BY-SA 4.0.

Contenidos

  1. Preliminares: preparación Python para el curso.
  2. Introducción a Python.
  3. Introducción a Pandas.
  4. Combinar dataframes
  5. Aplicar transformaciones y calcular resúmenes por grupos
  6. Visualizar datos con gráficas en Matplotlib
  7. Regresión
  8. Aprendizaje máquina con Scikit-learn
  9. Clasificación con regresión logística
  10. Regularización de la función coste
  11. Reducción de dimensión: análisis en componentes principales

Datos necesarios para los trabajos y algunos ejemplos

En el siguiente enlace, podéis encontrar los ficheros de datos necesarios para los trabajos y los ejemplos. Podéis descargarlos a medida que los vayáis necesitando y guardar en una carpeta data en vuestro directorio de trabajo. También podéis indicar la url del conjunto a la hora de cargar el conjunto de datos con read_csvde pandas. Si optáis por esta segunda opción, tenéis que usar la url correspondiente a la versión "raw" del fichero en Github. Por ejemplo, para cargar el fichero llamado datos_cairo.csv:

import pandas as pd
cairo = pd.read_csv("https://raw.githubusercontent.com/mkesslerct/data_science_Python/main/data/datos_cairo.csv")

Carpeta data

Preliminares: instalación de Python y Visual Studio Code para el curso.

Unidad con instrucciones sobre preparación de Python, Anaconda y Visual Studio Code

Para facilitar la creación del entorno virtual ids en conda, podéis usar el siguiente fichero yml ids_environment.yml

Introducción a Python

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Introducción a Pandas

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Combinar dataframes

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Aplicar transformaciones y calcular resúmenes por grupos:

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Visualizar datos con gráficas en Matplotlib

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Regresión

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Aprendizaje máquina con Scikit-learn

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Clasificación con regresión logística

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Regularización de la función coste

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

Reducción de dimensión: análisis en componentes principales

Unidades de aprendizaje

Transparencias asociadas a las unidades:

Para practicar:

About

Un curso de introducción a Data science con Python, impartido en la Escuela Técnica Superior de Ingeniería de Telecomunicaciones de la Universidad Politécnica de Cartagena

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published