Skip to content
Materiales para el taller a impartir en el Felanitx Tech Weekend 2019
Jupyter Notebook Python
Branch: master
Clone or download
Latest commit 3872c1a Jul 6, 2019
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
data update Jun 28, 2019
images Change image name Jul 5, 2019
notebooks Matplotlib tutorial modification Jul 5, 2019
solutions Matplotlib tutorial modification Jul 5, 2019
.gitignore update Jun 28, 2019
LICENSE update Jun 28, 2019
README.md More clarifications and change authors order Jul 2, 2019
environment.yml update Jun 28, 2019
start_nix.sh update Jun 28, 2019
start_win.bat update Jun 28, 2019
test.ipynb update Jun 28, 2019

README.md

Felanitx Tech Weekend 2019: Introducción a Data Science en Python

Binder

Materiales para el taller 'Introducción a Data Science en Python' en la Felanitx Tech Weekend 2019 realizado por los organizadores del meetup PyDataMallorca.

Página web del Meetup: https://www.meetup.com/PyData-Mallorca/

Cuenta de Twitter: https://twitter.com/PyDataMallorca

Preparación imprescindible antes del taller

NOTA: es muy importante que acudas al taller con todo instalado, para que puedas aprovechar al máximo todo lo que explicaremos.

Necesitarás lo siguiente:

  • Un portátil.
  • Descargar los materiales para el curso y descomprimirlos en el portátil (usa este enlace para descargarlos).
  • Python 3.6 o superior instalado.
  • Las librerías que vamos a usar (Jupyter, Numpy, Matplotlib, Pandas y Scikit-Learn).

Formas de conseguir lo anterior:

Instalación de Anaconda

La forma más sencilla sería instalando Anaconda para vuestro sistema operativo. La distribución Anaconda junto con instrucciones de cómo instalarlo lo podéis encontrar en este enlace (seleccionad la versión que incluya Python 3.6 o superior). La distribución Anaconda os instalará Python 3.6 y un montón de paquetes que se usan en muchos ámbitos de Data Science y de la ciencia e ingeniería en general. Os dejamos también vídeos que hemos preparado para facilitaros el proceso:

Instalación de Miniconda

Una segunda forma sería instalando Miniconda. Lo podéis descargar desde este enlace (seleccionad la versión que incluya Python 3.6 o superior). Una vez instalado MiniConda tenéis Python y una serie de utilidades instaladas. Os dejamos también vídeos que hemos preparado para facilitaros el proceso:

Instalación de paquetes específicos

[PUEDES OMITIR ESTE PASO SI HAS INSTALADO ANACONDA. SI HAS INSTALADO MINICONDA CONTINUA LEYENDO]

Para instalar el resto de paquetes necesarios podéis abrir una terminal (Linux/Mac) o el AnacondaPrompt (Windows), ejecutad lo siguiente (dependiendo del sistema operativo en el que estéis deberéis ejecutar unas cosas u otras).

cd ruta/a/la/carpeta/descargada/y/descomprimida (Linux o Mac)

cd C:\ruta\a\la\carpeta\descargada\y\descomprimida (Windows)

conda env create -f environment.yml (Linux, Mac, Windows)

[IMPORTANTE: SI NO HAS SIDO CAPAZ DE COMPLETAR LA INSTALACIÓN EXPLICADA ANTERIORMENTE USANDO ANACONDA O MiniConda ACÉRCATE MEDIA HORA ANTES AL TALLER Y TRATAREMOS DE AYUDARTE CON TODO ELLO]

Durante el taller

Como en el paso anterior habéis instalado los paquetes necesarios, solamente tenéis que activar el entorno creado y usar los paquetes. Para ello, en la misma terminal que los pasos anteriores deberéis ejecutar [si tienes Anaconda instalado te puedes saltar el anterior paso]:

source activate ftw19

Y finalmente también ejecutar jupyter notebook para acceder al tutorial. Atención: se abrirá un navegador web.

jupyter notebook

Contenidos

  1. Introducción al taller. Para empezar, comentaremos qué es Data Science, Big Data, Machine Learning y otros conceptos relacionados y cómo encaja el lenguaje Python en todo ello. Asimismo, enunciaremos los requisitos que debería tener un analista de datos.

  2. Introducción a Jupyter. En el taller utilizaremos Jupyter, que es una aplicación que permite editar código Python, así como también otros lenguajes como R, Julia o Scala, de forma conjunta con texto enriquecido y que es ampliamente utilizado en el análisis de datos actualmente. En este bloque explicaremos cómo utilizarlo y sus funcionalidades principales.

  3. Breve introducción a la anatomía de un numpy array. Todo el ecosistema científico Python usa de forma generalizada los arrays de numpy en sus tripas. En este bloque intentaremos explicar cómo funciona un numpy array para que le podáis sacar el máximo provecho numérico a Python.

  4. Tratamiento de datos mediante Pandas. Pandas es la librería principal de carga, consulta y modificación de datos en Python. En este bloque realizaremos diversos ejercicios para conocer las funcionalidades más importantes de Pandas y prepararnos para los siguientes bloques.

  5. Visualización de datos con Matplotlib. Por su parte, Matplotlib es una librería de Python que nos permite construir gráficos. Durante este apartado veremos cómo crear gráficos fácilmente mediante esta librería y realizaremos ejercicios para poner en práctica esta librería.

  6. Resolución de un problema de clasificación mediante scikit-learn. Posteriormente, propondremos un problema de clasificación y explicaremos un algoritmo matemático que permita su resolución, ¡no te asustes! No entraremos en explicaciones matemáticas profundas, pero sí intentaremos comprender cómo funcionan estos algoritmos de forma general y en particular para el algoritmo de clasificación escogido. Haremos ejercicios y jugaremos con los datos para poder entender mejor cómo funciona un algoritmo de este tipo. Utilizaremos scikit-learn, que es la librería de Python que nos permite implementar soluciones de Machine Learning.

Autores y colaboradores (por orden alfabético inverso)

Contacto

Si deseas contactar con nosotros puedes hacerlo del siguiente modo:

You can’t perform that action at this time.