###### Introducción a Python

_"I don't know about the rest of you..._ 
_I came for the language, but I stayed for the community."_

Brett Cannon, Python Core Dev


#### ¿Qué es Python?

*  Creado por [Guido van Rossum](https://es.wikipedia.org/wiki/Guido_van_Rossum) en 1991.
* Lenguaje de programación libre y gratuito. Características:
    * interpretado
    * de alto nivel
    * de propósito general
    * tipado dinámico
    * gestión automática de memoria
    * múltiples paradigmas de programación (OOP, Funcional...)
    * multitud de paquetes para realizar diferentes tareas.

#### Además...

Con una gran comunidad, abierta, diversa, inclusiva...  
- Python Software Foundation
- Python España 
- Python Madrid
- PyLadies Madrid
- Djangogirls

## 1. Primeros pasos con Python
### Instalación, entornos virtuales y gestores de paquetes

### Diferentes distribuciones:
* [PYTHON.ORG](https://www.python.org/)
* [ANACONDA](https://anaconda.org/) 

### Diferentes versiones:
* 2.X
* 3.X

### Entornos virtuales

- El propósito principal de los entornos virtuales de Python es crear un entorno aislado para los proyectos de Python. 

- Esto significa que cada proyecto puede tener sus propias dependencias, independientemente de qué dependencias tenga cada otro proyecto.

- **venv** es la herramienta estándar para crear entornos virtuales, y ha sido parte de Python desde Python 3.3. A partir de Python 3.4, se instala de forma predeterminada pip en todos los entornos virtuales creados.

- **virtualenv** es una alternativa de terceros (y predecesora) a venv. Permite que los entornos virtuales se utilicen en versiones de Python anteriores a 3.4, que no proporcionan ningún tipo de software o no pueden instalar pip automáticamente en los entornos creados.

### Módulo venv - Python 3.x
#### Crear el entorno virtual

En linux:
```bash
$ python3 -m venv /path/to/myenv
```

En windows:
```bash
c:\> c:\Python35\python -m venv c:\path\to\myenv
```

#### Activar el entorno virtual
En linux:
```bash
$ source venv/bin/activate
```

En Windows:
```bash
c:\> venv\Scripts\activate.bat
```

### Gestión de paquetes con pip
- Puede instalar, actualizar y eliminar paquetes utilizando un programa llamado pip. 
- Python empezó a incluir pip con Python 3.4. Para versiones anteriores, pip debe ser activada como se describe [aquí](https://packaging.python.org/tutorials/installing-packages/#requirements-for-installing-packages).
- Por defecto, pip instalará los paquetes del Índice de Paquetes de Python, [pypi.org](https://pypi.org)


Usando la instalación de Python por defecto
```bash
$ python -m pip install SomePackage
```

Usando la versioń por defecto de Python 2
```bash
$ python2 -m pip install SomePackage
```

Usando la versión específica de Python 2.7
```bash
$ python2.7 -m pip install SomePackage
```

Usando la versión por defecto de Python 3
```bash
$ python3 -m pip install SomePackage
```

Usando la versión específica de Python 3.4
```bash
$ python3.4 -m pip install SomePackage
```

Instalar la última versión de “SomeProject”
```bash
$ pip install "SomeProject"
```

Instalar una versión específica
```bash
$ pip install "SomeProject==1.4"
```

Instalar una versión compatible con otra versión específica
```bash
$ pip install "SomeProject~=1.4.2"  
```

Actualizar SomeProject a la última versión de PyPi
```bash
$ pip install --upgrade SomeProject
```

Instalar una lista de librerías desde un fichero de requirements
```bash
$ pip install -r requirements.txt
```

Generar un fichero de requirements a partir del virtual env actual
```bash
$ pip freeze > requirements.txt
```

## 2. Beautiful python <3
- [Ejemplos prácticos](1.5_beautiful_python.ipynb)

## 3. Librerías para ser un buen Data Scientist

<a href="https://jupyter.org/"><img src="../images/Jupyter_logo.svg.png"></a>
    
<p>Project Jupyter es una organización sin fines de lucro creada para desarrollar software de código abierto, estándares abiertos y servicios para computación interactiva en docenas de lenguajes de programación.


**[Notebooks](https://jupyter.org/try)**

Son un entorno de trabajo interactivo que permite desarrollar código en Python (por defecto, aunque veremos más adelante cómo permitir otros lenguajes) de manera dinámica, a la vez que integrar en un mismo documento tanto bloques de código como texto, gráficas o imágenes. 

Es un SaaS utilizado ampliamente en análisis numérico, estadística y machine learning, entre otros campos de la informática y las matemáticas.

<a href="https://www.datacamp.com/community/blog/jupyter-notebook-cheat-sheet"><img src="../images/jupyter_datacamp_cheatsheet.png"></a>

**[Jupyter Lab](https://jupyter.org/try)**

JupyterLab es la nueva generación de interfaces para el Proyecto Jupyter.

Sin perder la compatibilidad con los Jupyter Notebooks, Jupyter Lab permite usar editores de texto, terminales, visores de ficheros y otros componentes en un workspace de pestañas muy parecido al resto de IDEs actuales.

**[RISE](https://damianavila.github.io/RISE/index.html)**

Integra los Jupyter Notebooks con la librería [reveal.js](https://revealjs.com/#/) para convertir los notebooks en slides **interactivas** (!!!)


<a href="http://www.numpy.org/"><img src="../images/numpy.jpeg"></a>
Extensión de Python, que le agrega mayor soporte para vectores y matrices, constituyendo una biblioteca de funciones matemáticas de alto nivel para operar con esos vectores o matrices.

<a href="https://www.datacamp.com/community/blog/python-numpy-cheat-sheet"><img src="../images/numpy_datacamp_cheatsheet.png"></a>

## Numpy
- [Teoría](1.1_numpy.ipynb)
- [Ejercicios](../ejercicios/numpy_ejercicios.ipynb)

<a href="https://pandas.pydata.org/"><img src="../images/pandas.png"></a>

Extensión de NumPy para manipulación y análisis de datos para el lenguaje de programación Python.

En particular, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales.

<a href="https://www.datacamp.com/community/blog/python-pandas-cheat-sheet"><img src="../images/pandas_datacamp_cheatsheet.png"></a>

## Pandas
- [Teoría](1.2_pandas.ipynb)
- [Ejercicios](../ejercicios/pandas_ejercicios.ipynb)

In [10]:
import numpy as np
arr = np.array(range(10))
mask = arr % 2
arr[mask]

array([0, 1, 0, 1, 0, 1, 0, 1, 0, 1])

<a href="https://www.scipy.org/"><img src="../images/scipy.png"></a>

SciPy es una biblioteca open source de herramientas y algoritmos matemáticos para Python que nació a partir de la colección original de Travis Oliphant que consistía de módulos de extensión para Python, lanzada en 1999 bajo el nombre de Multipack

<a href="https://www.datacamp.com/community/blog/python-scipy-cheat-sheet"><img src="../images/scipy_datacamp_cheatsheet.png"></a>

<a href="https://scikit-learn.org/stable/"><img src="../images/scikit.png"></a>


Scikit-learn es una librería especializada en algoritmos para data mining y machine learning.

- **Preprocesamiento**: Extracción de características a analizar y normalización de datos.
- **Agrupaciones**: Agrupación automática de objetos similares en un conjunto.
- **Reducción de dimensiones**: Reducir el número de variables aleatorias a considerar.
- **Selección de Modelos**: Comparar, validar y elegir parámetros y modelos.
- **Clasificaciones**: Identificar las categorías a que cada observación del conjunto de datos pertenece.
- **Regresiones**: Predecire el valor continuo para cada nuevo ejemplo.


<a href="https://www.datacamp.com/community/blog/scikit-learn-cheat-sheet"><img src="../images/scikit_datacamp_cheatsheet.png"></a>

### Bibliotecas de visualización de datos

<img src="../images/data-chart-type.png">

### Boxplot
<img src="../images/boxplot1.png"> 

<a href="https://matplotlib.org/"><img src="../images/matplotlib.jpg"></a>
Matplotlib es una biblioteca para la generación de gráficos a partir de datos contenidos en listas o arrays en el lenguaje de programación Python y su extensión matemática NumPy. Proporciona una API, pylab, diseñada para recordar a la de MATLAB.

<a href="https://www.datacamp.com/community/blog/python-matplotlib-cheat-sheet"><img src="../images/matplotlib_datacamp_cheatsheet.png"></a>

- [Teoría](1.3_matplotlib.ipynb)
- [Ejercicios](../ejercicios/matplotlib.ipynb)

## [Seaborn](https://seaborn.pydata.org/)

Seaborn es una librería de visualización de datos en Python basada en matplotlib. 

La idea de Seaborn es que los data scientists dispongan de una interfaz para hacer gráficos estadísticos atractivos e explicativos: el objetivo es visualizar datos complejos de forma sencilla y extraer conclusiones.

Mejoras respecto a MatPlotLib:
- Tiene varios temas integrados para mejorar el diseño de matplotlib.
- Dispone de herramientas para la elección de paletas de colores.
- Funciones para comparar subconjuntos de datos.
- Herramientas para adaptar y visualizar modelos de regresión lineal.
- Funciones para visualizar matrices de datos.
- Uso de algoritmos de clustering.
- Posibilidad de establecer series temporales estadísticas con los datos.  

<a href="https://www.datacamp.com/community/blog/seaborn-cheat-sheet-python"><img src="../images/seaborn_datacamp_cheatsheet.png"></a>

- [Teoría](1.4_seaborn.ipynb)
- [Ejercicios](../ejercicios/seaborn_ejercicios.ipynb)

- [The python graph gallery](https://python-graph-gallery.com/)

<img src="../images/python-meme-funny.jpg">

[Ir al tema 2](2.0_intro_machine_learning.ipynb)