# Curso de introducción al análisis y modelado de datos con Python 

<img src="../images/cacheme.png" alt="logo" style="width: 150px;"/>
<img src="../images/aeropython_logo.png" alt="logo" style="width: 115px;"/>

---

# Introducción

A continuación, haremos una rápida introducción al lenguaje Python y al intérprete IPython, así como a Jupyter Notebook, la herramienta que vamos a usar en este curso.
Detallaremos cuáles son las bondades de Python frente a otros lenguajes, y veremos como ejecutar un script y cuáles son los tipos y estructuras básicas de este lenguaje.

**¡Comenzamos!**

---

<center><img src="../images/logo_python_letras.png" width=280px></center>

## ¿Qué es Python?

* Lenguaje de programación interpretado, dinámico y fácil de aprender
* Creado por [Guido van Rossum](https://es.wikipedia.org/wiki/Guido_van_Rossum) en 1991
* Ampliamente utilizado en ciencia e ingeniería
* Multitud de bibliotecas para realizar diferentes tareas.

### Ventajas de Python

* **Libre y gratuito**:
  - Posibilidad de estudiar su funcionamiento y corregirlo o mejorarlo
  - Sin restricciones para su uso o distribución, incluso para uso comercial
  
* **Multiplataforma**: Windows, Mac OS, Linux.

* **Propósito general**:
  - Interfaz con otros lenguajes (glue language): reescritura de partes críticas en lenguajes compilados
  - Cálculo numérico y cálculo simbólico en el mismo lenguaje
  - Scripts de sistema operativo
  - Interfaces gráficas de usuario (GUIs)
  - Servicios web

![xkcd](../images/python_xkcd.png)

### Desventajas de Python

* Código accesible no significa código fácil de entender o arreglar
* Algunas bibliotecas son mantenidas por equipos muy reducidos de voluntarios
* Paradoja de la elección: muchas opciones disponibles, documentación y recursos dispersos
* Poco material de aprendizaje en español (estamos trabajando en ello)
* Debilidad en áreas como teoría de control

### Python en el ámbito científico ingenieril

![ecosystem](../images/ecosystem.png)


### Python para análisis de datos

![](../images/DataScientist-Continuum.png)
Original: [Embracing Open Data Science in your Organization](https://speakerdeck.com/chdoig/embracing-open-data-science-in-your-organization) - Christine Doig (Continum Analytics)

## Instalación de Python

Diferentes distribuciones:

* [PYTHON.ORG](https://www.python.org/)
![python_org](../images/python_org.png)

* [ANACONDA](https://anaconda.org/) 
![anaconda](../images/anaconda.png)

Diferentes versiones:
* 2.X
* 3.X

## Entornos de desarrollo

El método más simple es usar un editor (tu preferido) y ejecutar el script desde la línea de comandos. Pero existen también __IDE__s (_integrated development environment_ pensados para facilitar la escritura de código y tener al alcance de la mano otras herramientas como _profilers_, _debuggers_, _explorador de variables_... Entre los más adecuados para la programación científica se encuentran [Spyder](http://code.google.com/p/spyderlib/) (instalado con Anaconda) y [PyCharm](https://www.jetbrains.com/pycharm/).

![editors](../images/editors.png)

#### Jupyter Notebook

__Será nuestra herramienta de trabajo durante el curso__. Esto que estás leyendo ahora no es más que un jupyter notebook, que como vemos, contiene celdas que además de código, pueden contener texto e imágenes. Pero veamos primero cómo funciona.


##### ¿Como trabajar?

__Para iniciar el jupyter notebook a través de la terminal se utiliza el comando__  

```jupyter notebook```

en la pantalla principal podemos ver una ruta y una lista de notebooks. Cada notebook es un archivo que está almacenado en el ordenador en la ruta que aparece. Si en esa carpeta no hay notebooks, veremos un mensaje indicando que la lista de notebooks está vacía.



Lo notebok están divididos en celdas. Cada celda de código está marcada por la palabra `In [<n>]` y están **numeradas**. Tan solo tenemos que escribir el código en ella y hacer click arriba en Cell -> Run, el triángulo ("Run cell") o usar el atajo ___`shift + Enter`___. El resultado de la celda se muestra en el campo `Out [<n>]`, también numerado y coincidiendo con la celda que acabamos de ejecutar. Esto es importante, como ya veremos luego.

Si en la barra superior seleccionas Markdown (o usas el atajo `Esc-M`) en lugar de Code puedes escribir texto, si quieres volver a escribir código puedes volver a seleccionar Code (o usar el atajo `Esc-Y`).

## Programando con Python

### El zen de Python

### Tipos de datos:

#####  integer

##### float

#####  string 

##### boolean 

##### list 

##### tuple

##### set 

##### dict

### Operaciones básicas:

##### Operadores aritméticos (+, -, \*, /, **, %, //)

##### Operadores de comparación (==, !=, >, <, >=, <=)

##### Operadores de asignación (= , +=, -=, *=, /=, %=, **=, //=)

##### Otros operadores (and, or, in, not in, is, not is...)

### Estructuras de control:

##### Condicionales - if/elif/else

##### Bucles - for

##### Bucles - while

##### Otros comandos control de flujo - pass, continue, break

### Funciones

---

Hemos aprendido:
* ¿Qué es Python? Ventajas e inconvenientes
* Distribuciones y versiones disponibles
* Entornos de desarrollo
* Tipos de datos
* Tipos de operaciones
* Control de flujo (blucles, condicional)
* Funciones

###### Juan Luis Cano, Alejandro Sáez, Mabel Delgado

---
_Las siguientes celdas contienen configuración del Notebook_

_Para visualizar y utlizar los enlaces a Twitter el notebook debe ejecutarse como [seguro](http://ipython.org/ipython-doc/dev/notebook/security.html)_

    File > Trusted Notebook

In [None]:
# esta celda da el estilo al notebook