# Curso de introducción al análisis y modelado de datos con Python 

<img src="../images/cacheme.png" alt="logo" style="width: 150px;"/>
<img src="../images/aeropython_logo.png" alt="logo" style="width: 115px;"/>

---

# Introducción

A continuación, haremos una rápida introducción al lenguaje Python y al intérprete IPython, así como a Jupyter Notebook, la herramienta que vamos a usar en este curso.
Detallaremos cuáles son las bondades de Python frente a otros lenguajes, y veremos como ejecutar un script y cuáles son los tipos y estructuras básicas de este lenguaje.

**¡Comenzamos!**

---

<center><img src="../images/logo_python_letras.png" width=280px></center>

## ¿Qué es Python?

* Lenguaje de programación interpretado, dinámico y fácil de aprender
* Creado por [Guido van Rossum](https://es.wikipedia.org/wiki/Guido_van_Rossum) en 1991
* Ampliamente utilizado en ciencia e ingeniería
* Multitud de bibliotecas para realizar diferentes tareas.

### Ventajas de Python

* **Libre y gratuito**:
  - Posibilidad de estudiar su funcionamiento y corregirlo o mejorarlo
  - Sin restricciones para su uso o distribución, incluso para uso comercial
  
* **Multiplataforma**: Windows, Mac OS, Linux.

* **Propósito general**:
  - Interfaz con otros lenguajes (glue language): reescritura de partes críticas en lenguajes compilados
  - Cálculo numérico y cálculo simbólico en el mismo lenguaje
  - Scripts de sistema operativo
  - Interfaces gráficas de usuario (GUIs)
  - Servicios web

In [1]:
import antigravity

![xkcd](../images/python_xkcd.png)

### Desventajas de Python

* Código accesible no significa código fácil de entender o arreglar
* Algunas bibliotecas son mantenidas por equipos muy reducidos de voluntarios
* Paradoja de la elección: muchas opciones disponibles, documentación y recursos dispersos
* Poco material de aprendizaje en español (estamos trabajando en ello)
* Debilidad en áreas como teoría de control

### Python en el ámbito científico ingenieril

![ecosystem](../images/ecosystem.png)


### Python para análisis de datos

![](../images/DataScientist-Continuum.png)
Original: [Embracing Open Data Science in your Organization](https://speakerdeck.com/chdoig/embracing-open-data-science-in-your-organization) - Christine Doig (Continum Analytics)

## Instalación de Python

Diferentes distribuciones:

* [PYTHON.ORG](https://www.python.org/)
![python_org](../images/python_org.png)

* [ANACONDA](https://anaconda.org/) 
![anaconda](../images/anaconda.png)

Diferentes versiones:
* 2.X
* 3.X

## Entornos de desarrollo

El método más simple es usar un editor (tu preferido) y ejecutar el script desde la línea de comandos. Pero existen también __IDE__s (_integrated development environment_ pensados para facilitar la escritura de código y tener al alcance de la mano otras herramientas como _profilers_, _debuggers_, _explorador de variables_... Entre los más adecuados para la programación científica se encuentran [Spyder](http://code.google.com/p/spyderlib/) (instalado con Anaconda) y [PyCharm](https://www.jetbrains.com/pycharm/).

![editors](../images/editors.png)

#### Jupyter Notebook

__Será nuestra herramienta de trabajo durante el curso__. Esto que estás leyendo ahora no es más que un jupyter notebook, que como vemos, contiene celdas que además de código, pueden contener texto e imágenes. Pero veamos primero cómo funciona.


##### ¿Como trabajar?

__Para iniciar el jupyter notebook a través de la terminal se utiliza el comando__  

```jupyter notebook```

en la pantalla principal podemos ver una ruta y una lista de notebooks. Cada notebook es un archivo que está almacenado en el ordenador en la ruta que aparece. Si en esa carpeta no hay notebooks, veremos un mensaje indicando que la lista de notebooks está vacía.



Lo notebok están divididos en celdas. Cada celda de código está marcada por la palabra `In [<n>]` y están **numeradas**. Tan solo tenemos que escribir el código en ella y hacer click arriba en Cell -> Run, el triángulo ("Run cell") o usar el atajo ___`shift + Enter`___. El resultado de la celda se muestra en el campo `Out [<n>]`, también numerado y coincidiendo con la celda que acabamos de ejecutar. Esto es importante, como ya veremos luego.

Si en la barra superior seleccionas Markdown (o usas el atajo `Esc-M`) en lugar de Code puedes escribir texto, si quieres volver a escribir código puedes volver a seleccionar Code (o usar el atajo `Esc-Y`).

## Programando con Python

### El zen de Python

In [2]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Tipos de datos:

#####  integer

In [3]:
a = 1
a

1

##### float

In [4]:
a = 3.5
a

3.5

#####  string 

In [5]:
a = 'mi curso'
a

'mi curso'

##### boolean 

In [6]:
a = True
b = False
print(a, b)

True False


##### list 

In [7]:
my_list = [1, '3', 1, 2, 'a', True] 
my_list

[1, '3', 1, 2, 'a', True]

In [8]:
my_list.append(99)
my_list

[1, '3', 1, 2, 'a', True, 99]

##### tuple

In [9]:
my_tuple = (1, '3', 1, 2, 'a', True) 
my_tuple

(1, '3', 1, 2, 'a', True)

##### set 

In [10]:
my_set = {1, '3', 1, 2, 'a', True}
my_set

{1, 2, '3', 'a'}

##### dict

In [11]:
my_dic = {'edad': 18, 'altura': 1.80, 'puesto': 'alero', 'equipo' : None} 
my_dic

{'altura': 1.8, 'edad': 18, 'equipo': None, 'puesto': 'alero'}

### Operaciones básicas:

##### Operadores aritméticos (+, -, \*, /, **, %, //)

In [12]:
a = 3/2
b = 4 * 'a'
c = (15**2 - 2)/4

print(a, b, c)

1.5 aaaa 55.75


##### Operadores de comparación (==, !=, >, <, >=, <=)

In [13]:
a = 7
b = 3

print(a== b, a != b, a > b)

False True True


##### Operadores de asignación (= , +=, -=, *=, /=, %=, **=, //=)

In [14]:
a = 15
b = None 
a, b = b, a
print('a = ', a, ' b =', b)

a =  None  b = 15


In [15]:
c = 1
c += 15
c

16

##### Otros operadores (and, or, in, not in, is, not is...)

In [16]:
a = 5
a is None

False

In [17]:
b = [10, 3, 5, 7]
a in b

True

### Estructuras de control:

##### Condicionales - if/elif/else

In [18]:
a = 15

In [19]:
if a > 1:
    print('a es mayor que 1')
elif a < 1:
    print('a es menor que 1')
else:
    print('a es igual a 1')

a es mayor que 1


##### Bucles - for

In [20]:
mis_elementos= ['oxigeno', 'azufre', 'hidrogeno']

for i, elem in enumerate(mis_elementos):
    print('El elemento {0} es: {1}'.format(i, elem))

El elemento 0 es: oxigeno
El elemento 1 es: azufre
El elemento 2 es: hidrogeno


##### Bucles - while

In [21]:
contador = 0
while contador < 5:
    print(contador)
    contador += 1

0
1
2
3
4


##### Otros comandos control de flujo - pass, continue, break

In [22]:
a = 25

if a in {13, 25}:
    pass

In [23]:
contador = 0
while contador < 5:
    contador += 1
    if contador == 3:
        continue
    print(contador)

1
2
4
5


In [24]:
my_list = [1, 2, None, 4]

sum = 0
for elem in my_list:
    
    if elem is None:
        sum = None
        break
    
    sum += elem

print(sum)  
    

None


### Funciones

In [2]:
def sumale_tres(value):
    value += 3
    return value

In [3]:
res = sumale_tres(15)
res

18

---

Hemos aprendido:
* ¿Qué es Python? Ventajas e inconvenientes
* Distribuciones y versiones disponibles
* Entornos de desarrollo
* Tipos de datos
* Tipos de operaciones
* Control de flujo (blucles, condicional)
* Funciones

###### Juan Luis Cano, Alejandro Sáez, Mabel Delgado

---
_Las siguientes celdas contienen configuración del Notebook_

_Para visualizar y utlizar los enlaces a Twitter el notebook debe ejecutarse como [seguro](http://ipython.org/ipython-doc/dev/notebook/security.html)_

    File > Trusted Notebook

In [25]:
# Esta celda da el estilo al notebook
from IPython.core.display import HTML
css_file = '../style/style.css'
HTML(open(css_file, "r").read())