<img src="../static/logopython.png" alt="Logo Python" style="width: 300px; display: inline"/>
<img src="../static/deimoslogo.png" alt="Logo Deimos" style="width: 300px; display: inline"/>

# Clase 1: Introducción a IPython y Jupyter

En esta clase haremos una rápida introducción al lenguaje Python y al intérprete Jupyter (parte del proyecto IPython), así como a su Notebook. Veremos como ejecutar un script y cuáles son los tipos y estructuras básicas de este lenguaje. Seguro que ya has oído hablar mucho sobre las bondades de Python frente a otros lenguajes. Si no es así, échale un vistazo a [esto](http://nbviewer.ipython.org/github/AeroPython/Python_HA/blob/master/razones_python.ipynb).
¿Estás preparado? ¡Pues Empezamos!

## ¿Qué es Python? 

* Lenguaje de programación dinámico, interpretado y fácil de aprender
* Creado por Guido van Rossum en 1991
* Ampliamente utilizado en ciencia e ingeniería
* Multitud de bibliotecas para realizar diferentes tareas.

### El zen de Python

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### ¿Qué pinta tiene un programa en Python y cómo lo ejecuto?

Vamos a ver `mi_primer_script.py` que está en la carpeta `static`. __De momento no te preocupes por el código,__ ya habrá tiempo para eso...

In [22]:
!type ..\static\mi_primer_script.py

# -*- coding: utf-8 -*-
import math
     
print("Hola gente del curso de AeroPython")
print("Â¿CuÃ¡ntos sois hoy en clase?")

number = input()
number = int(number)
root = math.sqrt(number)

print("Â¡Ufff!, Â¡eso es un montÃ³n! espero que aprendÃ¡is mucho")
print("Por cierto, la raiz de %i es %f" %(number, root))


<div class="alert alert-info"><strong>Tip de IPython</strong>:
`cat` es un comando de la línea de comandos, no propio de Python. Anteponiendo `!` a comandos de la terminal como `cd`, `ls`, `cat`... se pueden ejecutar desde aquí.
</div>

<div class="alert"><strong>Si estás usando Windows</strong> y acabas de obtener un error, susituye la línea anterior por:<br>
    `!type ..\static\mi_primer_script.py`

<br><br>
`type` es un comando similar en Windows a `cat`. De nuevo, podemos ejecutar comandos como `cd`, `dir`, `type`, `find`...  desde aquí anteponiendo `!` y utilizando `\` en lugar de `/` para la ruta donde se encuentra el archivo.
    
</div>

In [23]:
%run ..\static\mi_primer_script.py

Hola gente del curso de AeroPython
¿Cuántos sois hoy en clase?
12
¡Ufff!, ¡eso es un montón! espero que aprendáis mucho
Por cierto, la raiz de 12 es 3.464102


<div class="alert alert-info"><strong>Tip de IPython</strong>:
`%run` es un _comando mágico_ del notebook que te permite ejecutar un archivo.

Si quieres hacerlo desde una línea de comandos podrías hacer:

`$ python3 ../static/mi_primer_script.py`
</div>


El método más simple es usar un editor (tu preferido) y ejecutar el script desde la línea de comandos. Pero existen también __IDE__s (_integrated development environment_ pensados para facilitar la escritura de código y tener al alcance de la mano otras herramientas como _profilers_, _debuggers_, _explorador de variables_... Entre los más adecuados para la programación científica se encuentran [IEP](http://www.iep-project.org/) y [Spyder](http://code.google.com/p/spyderlib/) (instalado con Anaconda).

<img src="../static/spyder.png" alt="Spyder" style="width: 800px;"/>

## ¿Qué es IPython?

[IPython](http://ipython.org/) no es más que un [intérprete][1] de Python con algunas mejoras sustanciales, pero además su interfaz notebook es más cómoda de manejar que la línea de comandos y nos da un poco más de flexibilidad.

[1]: http://es.wikipedia.org/wiki/Int%C3%A9rprete_(inform%C3%A1tica)

### Notebook de IPython

__Será nuestra herramienta de trabajo durante el curso__. Esto que estás leyendo ahora no es más que un notebook de IPython, que como diremos luego además de código puede contener texto e imágenes. Pero veamos primero cómo funciona.

__Al iniciar el notebook de IPython, en la pantalla principal podemos ver una ruta y una lista de notebooks__. Cada notebook es un archivo que está almacenado en el ordenador en la ruta que aparece. Si en esa carpeta no hay notebooks, veremos un mensaje indicando que la lista de notebooks está vacía.

Al crear un notebook o al abrir uno nuevo se abre la interfaz de IPython propiamente dicha donde ya podemos empezar a trabajar. Es similar a un intérprete, pero está dividida en **celdas**. Las celdas pueden contener, código, texto, imágenes...

Cada celda de código está marcada por la palabra `In [<n>]` y están **numeradas**. Tan solo tenemos que escribir el código en ella y hacer click arriba en Cell -> Run, el triángulo ("Run cell") o usar el atajo `shift + Enter`. El resultado de la celda se muestra en el campo `Out [<n>]`, también numerado y coincidiendo con la celda que acabamos de ejecutar. Esto es importante, como ya veremos luego.

Si en la barra superior seleccionas Markdown (o usas el atajo `Shift-M`) en lugar de Code puedes escribir texto:

In [4]:
from IPython.display import Image
Image(url="../static/markdown_cell.gif")
# Fuente Practical Numerical Methods with Python 
# http://openedx.seas.gwu.edu/courses/GW/MAE6286/2014_fall/about

También ecuaciones en latex y mucho más. Esto es una herramienta muy potente para explicar a alguien o a ti mismo lo que tu código hace, para hacer un informe, un trabajo, escribir en un blog...

Markdown es un lenguaje aparte, no te preocupes por él demasiado ahora, irás aprendiendo sobre la marcha... Para cuando lo vayas necesitando, aquí tienes una [chuleta](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet).

In [5]:
Image(url="../static/markdown_math.gif")
# Fuente Practical Numerical Methods with Python 
# http://openedx.seas.gwu.edu/courses/GW/MAE6286/2014_fall/about

Puedes mover las celdas de un lugar a otro de este modo:

In [6]:
Image(url="../static/cell_move.gif")
# Fuente: Practical Numerical Methods with Python 
# http://openedx.seas.gwu.edu/courses/GW/MAE6286/2014_fall/about

El Notebook tiene además numerosos atajos que irás aprendiendo sobre la marcha, puedes consultarlos en `Help > Keyboard Shortcourts`

## Python y los tipos de datos

Antes de empezar con la sintáxis, un pequeño comentario sobre los tipos de datos y las variables en Python

<div class="alert alert-info">En Python una variable no representa lo mismo que en otros lenguajes de programación. Una variable no es una ubicación de memoria donde guardamos un dato. Es una mera *etiqueta* o alias, que apunta a un objeto. Este objeto puede ser cualquier cosa: un número, una cadena, una función, una instancia de una clase, etc. Y una misma variable puede apuntar a diferentes objetos durante el tiempo de ejecución del programa. Por eso decimos que Python usa <strong>tipado dinámico</strong></div>

Aclarado esto, pasemos al lenguaje en si.

## Introducción a la sintaxis de Python

### Tipos numéricos

Python dispone de los tipos numéricos y las operaciones más habituales:

In [7]:
2 * 4 - (7 - 1) / 3 + 1.0

7.0

Las divisiones por cero lanzan un error:

In [8]:
1 / 0 

ZeroDivisionError: division by zero

In [9]:
1.0 / 0.0

ZeroDivisionError: float division by zero

<div class="alert alert-info">Más adelante veremos cómo tratar estos errores. Por otro lado, cuando usemos NumPy esta operación devolverá `NaN`.</div>

La división entre enteros en Python 3 devuelve un número real, al contrario que en Python 2.

In [10]:
3 / 2

1.5

Se puede forzar que la división sea entera con el operador `//`: 

In [11]:
3 // 2

1

Se puede elevar un número a otro con el operador `**`:

In [12]:
2 ** 16

65536

Otro tipo que nos resultará muy útil son los complejos:

In [13]:
2 + 3j

(2+3j)

In [14]:
1j

1j

In [15]:
# Valor absoluto
abs(2 + 3j)

3.605551275463989

<div class="alert alert-info"><strong>Tip de IPython</strong>: podemos recuperar resultados pasados usando `_<n>`. Por ejemplo, para recuperar el resultado correspondiente a `Out [7]`, usaríamos `_7`. Esta variable guarda ese valor para toda la sesión.</div>

In [16]:
abs(_13)

3.605551275463989

Podemos __convertir variables__ a `int, float, complex, str`...

In [17]:
int(18.6)

18

In [18]:
round(18.6)

19

In [19]:
float(1)

1.0

In [20]:
complex(2)

(2+0j)

In [21]:
str(256568)

'256568'

Podemos __comprobar el tipo de una variable__:

In [22]:
a = 2.
type(a)

float

In [23]:
isinstance(a, float)

True

Otras funciones útiles son:

In [24]:
print('hola mundo')

hola mundo


In [25]:
max(1,5,8,7)

8

In [26]:
min(-1,1,0)

-1

<div class="alert alert-info"><strong>Nota:</strong> Esta es la manera de llamar funciones en Python: los argumentos se encierran entre paréntesis y se separan por comas. Se hace de esta manera en otros lenguajes de programación y no requiere mayor explicación, de momento.</div>

<div class="alert alert-warning">La <strong>función <code>print</code></strong> es la que se usa para imprimir resultados por pantalla. Por si lo ves en algún sitio, en Python 2 era una sentencia y funcionaba de manera distinta, sin paréntesis y sin posibilidad de pasar argumentos adicionales.</div>

### Asignación y operadores de comparación

La asignación se realiza con el operador `=`. Los nombres de las variables en Python pueden contener caracteres alfanuméricos (empezando con una letra) a-z, A-Z, 0-9 y otros símbolos como la \_. 

Por cuestiones de estilo, las variables suelen empezar con minúscula, reservando la mayúcula para clases. 

Algunos nombres no pueden ser usados porque son usados por python:

    and, as, assert, break, class, continue, def, del, elif, else, except, exec, finally, for, from, global, if, import, in, is, lambda, not, or, pass, print, raise, return, try, while, with, yield

In [27]:
a = 1 + 2j

<div class="alert alert-warning"><strong>Nota:</strong> En Python la asignación no imprime el resultado por pantalla, al contrario de como sucede en MATLAB y Octave (salvo que se incluya el punto y coma al final). La mejor manera de visualizar la variable que acabamos de asignar es esta:</div>

In [28]:
b = 3.14159
b

3.14159

<div class="alert alert-info"><strong>Tip de IPython</strong>: En una celda podemos escribir código que ocupe varias líneas. Si la última de ellas devuelve un resultado, este se imprimirá. </div>

In [29]:
x, y = 1, 2
x, y

(1, 2)

<div class="alert alert-info">Podemos realizar **asignación múltiple**, que hemos hecho en la celda anterior con las variables `x` e `y` para intercambiar valores de manera intuitiva:</div>

In [30]:
x, y = y, x
x, y

(2, 1)

Los operadores de comparación son:

* `==` igual a
* `!=` distinto de 
* `<` menor que
* `<=` menor o igual que

Devolverán un booleano: `True` o `False`

In [31]:
x == y

False

In [32]:
print(x != y)

True


In [33]:
print(x < y)
print(x <= y)
print(x > y)
print(x >= y)

False
False
True
True


In [34]:
# incluso:
x = 5.
6. < x < 8.

False

Si la ordenación no tiene sentido nos devolverá un error:

In [35]:
1 + 1j < 0 + 1j

TypeError: unorderable types: complex() < complex()

In [36]:
# En las cadenas de texto sí existe un orden
'aaab' > 'ba'

False

<div class="alert alert-success"><strong>Buenas prácticas:</strong> No es necesario usar una variable temporal si queremos intercambiar el valor de dos variables</div>

In [19]:
# Mal
foo = 'Foo'
bar = 'Bar'
temp = foo
foo = bar
bar = temp

In [20]:
# Bien
foo = 'Foo'
bar = 'Bar'
(foo, bar) = (bar, foo)

### Booleanos

In [37]:
True and False

False

In [38]:
not False

True

In [39]:
True or False

True

In [40]:
# Una curiosidad:
(True + True) * 10 

20

### Strings

Uno de los mayores *cismas* entre Python 2 y Python 3
<ul>
    <li>En Python 2, hay strings y Unicode strings</li>
    <li>En Python 3, hay bytes y strings (las strings son todas Unicode)</li>
</ul>

<div class="alert alert-info"><strong>Mantras del programador</strong>: El texto plano no existe. Cualquier texto ha de llevar asociado una codificación de caracteres, para saber cómo transformar los bytes en texto legible</div>

Hay idiomas que pueden ser completamente representados por la codificación de caracteres `ASCII`, como el inglés. 
Para otros idiomas, como el español, es popular la codificación de caracteres `CP-1252`, también conocida como `windows-1252`, por ser utilizada en sistemas Windows.

En `CP-1252`, los bytes 0 a 127 son iguales que en `ASCII` (se usan para las letras del alfabeto, los números, etc). Los bytes 128 a 255 se utilizan para representar otros caracteres, como la `ñ`.

Tanto `ASCII` como `CP-1252` utilizan un solo byte para representar cada caracter.

Otros idiomas, como el koreano, requieren más de un byte para representar todos los caracteres disponibles.

<strong>¿Qué hacemos?</strong>: UNICODE

<div class='alert alert-info'><strong>Mantras del programador</strong>: Usa <a href='https://en.wikipedia.org/wiki/Unicode'>Unicode</a>. Puede representar cualquier caracter de cualquier idioma conocido</div>

Existen dos versiones de Unicode:
<ul>
    <li>`UTF-16`: Codificación Unicode que usa 2 bytes para representar todos los caracteres. Para poder representar idiomas que requieren de más de 65535 caracteres, utiliza algunos hacks un poco sucios...</li>
    <li>`UTF-32`: Codificación Unicopde que usa 4 bytes para representar todos los caracteres existentes. Cualquier idioma conocido es representable.</li>
</ul>

<div class="alert alert-warning">4 bytes por caracter es mucho espacio. Hay idiomas, como el español o el inglés, que pueden representarse con un byte por caracter</div>

<div class="alert alert-warning">¿Y qué pasa con el bit order? El caracter Unicode UTF-16 `U+4E2D` puede ser almacenado como `4E 2D` en big-endian, o como `2D 4E` en little-endian...</div>

El problema del bitorder para el intercambio de documentos de texto se arregló precediendo cada texto por un caracter especial no imprimible llamado *Byte Order Mark*. Para UTF-16, este caracter es `U+FEFF`. De manera que:

<ul>
    <li>Si recibimos un documento UTF-16 que empieza por `FF FE`: big-endian
    <li>Si recibimos `FE FF`: little-endian
</ul>

Para solucionar el desperdicio de espacio que supone usar 4 bytes por caracter. surgió <strong>UTF-8</strong>

<div class='alert alert-info'><a href="https://en.wikipedia.org/wiki/UTF-8">UTF-8</a> es una codificación Unicode de longitud variable. Usa la misma representación que `ASCII` para los 128 primeros caracteres, dos bytes para alfabeto latino extendido (español, por ejemplo), 3 bytes para caracteres chinos, y 4 para el resto (no representables con menos de 4 bytes)</div>

<strong>Ventajas UTF-8</strong>

<ul>
    <li>Optimización de espacio</li>
    <li>No hay problemas por el bitorder, la representación siempre es igual</li>
</ul>

<strong>Desventajas UTF-8</strong>

<ul>
    <li>La búsqueda de caracteres es de `O(N)`, siendo `N` la longitud del texto, al usar diferente número de bytes para diferentes caracteres</li>
</ul>

En Python 3, <strong>Todos los strings son secuencias de caracteres Unicode</strong>

In [10]:
# Podemos asignar a una variable cualquier caracter unicode
s = '深入 Python'

In [4]:
# Su longitud, dependerá del número de Bytes usados para representarla
len(s)

9

In [11]:
# El elemento string es un array de caracteres, podemos acceder a ellos como a cualquier array
s[0]

'深'

En Python 3 el <a href="https://docs.python.org/3.1/library/string.html#format-string-syntax">formateador de cadenas</a> es muy poderoso. Podemos construir cadenas en base a prácticamente cualquier cosa (variables de todo tipo, listas, tuplas...)

In [12]:
# Ejemplo sencillo de formateo de cadenas con variables posicionales
nombre = 'Jorge'
cualidad = 'sexy'
"{0} es tremendamente {1}".format(nombre, cualidad)

'Jorge es tremendamente sexy'

In [13]:
# Puedo sustituir posiciones de un array
si_suffixes = ['KB', 'MB', 'GB', 'TB', 'PB', 'EB', 'ZB', 'YB']
"1000{0[0]} = 1{0[1]}".format(si_suffixes)

'1000KB = 1MB'

La documentación del formateador de cadenas es bastante densa. Se pueden consultar ejemplos concretos <a href="https://pyformat.info/">aquí</a>

<div class="alert alert-success"><strong>Buenas prácticas</strong>: En Python 2, el formateador de cadenas era muy parecido al estándar de lenguajes como C. Aun es posible usarlo en Python 3, pero no se recomienda. También podemos formatear cadenas simplemente concatenando, pero tampoco se recomienda</div>

In [15]:
# Mala practica: formateador antiguo
def format_user_info(name, age, sex):
     return "Nombre: " + name + ", Edad: " + age + ", Sexo: " + sex
    
format_user_info("Jorge", 36, "Hombre")

'Nombre: Jorge, Edad: 36, Sexo: Hombre'

In [17]:
# Mala practica: concatenación simple de cadenas
def format_user_info(name, age, sex):
     return "Nombre: %s, Edad: %d, Sexo: %s" % (name, age, sex)
    
format_user_info("Jorge", 36, "Hombre")

'Nombre: Jorge, Edad: 36, Sexo: Hombre'

In [18]:
# Buena practica: formateador nuevo
def format_user_info(name, age, sex):
     return "Nombre:{0}, Edad: {1}, Sexo: {2}".format(name, age, sex)
    
format_user_info("Jorge", 36, "Hombre")

'Nombre:Jorge, Edad: 36, Sexo: Hombre'

# Otros tipos de datos: secuencias

Otro tipo de datos muy importante que vamos a usar son las secuencias: las tuplas y las listas. Los dos son conjuntos ordenados de elementos: las tuplas se demarcan con paréntesis y las listas con corchetes.

In [41]:
una_lista = [1, 2, 3.0, 4 + 0j, "5"]
una_tupla = (1, 2, 3.0, 4 + 0j, "5")
print(una_lista)
print(una_tupla)
print(una_lista == una_tupla)

[1, 2, 3.0, (4+0j), '5']
(1, 2, 3.0, (4+0j), '5')
False


Para las tuplas, podemos incluso obviar los paréntesis:

In [42]:
tupla_sin_parentesis = 2,5,6,9,7
type(tupla_sin_parentesis)

tuple

En los dos tipos podemos:

* Comprobar si un elemento está en la secuencia con el operador `in`:

In [43]:
2 in una_lista

True

In [44]:
2 in una_tupla

True

* Saber cuandos elementos tienen con la función `len`:

In [45]:
len(una_lista)

5

* Podemos *indexar* las secuencias, utilizando la sintaxis `[<inicio>:<final>:<salto>]`:

In [46]:
print(una_lista[0])  # Primer elemento, 1
print(una_tupla[1])  # Segundo elemento, 2
print(una_lista[0:2])  # Desde el primero hasta el tercero, excluyendo este: 1, 2
print(una_tupla[:3])  # Desde el primero hasta el cuarto, excluyendo este: 1, 2, 3.0
print(una_lista[-1])  # El último: 4 + 0j
print(una_tupla[:])  # Desde el primero hasta el último
print(una_lista[::2])  # Desde el primero hasta el último, saltando 2: 1, 3.0

1
2
[1, 2]
(1, 2, 3.0)
5
(1, 2, 3.0, (4+0j), '5')
[1, 3.0, '5']


 Veremos más cosas acerca de indexación en NumPy, así que de momento no te preocupes. Sólo __recuerda una cosa:__

<div class="alert alert-warning"><strong>Nota:</strong> ¡En Python la indexación empieza por cero!</div>

Fíjate en dos detalles:

* Cuando especificamos índices negativos, recorremos el array desde el final hasta el principio. Por eso `[-1]` da el último elemento, `[-2]` el penúltimo y así sucesivamente.
* Hemos utilizado la notación `[::2]` para el último caso. Esto es una manera abreviada de escribir `[0:-1:2]`, es decir, si no decimos nada empezamos en el principio y terminamos en el final. Por eso `[:]` devuelve todos los elementos de la secuencia.

Podemos complicarlo un poco más y hacer cosas como una __lista de listas__:

In [2]:
a = [
 [1, 2, 3],
 [4, 5],
]
print(a)
print(a[0])
print(a[0][0])

[[1, 2, 3], [4, 5]]
[1, 2, 3]
1


Esto nos será de gran ayuda en el futuro para construir arrays.

<div class="alert alert-success"><strong>Buena práctica</strong>: Siempre que puedas, usa <a href="http://python-3-patterns-idioms-test.readthedocs.io/en/latest/Comprehensions.html">*list comprehensions*</a></div>

In [24]:
# Mal, esto no es pythonista
numeros = range(10)
multiplos_de_3 = list()
for element in numeros:
    if not element % 3:
        multiplos_de_3.append(element)
        
multiplos_de_3

[0, 3, 6, 9]

In [25]:
# Así sí que eres un buen Pythonista
numeros = range(10)
multiplos_de_3 = [element
                  for element in numeros
                  if not element % 3]

multiplos_de_3

[0, 3, 6, 9]

<div class="alert alert-success"><strong>Buena práctica</strong>: Usa el operador `*` para representar el *resto* de una lista</div>

In [29]:
# Mal, no es pythonista
vocales = ['a', 'e', 'i', 'o', 'u']
(first, second, rest) = vocales[0], vocales[1], vocales[2:]

print(first)
print(second)
print(rest)

a
e
['i', 'o', 'u']


In [31]:
# Así sí eres un buen pythonista
vocales = ['a', 'e', 'i', 'o', 'u']
(first, second, *rest) = vocales

print(first)
print(second)
print(rest)

a
e
['i', 'o', 'u']


Esto último que hemos hecho se denomina *desempaquetar* unos datos. Para los que os acordéis de LISP, esto se llamaba *desctructuring bind* (extraer valores de una estructura de datos y enlazarlos con variables).

<div class="alert alert-success"><strong>Buena práctica</strong>: Usa tuplas para desempaquetar datos</div>

In [34]:
# Mal, esto no es Pythonista
mis_datos = ['perro', 'Miko', 7]
animal = mis_datos[0]
nombre = mis_datos[1]
edad = mis_datos[2]

print("Mi {a} se llama {n} y tiene {e} años".format(a=animal, n=nombre, e=edad))

Mi perro se llama Miko y tiene 7 años


In [35]:
# Bien, esto es Pythonista
mis_datos = ['perro', 'Miko', 7]
(animal, nombre, edad) = mis_datos

print("Mi {a} se llama {n} y tiene {e} años".format(a=animal, n=nombre, e=edad))

Mi perro se llama Miko y tiene 7 años


<div class="alert alert-success"><strong>Buena práctica</strong>: Usa el placeholder `_` para datos que quieres ignorar al desempaquetar</div>

In [36]:
# Pythonista, pero mejorable
cadenas = ['uno', 'dos', 'tres', 'esto', 'me', 'sobra']
(primero, segundo, tercero, *resto) = cadenas

print(primero)
print(segundo)
print(tercero)



uno
dos
tres


In [38]:
# Bien, esto sí es pythonista 100%
cadenas = ['uno', 'dos', 'tres', 'esto', 'me', 'sobra']
(primero, segundo, tercero, *_) = cadenas

print(primero)
print(segundo)
print(tercero)

uno
dos
tres


# Otros tipos de datos: sets

Los conjuntos, o *set* son contenedores de valores únicos. Pueden contener valores de diferentes tipos mezclados. Además, podemos realizar con ellos las típicas operaciones de álgebra de conjuntos (union, intersección, diferencia)

Es facil crear sets, usando llaves, y metiendo los elementos separados por comas

In [39]:
# Creamos conjunto con un elemento, y vemos su tipo
a_set = {1}

type(a_set)

set

In [40]:
# Podemos meter todos los elementos que queramos
a_set = {1, 2}

a_set

{1, 2}

También podemos crearlos a partir de listas

In [42]:
# Se puede crear un set a partir de una lista, pero no recuerda el orden
a_list = ['a', 'b', 'mpilgrim', True, False, 42]
a_set = set(a_list)

print(a_set)
print(a_list)


{False, True, 'a', 'mpilgrim', 42, 'b'}
['a', 'b', 'mpilgrim', True, False, 42]


O crearlos vacíos

In [44]:
# Creamos un set vacío
a_set = set()

print(a_set)
type(a_set)

set()


set

Pero ojo, que si intentamos crearlo con dos llaves y nada en medio, nos crea un diccionario, no un conjunto (veramos a continuación los diccionarios)

In [45]:
not_sure = {}
type(not_sure)

dict

Podemos añadir elementos a un set mediante *add* o mediante *update*

In [47]:
# Añadimos elementos con add. Si añadimos un elemento que ya existe, no hace nada
a_set = {1, 2, 3}
print(a_set)

a_set.add(4)
print(a_set)

a_set.add(1)
print(a_set)

{1, 2, 3}
{1, 2, 3, 4}
{1, 2, 3, 4}


In [48]:
# Con update, es como si llamaramos a add varias veces
a_set = {1, 2, 3}
print(a_set)

a_set.update({4, 5, 6})
print(a_set)

{1, 2, 3}
{1, 2, 3, 4, 5, 6}


Para borrar elementos de un set, tenemos 3 opciones

<ul>
    <li>El método *discard*</li>
    <li>El método *remove*</li>
    <li>El método *pop*</li>
</ul>

In [49]:
# Discard y remove se diferencian en que, si el elemento no existe, remove lanza una excepcion y discard no
a_set = {1, 3, 6, 10, 15, 21, 28, 36, 45}
print(a_set)

a_set.discard(10)
print(a_set)

a_set.discard(10)
print(a_set)

a_set.remove(21)
print(a_set)

a_set.remove(21)
print(a_set)

{1, 3, 36, 6, 10, 45, 15, 21, 28}
{1, 3, 36, 6, 45, 15, 21, 28}
{1, 3, 36, 6, 45, 15, 21, 28}
{1, 3, 36, 6, 45, 15, 28}


KeyError: 21

In [51]:
# pop devuelve el último elemento extraído, y clear elimina todos los elementos
a_set = {1, 3, 6, 10, 15, 21, 28, 36, 45}
print(a_set)
    
a_set.pop()
print(a_set)

a_set.pop()
print(a_set)

a_set.clear()
print(a_set)

{1, 3, 36, 6, 10, 45, 15, 21, 28}
{3, 36, 6, 10, 45, 15, 21, 28}
{36, 6, 10, 45, 15, 21, 28}
set()


<div class="alert alert-success"><strong>Buena práctica</strong>: Usa set para eliminar repetidos de listas (y de iteradores en general, como veremos más adelante)</div>

In [52]:
# Podemos construir un set a partir de una lista, y se eliminarán los duplicados directamente
a_list = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
print(a_list)

a_set = set(a_list)
print(a_set)

[1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
{1, 2, 3, 4}


Las operaciones típicas de teorías de conjuntos se pueden hacer también con set

In [54]:
# Operaciones típicas de conjuntos: in, union, intersection, difference, symmetric_difference
a_set = {2, 4, 5, 9, 12, 21, 30, 51, 76, 127, 195}
assert(30 in a_set)
assert(31 not in a_set)
b_set = {1, 2, 3, 5, 6, 8, 9, 12, 15, 17, 18, 21}
print(a_set.union(b_set))
print(a_set.intersection(b_set))
print(a_set.difference(b_set))
print(a_set.symmetric_difference(b_set))

{1, 2, 195, 4, 5, 3, 6, 8, 9, 76, 12, 15, 17, 18, 21, 30, 51, 127}
{9, 2, 21, 12, 5}
{195, 4, 76, 51, 30, 127}
{1, 3, 195, 6, 4, 8, 76, 15, 17, 18, 51, 30, 127}


# Otros tipos de datos: diccionarios

Los diccionarios son como los set, pero tienen tuplas clave:valor, en lugar de elementos sueltos.

<div class="alert alert-info">Un diccionario en Python es como un elemento *hash* en Perl 5</div>

In [58]:
# Crear un diccionario es igual de sencillo que un set
a_dict = {'server': 'server.com', 'database': 'MySQL'}
print(a_dict)

{'database': 'MySQL', 'server': 'server.com'}


In [59]:
# Podemos acceder a los elementos de un diccionario usando indexación tipo array
print(a_dict['server'])
print(a_dict['database'])

server.com
MySQL


In [61]:
# Se pueden añadir todos los elementos que se quiera a un diccionario. Y también podemos modificar los existentes
a_dict['user'] = 'Jorge'
a_dict['database'] = 'PostgreSQL'
print(a_dict)

{'database': 'PostgreSQL', 'user': 'Jorge', 'server': 'server.com'}


In [62]:
# Se pueden mezclar elementos de diferentes tipos en un diccionario
SUFFIXES = {1000: ['KB', 'MB', 'GB', 'TB', 'PB', 'EB', 'ZB', 'YB'],
            1024: ['KiB', 'MiB', 'GiB', 'TiB', 'PiB', 'EiB', 'ZiB', 'YiB']}

print(SUFFIXES[1000])
print(SUFFIXES[1024])

['KB', 'MB', 'GB', 'TB', 'PB', 'EB', 'ZB', 'YB']
['KiB', 'MiB', 'GiB', 'TiB', 'PiB', 'EiB', 'ZiB', 'YiB']


<div class="alert alert-success"><strong>Buenas prácticas</strong>: Se puede usar el método *get* junto con el parámetro *default* para proporcionar valores por defecto si estos no existen en un diccionario</div>

In [63]:
# Mal, esto no es pythonista
frutas = {'verde': 'pera', 'amarilla': 'plátano', 'roja': 'fresa'}
if 'azul' in frutas:
    fruta_azul = frutas['azul']
else:
    fruta_azul = 'piña'
    
print(fruta_azul)

piña


In [64]:
# Esto si es pythonista
frutas = {'verde': 'pera', 'amarilla': 'plátano', 'roja': 'fresa'}

fruta_azul = frutas.get('azul', 'piña')
print(fruta_azul)

piña


# Estructuras de control (I): Condicionales

    if <condition>:
        <do something>
    elif <condition>:
        <do other thing>
    else:
        <do other thing>

<div class="alert alert-error"><strong>Importante:</strong> En Python los bloques se delimitan por sangrado, utilizando siempre cuatro espacios. Cuando ponemos los dos puntos al final de la primera línea del condicional, todo lo que vaya a continuación con *un* nivel de sangrado superior se considera dentro del condicional. En cuanto escribimos la primera línea con un nivel de sangrado inferior, hemos cerrado el condicional. Si no seguimos esto a rajatabla Python nos dará errores; es una forma de forzar a que el código sea legible.</div>

In [48]:
print(x,y)
if x > y:
    print("x es mayor que y")
    print("x sigue siendo mayor que y")

5.0 1
x es mayor que y
x sigue siendo mayor que y


In [49]:
if 1 < 0:
    print("1 es menor que 0")
print("1 sigue siendo menor que 0")  # <-- ¡Mal!

1 sigue siendo menor que 0


In [50]:
if 1 < 0:
    print("1 es menor que 0")
     print("1 sigue siendo menor que 0")

IndentationError: unexpected indent (<ipython-input-50-89ceea330d08>, line 3)

Si queremos añadir ramas adicionales al condicional, podemos emplear la sentencia `elif` (abreviatura de *else if*). Para la parte final, que debe ejecutarse si ninguna de las condiciones anteriores se ha cumplido, usamos la sentencia `else`:

In [51]:
print(x,y)
if x > y:
    print("x es mayor que y")
else:
    print("x es menor que y")

5.0 1
x es mayor que y


In [52]:
print(x, y)
if x < y:
    print("x es menor que y")
elif x == y:
    print("x es igual a y")
else:
    print("x no es ni menor ni igual que y")

5.0 1
x no es ni menor ni igual que y


<div class="alert alert-success"><strong>Buenas prácticas</strong>: Evita las comparaciones directas con True, False o None</div>

In [66]:
# Mal, esto no es pythonista
a = None
if a == None:
    print('a vale None')

a vale None


In [67]:
# Bien, esto es pythonista
a = None
if not a:
    print('a tiene un valor nulo')

a tiene un valor nulo


<div class="alert alert-success"><strong>Buenas prácticas</strong>: Evita repetir el nombre de la variable varias veces en comparaciones compuestas</div>

In [72]:
# Mal, esto no es pythonista
color = 'verde'
if color == 'verde' or color == 'rojo' or color == 'azul':
    print('El {0} es un color primario'.format(color))

El verde es un color primario


In [71]:
# Bien, esto es pythonista
color = 'verde'
if color in ('verde', 'rojo', 'azul'):
    print('El {0} es un color primario'.format(color))

El verde es un color primario


# Estructuras de control (II): Bucles

En Python existen dos tipos de estructuras de control típicas:

1. Bucles `while`
2. Bucles `for`

### `while` 

Los bucles `while` repetiran las sentencias anidadas en él mientras se cumpla una condición:

    while <condition>:
        <things to do>
        
Como en el caso de los condicionales, los bloques se separan por indentación sin necesidad de sentencias del tipo `end`

In [53]:
ii = -2
while ii < 5:
    print(ii)
    ii += 1

-2
-1
0
1
2
3
4


<div class="alert alert-info"><strong>Tip</strong>: 
`ii += 1` equivale a `ii = ii + 1`. En el segundo Python, realiza la operación ii + 1 creando un nuevo objeto con ese valor y luego lo asigna a la variable ii; es decir, existe una reasignación. En el primero, sin embargo, el incremento se produce sobre la propia variable. Esto puede conducirnos a mejoras en velocidad.

Otros operadores 'in-place' son: `-=`, `*=`, `/=` 
</div>

Se puede interrumpir el bucle a la mitad con la sentencia `break`:

In [54]:
ii = 0
while ii < 5:
    print(ii)
    ii += 1
    if ii == 3:
        break

0
1
2


Un bloque `else` justo después del bucle se ejecuta si este no ha sido interrumpido por nosotros:

In [55]:
ii = 0
while ii < 5:
    print(ii)
    ii += 1
    if ii == 3:
        break
else:
    print("El bucle ha terminado")

0
1
2


In [56]:
ii = 0
while ii < 5:
    print(ii)
    ii += 1
    #if ii == 3:
        #break
else:
    print("El bucle ha terminado")

0
1
2
3
4
El bucle ha terminado


<div class="alert alert-success"><strong>Buenas prácticas</strong>: Usa la palabra clave `in` para recorrer elementos iterables</div>

In [73]:
# Mal, esto no es pythonista
my_list = ['Larry', 'Moe', 'Curly']
index = 0
while index < len(my_list):
    print (my_list[index])
    index += 1

Larry
Moe
Curly


In [74]:
# Bien, esto es pythonista
my_list = ['Larry', 'Moe', 'Curly']
for element in my_list:
    print (element)

Larry
Moe
Curly


### `for`

El otro bucle en Python es el bucle `for`, y funciona de manera un que puede resultar chocante al principio. La idea es recorrer un conjunto de elementos:

    for <element> in <iterable_object>:
        <do whatever...>

In [57]:
for ii in (1,2,3,4,5):
    print(ii)

1
2
3
4
5


In [58]:
for nombre in "Juanlu", "Siro", "Carlos":
    print(nombre)

Juanlu
Siro
Carlos


In [59]:
for ii in range(3):
    print(ii)

0
1
2


In [60]:
for jj in range(2, 5):
    print(jj)

2
3
4


<div class="alert alert-success"><strong>Buenas prácticas</strong>: Usa la función `enumerate` para acceder al índice de un elemento en un bucle, en lugar de crear una variable para ello (vicio típico en programadores de C/C++)</div>

In [75]:
# Mal, esto no es pythonista
my_container = ['Larry', 'Moe', 'Curly']
index = 0
for element in my_container:
    print ('{} {}'.format(index, element))
    index += 1

0 Larry
1 Moe
2 Curly


In [76]:
# Bien, esto es pythonista
my_container = ['Larry', 'Moe', 'Curly']
for index, element in enumerate(my_container):
    print ('{} {}'.format(index, element))

0 Larry
1 Moe
2 Curly


<div class="alert alert-success"><strong>Buenas prácticas</strong>: Puedes utilizar `else` para ejecutar código después de que termine un bucle</div>

In [78]:
# Mal, esto no es pythonista
pares = [2, 4, 6, 8, 10, 12, 14]
hay_impar = False
for n in pares:
    if n % 2:
        hay_impar = True
        break
        
if not hay_impar:
    print('Todos los números son pares')

Todos los números son pares


In [80]:
# Bien, esto es pythonista
pares = [2, 4, 6, 8, 10, 12, 14]
for n in pares:
    if n % 2:
        break

# El else se va a ejecutar después del bucle siempre y cuando no lo rompamos de manera abrupta con un break
else:
    print('Todos los números son pares')

Todos los números son pares


# Definición de funciones

Para definir nuestra propia función utilizamos la sentencia `def` seguida del nombre de la misma y entre paréntesis los argumentos de entrada. La primera línea de la función puede ser una cadena de documentación.

In [43]:
# Definimos función "funcion" que no haga nada
def funcion(x, y):
    """Función de prueba."""
    pass

In [5]:
funcion

<function __main__.funcion>

In [6]:
funcion.__doc__

'Función de prueba.'

Los valores de retorno de la función se especifican con la sentencia `return`. Por ejemplo:

In [8]:
# Definir función que eleva un número al cuadrado
def al_cuadrado(x):
    """Función que eleva un número al cuadrado."""
    y = x ** 2
    return y

In [9]:
al_cuadrado(4)

16

In [10]:
# Definir función que multiplica dos números. Por defecto, el segundo de ellos valdrá 2
def multiplica(x, y=2.0):
    """Multiplica dos números, por defecto el primero por 2."""
    return x * y

In [14]:
multiplica(2, 3), multiplica(4)

(6, 8.0)

<div class="alert alert-success"><strong>Buenas prácticas</strong>: Evita el uso de `[]`, `{}` o `''` como parámetros por defecto para funciones</div>

In [84]:
"""
Potencial error aquí. El valor por defecto de una función es evaluado una sola vez. Si dicho argumento es un objeto mutable,
como una lista o un diccionario, la función acumula los argumentos pasados en llamadas sucesivas
"""
def f(a, L=[]):
    L.append(a)
    return L

print (f(1))
print (f(2))
print (f(3))

[1]
[1, 2]
[1, 2, 3]


In [85]:
# Si queremos evitar que se acumule el valor del argumento por defecto, lo podemos escribir así
def f(a, L=None):
    if not L:
        L = []
    L.append(a)
    return L

print (f(1))
print (f(2))
print (f(3))

[1]
[2]
[3]


<div class="alert alert-success"><strong>Buenas prácticas</strong>: Usa `*args` y `**kwargs` para aceptar un número arbitrario de parámetros en las funciones</div>

In [92]:
# Definiendo *args como parámetro de una función, permitimos que dicha función reciba cualquier número de parámetros.
# Dentro de la función, *args es desempaquetado como una lista, de manera que espera que se le pase una lista de elementos
def func(*args):
    print("Argumentos:")
    for arg in args:
        print(arg)
        
func(134, 543, "sfds", [])

Argumentos:
134
543
sfds
[]


In [98]:
# Definiendo **kwargs como parámetro de una función, permitimos que dicha función reciba un diccionario con un número 
# arbitrario de elementos clave:valor.
# Dentro de la función, **kwargs es desempaquetado como una diccionario
def func(**kwargs):
    print("Argumentos:")
    for k,v in kwargs.items():
        print("{0} => {1}".format(k, v))
        
func(a=134, b=543, c="sfds")

Argumentos:
a => 134
b => 543
c => sfds


In [100]:
# Podemos usar ambos a la vez
def func(*args, **kwargs):
    print ("Args:")
    for arg in args:
        print(arg)
        
    print ("Kwargs:")
    for k,v in kwargs.items():
        print("{0} => {1}".format(k, v))
        
func(2342, 43534, 5645, x=456, y=3)

Args:
2342
43534
5645
Kwargs:
x => 456
y => 3


## PEP 8

__La guía de estilo:__

* Usa sangrado de 4 espacios, no tabuladores [IPython o tu editor se encargan de ello].
* Acota las líneas a 79 caracteres.
* Usa líneas en blanco para separar funciones y bloques de código dentro de ellas.
* Pon los comentarios en líneas aparte si es posible.
* Usa cadenas de documentación (*docstrings*).
* Pon espacios alrededor de los operadores y después de coma.
* Usa la convención minuscula_con_guiones_bajos para los nombres de las funciones y las variables.
* Aunque Python 3 te lo permite, no uses caracteres especiales para los identificadores.

(Traducido de http://docs.python.org/3/tutorial/controlflow.html#intermezzo-coding-style)

Utilizando el módulo pep8

https://pypi.python.org/pypi/pep8

Y la extensión pep8magic

https://gist.github.com/Juanlu001/9082229/

Podemos comprobar si una celda de código cumple con las reglas del PEP8:

In [28]:
%load_ext pep8magic

In [29]:
%%pep8
if 6*9==42:print("Something fundamentally wrong..."  )

stdin:1:7: E225 missing whitespace around operator
if 6*9==42:print("Something fundamentally wrong..."  )
      ^
stdin:1:11: E231 missing whitespace after ':'
if 6*9==42:print("Something fundamentally wrong..."  )
          ^
stdin:1:11: E701 multiple statements on one line (colon)
if 6*9==42:print("Something fundamentally wrong..."  )
          ^
stdin:1:53: E202 whitespace before ')'
if 6*9==42:print("Something fundamentally wrong..."  )
                                                    ^


In [30]:
%%pep8
if 6*9 == 42:
    print("Something fundamentally wrong...")

This code is PEP8-compliant!


_Hemos visto como la sintaxis de Python nos facilita escribir código legible así como aprendido algunas buenas prácticas al programar. Características como el tipado dinámico (no hace falta declarar variables) y ser lenguaje interpretado (no hace falta compilarlo) hacen que el tiempo que pasamos escrbiendo código sea menos que en otro tipo de lenguajes._

_Se han presentado los tipos de variables, así como las estructuras de control básicas. En la siguiente clase practicaremos con algunos ejercicios para que te familiarices con ellas_

_Esperamos también que poco a poco te sientas cada vez más a gusto con el Notebook de IPython y puedas sacarle todo el partido_

__Referencias__

* Tutorial de Python oficial actualizado y traducido al español http://docs.python.org.ar/tutorial/
* Vídeo de 5 minutos de IPython http://youtu.be/C0D9KQdigGk
* Introducción a la programación con Python, Universitat Jaume I http://www.uji.es/bin/publ/edicions/ippython.pdf
* PEP8 http://www.python.org/dev/peps/pep-0008/‎

---

Clase en vídeo, parte del [Curso de Python para científicos e ingenieros](http://cacheme.org/curso-online-python-cientifico-ingenieros/) grabado en la Escuela Politécnica Superior de la Universidad de Alicante.

In [1]:
from IPython.display import YouTubeVideo

YouTubeVideo("ox09Jko1ErM", width=560, height=315, list="PLGBbVX_WvN7bMwYe7wWV5TZt1a58jTggB")

---

Si te ha gustado esta clase:

<a href="https://twitter.com/share" class="twitter-share-button" data-url="https://github.com/AeroPython/Curso-AeroPython-UC3M/" data-text="Aprendiendo Python con" data-via="AeroPython" data-size="large" data-hashtags="AeroPython">Tweet</a>
<script>!function(d,s,id){var js,fjs=d.getElementsByTagName(s)[0],p=/^http:/.test(d.location)?'http':'https';if(!d.getElementById(id)){js=d.createElement(s);js.id=id;js.src=p+'://platform.twitter.com/widgets.js';fjs.parentNode.insertBefore(js,fjs);}}(document, 'script', 'twitter-wjs');</script>

---

#### <h4 align="right">¡Síguenos en Twitter!

###### <a href="https://twitter.com/AeroPython" class="twitter-follow-button" data-show-count="false">Follow @AeroPython</a> <script>!function(d,s,id){var js,fjs=d.getElementsByTagName(s)[0],p=/^http:/.test(d.location)?'http':'https';if(!d.getElementById(id)){js=d.createElement(s);js.id=id;js.src=p+'://platform.twitter.com/widgets.js';fjs.parentNode.insertBefore(js,fjs);}}(document, 'script', 'twitter-wjs');</script>  

##### <a rel="license" href="http://creativecommons.org/licenses/by/4.0/deed.es"><img alt="Licencia Creative Commons" style="border-width:0" src="http://i.creativecommons.org/l/by/4.0/88x31.png" /></a><br /><span xmlns:dct="http://purl.org/dc/terms/" property="dct:title">Curso AeroPython</span> por <span xmlns:cc="http://creativecommons.org/ns#" property="cc:attributionName">Juan Luis Cano Rodriguez y Alejandro Sáez Mollejo</span> se distribuye bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/deed.es">Licencia Creative Commons Atribución 4.0 Internacional</a>.

##### <script src="//platform.linkedin.com/in.js" type="text/javascript"></script> <script type="IN/MemberProfile" data-id="http://es.linkedin.com/in/juanluiscanor" data-format="inline" data-related="false"></script> <script src="//platform.linkedin.com/in.js" type="text/javascript"></script> <script type="IN/MemberProfile" data-id="http://es.linkedin.com/in/alejandrosaezm" data-format="inline" data-related="false"></script>

---
_Las siguientes celdas contienen configuración del Notebook_

_Para visualizar y utlizar los enlaces a Twitter el notebook debe ejecutarse como [seguro](http://ipython.org/ipython-doc/dev/notebook/security.html)_

    File > Trusted Notebook

In [2]:
%%html
<a href="https://twitter.com/AeroPython" class="twitter-follow-button" data-show-count="false">Follow @AeroPython</a>
<script>!function(d,s,id){var js,fjs=d.getElementsByTagName(s)[0],p=/^http:/.test(d.location)?'http':'https';if(!d.getElementById(id)){js=d.createElement(s);js.id=id;js.src=p+'://platform.twitter.com/widgets.js';fjs.parentNode.insertBefore(js,fjs);}}(document, 'script', 'twitter-wjs');</script>

In [3]:
# Esta celda da el estilo al notebook
from IPython.core.display import HTML
css_file = '../static/styles/style.css'
HTML(open(css_file, "r").read())