# Introducción a Python 3 para Ciencia de Datos

## Contenidos

* [2. Programación en Python](#2.-Programación-en-Python)
    * [2.1 El primer programa](#2.1-El-primer-pograma)
    * [2.2 Tipos de datos integrados](#2.2-Tipos-de-datos-integrados)
        * [2.2.1 Operaciones booleanas](#2.2.1-Operaciones-booleanas:-verdadero/falso)
        * [2.2.2 Datos numéricos](#2.2.2-Datos-numéricos)
        * [2.2.3 Secuencias: Cadenas de caracteres](#2.2.3-Secuencias:-Cadenas-de-caracteres)
        * [2.2.4 Secuencias: Tuplas](#2.2.4-Secuencias:-Tuplas)
        * [2.2.5 Secuencias: Listas](#2.2.5-Secuencias:-Listas)
        * [2.2.6 Mapeo: Diccionarios](#2.2.6-Mapeo:-Diccionarios)
        * [2.2.7 Conjuntos](#2.2.7-Conjuntos)
    * [2.2.3 Control de flujo](#2.3-Control-de-flujo)
        * [2.3.1 If/elif/else](#2.3.1-If/elif/else)
        * [2.3.2 While](#2.3.2-While)
        * [2.3.3 For/range](#2.3.3-For/range)
        * [2.3.4 Break/continue y else en bucles](#2.3.4-Break/continue-y-else-en-bucles)
        * [2.3.5 Métodos avanzados de iteración](#2.3.5-Métodos-avanzados-de-iteración)
        

## Otros recursos

Para ampliar el contenido de esta sesión, se recomienda consultar:

* El material de referencia de [SciPy Lecture Notes](http://www.scipy-lectures.org/), en particular su sección [1.2 The Python language](http://www.scipy-lectures.org/intro/language/python_language.html).
* La **documentación oficial de Python**, que incluye:
    * **Tutorial** de introducción a Python. &lt; https://docs.python.org/3.4/tutorial/index.html &gt;
    * Referencia de la **biblioteca estándar**. &lt; https://docs.python.org/3.4/library/index.html &gt;

# 2. Programación en Python

Python se ha convertido en uno de los lenguajes de programación más populares en la actualidad, especialmente para programación científica y ciencia de datos. Sus principales características son:

* Es un lenguaje **interpretado**, no compilado (como podría ser C). Por tanto, podemos ejecutarlo interactivamente a través de un *intérprete de Python* (como por ejemplo IPython en Spyder).
* Es **software libre**, y concentra a su alrededor una importante comunidad de desarrolladores y patrocinadores que fomentan su crecimiento y actualización.
* Es un lenguaje **multiplataforma**, que puede ejecutarse en los principales sistemas operativos (GNU/Linux, Windows, OS X).
* Viene acompañado de una larga **lista de bibliotecas** y **paquetes software**, que ya implementan una gran variedad de funcionalidades (desde cálculo científico hasta entornos completos de desarrollo web).
* Es un lenguaje de programación directo, que fomenta la concisión y la claridad en el desarrollo de código.
* Se adapta bien a **diferentes paradigmas de programación**, tales como programación imperativa, orientada objetvos o funcional.
* Proporciona interfaces para integrar código en otros lenguajes de forma sencilla, particularmente C y C++.

Al mismo tiempo, Python posee ciertas peculiaridades respecto a otros lenguajes:

* Su sintaxis directa no utiliza llaves, por lo que es obligatorio **identar nuestro código** (y hacerlo de forma ordenada y consistente).
* Los **tipos de datos** de las **variables** pueden **cambiar dinámicamente** durante la ejecución de un programa. Aunque esto nos ofrece capacidades muy potentes para la programación, puede ser perjudicial si se abusa mucho de esta capacidad.

Iremos aprendiendo muchas de estas características a lo largo del curso.

## 2.1 El primer pograma

Es muy habitual que el primer programa que hagamos en cualquier lenguaje de programación muestre el mensaje "¡Hola mundo!". Este ejemplo demuestra lo directo que resulta programar en Python. Si escribimos en nuestro intérprete de IPython la siguiente línea de código, obtendremos el resultado deseado:

In [None]:
print("¡Hola mundo!")

Las siguientes instrucciones en el intérprete de IPython nos permiten practicar algunas operaciones básicas:

In [None]:
# Creación de variables
x = 3

# Creación de una variable a partir de otra anterior
y = 4*x

In [None]:
# Comprobación dinámica del tipo de una variable
type(x)     

In [None]:
# Mostrar el valor de la variable
print(y)

In [None]:
# Operacines aritmétcias
print("La suma de x e y es:", x + y)

print("El producto de x e y es:", x * y)

In [None]:
# Cambiamos la variable 'y' a cadena de caracteres
# Nótese el soporte para tildes, etc.
y = '¿Qué tal?'

type(y)

In [None]:
# Las operaciones cambian en función del tipo de variable
print('¿Qué ocurre si sumo dos cadenas?:', y + ' Muy bien')

print('¿Y si las multiplico?', 5*y)

## 2.2 Tipos de datos integrados

Python viene preparado de serie con un compendio de **tipos de datos** que ya vienen integrados en el intérprete. Para más información, consultar la sección [Built-in Types](https://docs.python.org/3.4/library/stdtypes.html) en la documentación oficial de Python.

### 2.2.1 Operaciones booleanas: verdadero/falso

En Python se definen dos constantes para representar los valores booleanos *Verdadero* y *Falso*. Además, se pueden realizar operaciones sobre cualquier conjunto de valores booleanos. 

In [None]:
# Verdadero
True

# Falso
False

# Los siguientes valores se consideran siempre como False
None
False
# Cero en cualquier tipo de datos numérico
0, 0.0, 0j 
# Cualquier secuencia vacía
'', (), [] 
# Cualquier mapeo vacío
{}

In [None]:
# Operaciones booleanas

# And lógico
print(True and False)

# Or lógico
print(True or False)

# Negación
print(not False)

Además, existe una serie de [comparadores](https://docs.python.org/3.4/library/stdtypes.html#comparisons) que permiten realizar operaciones de comparación sobre valores y variables, dando como resultado un valor booleano (`True` o `False`).

### 2.2.2 Datos numéricos

Existen tres tipos de datos numéricos en Python: `int` (enteros), `float` (números con decimales) y `complex` (números complejos).

In [None]:
# Números enteros
a = 2 * 3
print(a)

type(a)

In [None]:
# Números decimales (coma flotante)
b = 3.1416
type(b)

In [None]:
# Números complejos (parte real + parte imaginaria)
z = 1. + 1.j # Cuidado con el uso de los puntos!!
print('Parte real de z:', z.real)
print('Parte imaginaria de z:', z.imag)
type(z)

La referencia de la biblioteca estándar de Python ofrece información adicional sobre [tipos de datos numéricos y operaciones](https://docs.python.org/3.4/library/stdtypes.html#numeric-types-int-float-complex) que podemos realizar sobre ellos.

<a id="Strings"></a>
### 2.2.3 Secuencias: Cadenas de caracteres

En Python 3, las cadenas de caracteres se tratan como objetos de tipo `str`. Son secuencias **inmutables** de caracteres representados según el estandar Unicode. Que sean *inmutables* implica que una vez creada la secuencia ya no se puede alterar su valor. Para cambiarlas, hace falta crear una nueva secuencia totalmente nueva, o seleccionando y combinando componentes de una cadena de caracteres ya existente.

Veamos algunos ejemplos:

In [None]:
# Formas de definir una cadena de caracteres en Python
# Todas ellas son equivalentes, pero algunas nos aportan ciertas ventajas

# Forma 1: Delimitamos la cadena de caracteres entre comillas simples
cadena = 'Esto es una cadena de caracteres'
print(type(cadena))

# Forma 2: Deilimitamos la cadena entre comillas dobles
cadena2 = "Otra cadena de caracteres"

# Podemos introducir comillas de un tipo dentro de la cadena
# siempre que delimitemos los extremos con el otro tipo de comillas
ejemplo = 'Metemos "comillas dobles" dentro de comillas simples'
ejemplo2 = "Metemos 'comillas simples' dentro de comillas dobles"

# Forma 3: Usamos triples comillas (simples o dobles) para delimitar cadenas
# que ocupen más de una línea. Todos los espacios en blanco y saltos de línea
# serán incluidos dentro de la cadena
linea = '''Esto es un ejemplo de una cadena
de caracteres que ocupa dos líneas'''

# El salto de línea se representa como \n y una tabulación como \t
linea2 = 'Primera línea \nSegunda línea y ahora\t tabulamos'
print(linea2)

Como las cadenas de caracteres en Python 3 se representan mediante secuencias de caracteres individuales, se pueden aplicar sobre ellas cualquiera de las [operaciones comunes para objetos de tipo secuencia](https://docs.python.org/3.4/library/stdtypes.html#typesseq-common).

Además, también se puede aplicar sobre ellas una serie de [operaciones específicas para objetos de tipo `str`](https://docs.python.org/3.4/library/stdtypes.html#string-methods).

Veamos algunos ejemplos:

In [None]:
# Longitud
print('Longitud de la cadena ejemplo:', len(ejemplo))

# Concatenamos dos cadenas
print(ejemplo +  ejemplo2)

# Todo mayúsculas
print(cadena.upper())

# Centrado (para una línea de longitud 80 caracteres)
print(cadena.center(80))

# Todo en minúsculas
print(cadena.lower())

# ¿Son todos los caracteres minúsculas?
print(cadena.islower())

# ¿Y ahora?
print(cadena.lower().islower())

# Concatenamos dos cadenas con un carácter de separación
# El método join() se llama sobre el carácter que usamos como separador
print(' '.join([ejemplo, ejemplo2]))

<a id="Tuples"></a>
### 2.2.4 Secuencias: Tuplas

Las tuplas son **secuencias inmutables** de objetos, que pueden ser de tipos completamente heterogéneos o todos del mismo tipo. La norma básica es que, una vez creada la tupla, sus elementos ya no se pueden modificar ni cambiar de posición (de ahí que sean objetos *inmutables*). Esto nos permite garantizar que esos valores no se puedan modificar en ningún caso.

Veamos algunos ejemplos:

In [None]:
# Variables que usamos para el ejemplo
a = 1
b = 2
c = 3
# Definición de tuplas
# Tupla vacía
()
# Tupla con un elemento
t1 = a,
t1 = (a,)
# Tupla con varios elementos
t2 = a, b, c
t2 = (a, b, c)
# También podemos llamar explícitamente a la función tuple()
# para transformar en tupla otros tipos de secuencias, por
# ejemplo una lista  
t3 = tuple([c,])
print(t3)

Puesto que las tuplas son secuencias, podemos aplicar sobre ellas todas las [operaciones comunes para objetos de tipo secuencia](https://docs.python.org/3.4/library/stdtypes.html#typesseq-common).

<a id="Lists"></a>
### 2.2.5 Secuencias: Listas

Una lista nos proporciona una **secuencia mutable** de componentes que suelen ser de un tipo de datos homogéneo, aunque nada impide crear listas cuyos componentes sean de tipos distintos. Al ser secuencias *mutables*, las listas están preparadas para modificar su contenido a lo largo de la ejecución del programa, y para ello ofrecen más operaciones además de las comunes para todos los objetos de tipo secuencia.

Veamos algunos ejemplos:

In [None]:
# Variables que usamos para el ejemplo
a = 1
b = 2
c = 3
# Definición de listas
# Lista vacía
[]
# Lista con un elemento
l1 = [a]
# Lista con varios elementos
l2 = [a, b, c]
# También podemos llamar explícitamente a la función list()
# para transformar en lista otros tipos de secuencias, por
# ejemplo una tupla  
l3 = list((a, b, c))
print(l3)

# Finalmente, también podemos generar listas de una forma
# muy compacta y típica en lenguaje Python, llamada
# list comprehension
# my_list = [x for x in iterable]
l4 = [x for x in t2*2]
print(l4)

Tal y como hemos dicho, además de las  [operaciones comunes para objetos de tipo secuencia](https://docs.python.org/3.4/library/stdtypes.html#typesseq-common), las listas soportan una serie de [operaciones específicas para objetos de tipo secuencia mutable](https://docs.python.org/3.4/library/stdtypes.html#mutable-sequence-types).

In [None]:
# Indexación
# Imprime el cuarto elemento de la lista
# ATENCIÓN: en Python los índices de secuencias comienzan en 0 (no como en R)
l5 = [1, 2, 3, 4, 5]
print('Cuarto elemento de la lista:', l5[3])

# Añadir un elemento al final
l5.append(55)

# Insertar en la posición i un elemento x
# s.insert(i, x)
l5.insert(0, 11)

# Secuencia de elementos en orden inverso
l5.reverse()
print('Lista en orden inverso', l5)

# Extraer el último elmento de la secuencia
print('Sacamos el último elmento:', l5.pop())
print('Y la lista queda:', l5)

<a id="Dicts"></a>
### 2.2.6 Mapeo: Diccionarios

Los diccionarios son colecciones que permiten clasificar objetos de tipo arbitrario, cada uno de ellos identificado mediante una clave única que no se puede repetir (lo que se conoce como un `hash`). Los diccionarios son **collecciones mutables** porque sus componentes pueden cambiar a lo largo de la ejecución de un programa. Eso sí, siempre se garantiza que no pueden existir dos elementos de un diccionario con el mismo identificador `hash`.

Veamos algunos ejemplos:

In [None]:
# Definición
# Usando llaves
d1 = {'nombre': 'Barack', 'apellido': 'Obama', 'cargo':'presidente'}
# Que podemos usar para formatear una línea con parámetros a imprimir
print('El {cargo} actual de los EE.UU. es {nombre} {apellido}.'.format(**d1))

# Usando la función integrada dict()
# Aquí no hace falta usar comillas para las claves
d2 = dict(nombre='Clark', apellido='Kent', identidad='Superman')
print('El superhéroe {identidad} es en realidad {nombre} {apellido}.'.format(**d2))

# A partir de otras secuencias
d3 = dict([('Batman', 'Bruce Wayne'), ('Tony Stark', 'Iron Man')])
print(d3)

Los diccionarios son colecciones especiales de datos (llamadas mapeo o *mapping* en inglés), que implementan una serie de [operaciones especiales para objetos de tipo mapping](https://docs.python.org/3.4/library/stdtypes.html#mapping-types-dict). Entre las más importantes están las de recuperar (`get`) o actualizar (`update`) un el elemento correspondiente a una clave dada.

In [None]:
d3 = dict([('Batman', 'Bruce Wayne'), ('Tony Stark', 'Iron Man')])
# Obtener un objeto
print(d3.get('Batman'))

# ¿Y si no está esa clave?
print(d3.get('Thor'))

# Añadiendo entradas, debe ser una lista que contenga tuplas de dos elementos
d3.update([('Thor', 'Dios del Trueno')])
print(d3)

<a id="Sets"></a>
### 2.2.7 Conjuntos

Se trata de colecciones no ordenadas de objetos que no se repiten. En cierto modo, podemos verlos como las colecciones de claves que no se repiten de un diccionario, pero sin un valor u objeto asociado a cada una. Las aplicaciones típicas de los conjuntos son:
* Comprobaciones de pertenencia a un conjunto.
* Garantizar que se eliminan elementos duplicados.
* Cálculo de [funciones matemáticas para conjuntos](https://docs.python.org/3.4/library/stdtypes.html#set-types-set-frozenset): unión, intersección, diferencia y diferencia simétrica.

In [None]:
# Ejemplo: aplicación sencilla para eliminar duplicados
set1 = set([1, 2, 1, 3, 1, 4])
set2 = set([2, 3, 4, 5, 5, 5])

# Unión
print('Unión:', set1 | set2)

# Intersección
print('Intersección:', set1 & set2)

<a id="Flow-control"></a>
## 2.3 Control de flujo

De forma análoga a otros lenguajes de programación, Python ofrece diferentes tipos de sentencias para controlar el flujo de ejecución de nuestros programas. A continuación vemos algunos ejemplos.

Para más información, véase la sección sobre [control de flujo](https://docs.python.org/3.4/tutorial/controlflow.html) en el tutorial oficial de Python.

<a id="If-else"></a>
### 2.3.1 If/elif/else

In [None]:
# Cambiar los valores de a en el ejemplo para comprobar las diferencias
# en la salida
a = 10
if a > 0:
    print('La variable a es positiva.')
elif a == 0:
    print('La variable a es cero.')
else:
    print('La variable a es negativa.')

<a id="While"></a>
### 2.3.2 While

In [None]:
# Ejemplo de bucle while
a = 0.5

while  a > 0.01:
    a = a / 2
print(a)

<a id="For"></a>
### 2.3.3 For/range

In [None]:
# Ejemplo de bucle for
elementos = ['Superman', 'Batman', 'Robin']

for e in elementos:
    print(e)
    
# range() nos permite controlar el índice de la iteración
for i in range(1, 10):
    print(i**2)
    
# También podemos cambiar el salto entre elementos del rango
# range(1, 10, 3)

# Cuidado: el objeto devuelto por range no es una lista, sino un
# iterador, que va generando cada nuevo elemento conforme se necesita.
# Así se ahorra espacio
print(range(1, 10))

<a id="Break-cont"></a>
### 2.3.4 Break/continue y else en bucles

In [None]:
# Break interrumpe un bucle y sale del mismo
# Identificación de primos y compuestos
for n in range(2, 10):
    for x in range(2, n):
        if n % x == 0:
            print(n, 'es igual a', x, '*', n//x)
            break
        else:
            # el bucle acabó sin encontrar factores entre 1 y n
            print(n, 'es primo')

# Continue pasa a la siguiente iteración del bucle
for i in range(2, 10):
    if i % 2 == 0:
        print(i, 'es un número par')
        continue
    print(i, 'es un número impar')

<a id="Adv-iter"></a>
### 2.3.5 Métodos avanzados de iteración

Además de los métodos anteriores, Python proporciona algunos métodos de iteración potentes y a la vez sencillos de escribir.

In [None]:
# Podemos iterar directamente sobre los elementos de cualquier
# objeto de tipo secuencia
cadena = 'Supercalifragilístico'
for letra in cadena:
    print(letra, ' ', end="")
print()
    
# Usamos la función enumerate() para acceder también al índice
# de la secuencia de iteración, si es preciso
for i, letra in enumerate(cadena):
    print(i, ':', letra, ' ', end="")
    
# Finalmente, también tenemos las list comprehensions
[i**3 for i in range(10)]