# Programación para *Data Science*

## Unidad 2: Breve introducción a la programación en Python

Ejercicios y preguntas teóricas
-------------------------------

A continuación, encontraréis la parte que tenéis que completar en este módulo y las preguntas teóricas que debéis contestar.

Podéis encontrar en la documentación oficial de *string* funciones que os puedan ser de ayuda para completar los ejercicios: https://docs.python.org/2/library/string.html

### Pregunta 1
¿Cuál es la diferencia entre definir un string con comillas simples (' '), comillas dobles(" ") y tres comillas dobles (""" """)?

#### Respuesta:


Las comillas simples (' ') y las comillas dobles (" ") puedes utilizarse de forma intercambiable, si bien existe un caso en que deberíamos elegir una u otra: si la cadena de texto o string que queremos definir mediante comillas incluye comillas dentro del mismo, utilizaremos el tipo de comillas opuesto para definir el string. De esta forma, evitaremos que el intérprete Python detecte el fin de la cadena de texto a mitad de frase. Por ejemplo:

In [1]:
texto_1 = 'Mi libro favorito se titula "El retrato de Dorian Gray".'
print texto_1

Mi libro favorito se titula "El retrato de Dorian Gray".


Si, por el contrario, definiéramos dicho string mediante comillas dobles, obtendríamos un error:

In [2]:
texto_2 = "Mi libro favorito se titula "El retrato de Dorian Gray"."
print texto_2

SyntaxError: invalid syntax (<ipython-input-2-45535628f601>, line 1)

Hemos obtenido un error de "sintaxis inválida" debido a que el intérprete ha utilizado la primera comilla doble (correspondiente a la cita del libro) como el final de la cadena de texto. En consecuencia, el nombre del libro no se encuentra dentro de la definición del string, generado el error de sintaxis.
Finalmente, las comillas triples (""" """ o ''' ''') cumplen la misma funcionalidad que las dobles y las simples, con una salvedad: respetan los saltos de línea especificados en el string definido, sin necesidad de codificarlos como "\n". Veamos un ejemplo:

In [4]:
texto_3 = """Gama colores fríos:
- Azul
- Gris
- Violeta"""
print texto_3

Gama colores fríos:
- Azul
- Gris
- Violeta


Sin embargo, utilizando comillas dobles se rompe la cadena de texto y se nos notifica un error de sintaxis:

In [5]:
texto_4 = "Gama colores fríos:
- Azul
- Gris
- Violeta"
print texto_4

SyntaxError: EOL while scanning string literal (<ipython-input-5-1e9433fe7942>, line 1)

Si deseamos mantener el formato sin utilizar comillas triples, debemos utilizar "\n" para definir los saltos de línea: 

In [6]:
texto_5 = "Gama colores fríos: \n - Azul \n - Gris \n - Violeta"
print texto_5

Gama colores fríos: 
 - Azul 
 - Gris 
 - Violeta


### Pregunta 2
¿Qué expresión en Python necesitamos para conseguir el string "DATADATADATADATA" utilizando solo la palabra "DATA"?

#### Respuesta:

In [8]:
# Definimos un string con el texto que queremos multiplicar y realizamos la operación sobre él
texto = "DATA"
texto_multiple = texto*4
# Comprobamos el resultado mostrándolo por pantalla 
print texto_multiple

DATADATADATADATA


### Pregunta 3

**¿Cuál es el valor final de a, b y c (atención a los tipos de número decimal y entero)?**

a = 3*2

b = 9/2.

c, a = a+1, b*2

#### Respuesta:

Las operaciones se realizan secuencialmente. Notamos que la variable "a" está definida como entero (int), mientras que el punto (.) al final de la operación de "b" define dicha variable como como decimal (float). Por tanto, obtenemos "a=6" (int) y "b=4.5" (float).

La última expresión define una nueva variable "c", la cual también será entera, ya que opera únicamente con valores enteros ("a" y "1"). Además, se asigna un nuevo valor a la variable "a". En este caso, "a=b\*2=4.5\*2=7.0", transformando "a" en decimal (float). Dicho cambio se debe a que las operaciones implicaban tanto valores valores decimales ("b") como enteros ("2"), imponiéndose el formato decimal en el resultado, ya que proporciona una mayor precisión y es por ende priorizado por el intérprete Python en caso de conflicto.

Así pues, los resultados finales son: a=9.0 b=4.5 y c=7. Lo comprobamos mediante la ejecución de código:

In [20]:
a=3*2
b=9/2.
c, a = a+1, b*2
print a, b, c

9.0 4.5 7


### Pregunta 4

**Marcad las expresiones incorrectas y explicad el porqué.**
* planetas = ('Saturno', 'Jupiter' 'Tierra')
* t = '123','abc'
* dias = ['Lunes', 'Martes', "Miercoles", ''.join(['J','u','e','v','e','s'])]
* matriz = [[],[],[]]

**Respuesta:**

- Incorrecto: El último elemento de la tupla "planetas", 'Tierra' no está separado del anterior, 'Júpiter'. De este modo, se está definiendo un vector de tan sólo dos elementos, 'Saturno' y 'JupiterTierra', ya que el intérprete Python ignora los espacios que no se encuentren entre comillas. Sería necesario añadir una coma (,) en su lugar.
- Correcto
- Correcto
- Correcto, aunque la instrucción no define necesariamente una matriz (ya que aún no se han especificado sus elementos), si no un array unidimensional de elementos '[]'.

Mostramos por pantalla las expresiones anteriores por tal de validar contenidos

In [61]:
planetas = ('Saturno', 'Jupiter' 'Tierra')
t = '123','abc'
dias = ['Lunes', 'Martes', "Miercoles", ''.join(['J','u','e','v','e','s'])]
matriz = [[],[],[]]

print (planetas)
print (t)
print (dias)
#Mostramos por pantalla el contenido de 'matriz'
print (matriz)
#Mostramos el segundo elemento de 'matriz', tratandólo como una lista
print (matriz[1])


('Saturno', 'JupiterTierra')
('123', 'abc')
['Lunes', 'Martes', 'Miercoles', 'Jueves']
[[], [], []]
[]


### Pregunta 5

Explicad a qué se refieren con el término "batteries included" en la comunidad Python. Poned algunos ejemplos de paquetes de la librería estándar y una breve explicación de cada uno de ellos.

**Respuesta:**

El término "batteries included" hace referencia a la librería estándar de Python (stdlib), la cual incluye multitud de paquetes con utilidades robustas, que permiten un desarrollo inmediato de multitud de aplicaciones sin necesidad de descargar paquetes adicionales. Algunos de los paquetes más interesantes son:
- Módulo de interacción con el Sistema Operativo: el paquete 'os' contiene multitud de funciones que permiten interactuar con el sistema operativo base como consulta y modificación de variables de entorno, paths, usuarios, grupos, parámetros de procesos, etc.
- Argumentos de línea de comando: el módulo 'sys' proporciona acceso a algunas variables utilizadas o mantenidas por el intérprete: flags, configuración de floats (precisión y representación interna), límite de recursividad, redirección de mensajes de error, etc.
- Matemáticas: el módulo 'math' da acceso a una librería C con multitud de funciones matemáticas implementadas, tales como constantes, métricas estadísticas (variancia, media, distribuciones, etc), generadores de valores, entre muchos otros.
- Compresión de datos: diversos módulos como 'zlib', 'gzip', 'bz2', 'lzma' o 'zipfile' proporcionan distintos métodos de archivado y compresión de ficheros.
Otros módulos notables gestionan el uso de fechas y horas ('datetime'), el acceso a internet ('urllib', 'smtplib') o el control de calidad ('unitest','doctest').

### Pregunta 6

Python dispone de un idiom muy útil conocido como list comprehensions. ¿Podéis explicar en qué consiste? Indicad tres ejemplos de código que utilicen este idiom y documentad cada parte de código relevante.

**Respuesta:**

El idiom "List comprehensions" proporciona una sintexis alternativa para la creación de listas donde cada elemento de la misma es el resultado de ciertas operaciones aplicadas a otra secuencia o iterable.
Por ejemplo, dada una lista de valores enteros, podemos crear una nueva lista aplicando alguna operación matemática a los elementos de la primera:

In [38]:
#Definimos una lista de enteros cualquiera
lista_num = [-3, -1, 1, 3]
#Definimos una nueva lista a partir de los elementos de la anterior, elevandolos al cubo y 
#la mostramos por pantalla
lista_num_cubo = [x**3 for x in lista_num]
print (lista_num_cubo)

[-27, -1, 1, 27]


También podemos utilizar declaraciones más complejas, como **for** o **if** y tratar contenidos de varias listas o diccionarios. Por ejemplo, podemos analizar los pares clave-valor de un diccionario, aplicar alguna condición a los mismos y guardar en una lista el resultado de dicha condición (es decir, qué elementos la cumplen y cuáles no):

In [37]:
#Definimos un diccionario con pares clave-valor de tipo dirección-precio_alquiler
alquileres = dict(muntaner_289=1200, valencia_52=950, diagonal_440=1600, escorial_25=900)
#Definimos una lista conteniendo las claves de los pisos con valor (alquiler) menor a 1000
#y la mostramos por pantalla
alquileres_economicos = [k for k,v in sorted(alquileres.items()) if v <1000]
print (alquileres_economicos)

['escorial_25', 'valencia_52']


Otro posible uso sería la extracción de ciertas partes o cadenas de texto de un string. Para ello, definimos una función con el comportamiento deseado, hacieno uso de sintaxis "list comprehension". Por defecto, al aplicar la función, cada caracter se convierte en un elemento de la lista. Para una visualización correcta, se hace uso de la función "join", que agrupa los carácteres.

In [48]:
#Definimos una cadena de texto
texto = 'Los resultados muestran un crecimiento del 3% durante el primer semestre de 2017.'
#Definimos una función mediante list comprehension
def excluir_vocales(x):
    return [x for x in texto if x not in 'aeiou']
#Aplicamos la función a la cadena de texto y la mostramos por pantalla
print (excluir_vocales(texto))
#Alternativa legible: aplicamos la función a la cadena de texto, la agrupamos mediante "join" y la mostramos por pantalla
print ("".join(excluir_vocales(texto)))


['L', 's', ' ', 'r', 's', 'l', 't', 'd', 's', ' ', 'm', 's', 't', 'r', 'n', ' ', 'n', ' ', 'c', 'r', 'c', 'm', 'n', 't', ' ', 'd', 'l', ' ', '3', '%', ' ', 'd', 'r', 'n', 't', ' ', 'l', ' ', 'p', 'r', 'm', 'r', ' ', 's', 'm', 's', 't', 'r', ' ', 'd', ' ', '2', '0', '1', '7', '.']
Ls rsltds mstrn n crcmnt dl 3% drnt l prmr smstr d 2017.


### Ejercicio 1

Escribid un programa que asigne dos valores enteros cualesquiera (escoged un número entero aleatorio) a dos variables con nombre a y b, calcule el producto de a por b y finalmente muestre el valor del cuadrado del producto de a por b.

#### Respuesta:

In [8]:
#Importamos la funcion random
import random
#Asignamos dos valores enteros aleatorio entre 0 y 100 a cada una de las variables a y b
a, b = random.randint(0,100), random.randint(0,100)
#Calculamos el producto de a por b
c = a*b
#Mostramos por pantalla el cuadrado de a por b
print (c**2)

### Ejercicio 2

Escribid un programa que defina una lista cuyos valores sean los nombres de los días de la semana. Haced que muestre el primer y el último día de la semana.

#### Respuesta:

In [1]:
#Creamos una lista cuyos elementos son strings de los dias de la semana
dias_semana = ['Lunes', 'Martes', 'Miercoles', 'Jueves', 'Viernes', 'Sabado', 'Domingo']
#Mostramos por pantalla el primer y ultimo elemento de la lista
print (dias_semana[0], dias_semana[-1])

### Ejercicio 3

Escribid un programa que calcule el área de un círculo de radio 3.

#### Respuesta:

In [4]:
#Importamos las librerias random y math
import random, math
#Definimos el radio del circulo como un valor entero aleatorio entre 0 y 100
radio = random.randint(1,100)
#Calculamos el area del circulo utilizando la constante pi de la libreria math
area_circulo = math.pi*radio**2
#Mostramos por pantalla el valor del area calculado
print (area_circulo)

9852.03456165759


### Ejercicio 4

Escribid un programa donde se defina un diccionario con algunos de los prefijos telefónicos de España. Por ejemplo: 93 para Barcelona, 91 para Madrid, etc.

#### Respuesta:

In [3]:
#Definimos un diccionario con pares clave-valor de ciudad y prefijo
prefijos = {'Barcelona': 93, 'Madrid': 91, 'A Coruña': 981, 'Alicante' : 96}
#Adicionalmente, mostramos por pantalla el valor asociado con la clave "Barcelona"
print ("prefijos['Barcelona']: ", prefijos['Barcelona'])

prefijos['Barcelona']:  93
