# Python para el análisis de datos -  UNAV 2020-2021
---

# Notebook 3: Tuplas, sets y diccionarios. Estructuras de control de flujo.

## Índice  <a name="indice"></a>

    
- [Tuplas](#tuplas)
- [Sets](#sets)
    - [Operadores y funciones integradas](#set_operadores)
    - [Sets: mutables y dinámicos](#set_mutables_dinamicos)
- [Diccionarios](#diccionarios)
    - [Operadores y funciones integradas](#dict_operadores)
- [Estructuras de control de flujo](#estructuras_control_flujo)
    - [*for*-loop](#for_loop)
    - [list comprehensions](#list_comprehensions)
    - [dict comprehensions](#dict_comprehensions)
    - [*while*](#while)

- [Introducción a Numpy](#numpy)
    - [Creación de Numpy arrays](#creacion_numpy)
    - [Indexación](#indexacion_numpy)
    - [Operaciones básicas](#operaciones_basicas_numpy)

- [Ejercicios](#ejercicios)

## Tuplas<a name="tuplas"></a> 
[Volver al índice](#indice)

Una tupla es muy similar a una lista salvo en dos aspectos: 
* Se utilizan paréntesis en vez de corchetes. 
* Las tuplas son objetos inmutables. 

Recordad que el valor de cualquier elemento que contiene una lista se puede modificar (son mutables). Una tupla en Python se define como una secuencia de valores separados por comas y delimitada por paréntesis, ( ):

<pre>my_tupla = (a, b, c)</pre>

In [None]:
a = (1, 2, 3)
b = (2, 3, 1)

print(a == b)

Una tupla puede contener cualquier tipo de valor u objeto.

In [None]:
a = (1.1, "2", 3)

print(a, type(a))

La operación de indexación y slicing no cambia respecto a las listas. Veamos los ejemplos de la semana pasada empleando tuplas:

In [None]:
autores = ("Kernighan", "Ritchie", "Thompson", "Stroustrup")
print(autores[0])  # accede al primer elemento de la lista
print(autores[3])  # accede al último elemento de la lista

In [None]:
print(autores[-1])
print(autores[-4])

In [None]:
numeros = (0, 1, 2, 3, 4, 5, 6)

print(type(numeros[2:5]))
print(numeros[2:5])
print(numeros[-5:-1])

Podemos crear tuplas anidades, es decir, tuplas de tuplas. Extraer valores de las mismas requiere la encadenación de indexaciones.

In [None]:
tp_anidada = (4, 5, ('1', 3), ((1, 334)))
tp_anidada[2][1]

Importante, las tuplas no se pueden modificar, son inmutables.

In [None]:
tp_anidada[0] = 2

Habréis notado que cuando ejecutamos una celda con varios objetos separados por coma, nos devuelve la presentación de los mismos entre paréntesis. El objeto que devuelve es una tupla.

In [None]:
"1", 2, 4  # devuelve una tupla

In [None]:
a, b, c, d = ("a", "b", "c", "d")
a, b, c, d

Una tupla se puede inicializar simplemente asignando varios valores entre paréntesis:

In [4]:
t = ()
t = (1,)
t = (1) -- esto no es una tupla
type(t)

tuple

In [None]:
t = (1, 2, 3)
type(t)

La única peculiaridad de las tuplas es que, a diferencia de listas, una tupla con un sólo elemento requiere una coma extra. Esto es necesario para diferenciar los paréntesis de tuplas de aquellos empleados en operaciones aritméticas.

In [None]:
t1 = (1)
t2 = (1,)
type(t1), type(t2)

Si las tuplas y listas son tan similares, ¿para qué usar tuplas?

* Si los elementos de una lista no se quieren modificar, una forma de prevenir errores es utilizar tuplas.

* Una tupla, al ser un objeto inmutable, se puede emplear como clave en diccionarios (veremos diccionarios en breve).

## Sets<a name="sets"></a> 
[Volver al índice](#indice)

Un set es una colección desordenada de valores únicos arbitrarios que se puede almacenar en una variable. Un set en Python se define como una secuencia de valores separados por comas y delimitada por llaves, { }:

<pre>my_set = {a, b, c}</pre>

Los sets:

* Son una colección de objetos desordenada.
* Continenen elementos únicos, los valores duplicados no se permiten.
* Sólo pueden contener elementos inmutables.

In [None]:
s = {1.1, "2", 3}

print(s, type(s))

Un set se puede crear a partir de un iterador, o de forma explícita empleando el constructor *set()*.

In [7]:
s1 = set([0, 1, 2, 3, 4, 5])
s2 = set((0, 1, 2, 3, 4, 5))

In [8]:
s3 = {0, 1, 2, 3, 4, 5}


{0, 1, 2, 3, 4, 5}

In [None]:
s1 == s2 == s3

Es importante diferenciar el tipo de set que se genera en ambos casos. Veamos un comportamiento que puede ser inesperado en el caso de pasar una cadena de caracteres.

In [None]:
cadena = "abracadabra"
lcadena = list(cadena)
scadena = set(cadena)

print(lcadena)
print(scadena)

In [12]:
s1 = {'abracadabra'}
print(s1)
s2 = set('abracadabra')
print(s2)

#s1 == s2, s1, s2

{'a', 'b', 'c', 'd', 'r'}

Vemos que al emplear llaves la cadena de caracteres se incluye como un único elemento en el *set*, mientras que el constructor itera sobre la cadena de caracteres, generando un *set* con los caracteres únicos de dicha cadena.

In [9]:
iter('abracadabra')

<str_iterator at 0x1b14c05ab50>

Podemos crear un *set* vacío utilizando el constructor *set()*. A diferencia de las listas o tuplas, no podemos crear un *set* vacío mediante llaves, ya que ese método está reservado a los diccionarios.

In [None]:
s = set()

if not s:
    print("set vacío")

Un set sólo puede contener elementos inmutables, por ejemplo, no puede contener listas, ya que son objetos mutables.

In [13]:
s = {'1', [1, 2, 3]}

TypeError: unhashable type: 'list'

El mensaje de error no especifica que sea debido a su mutabilidad, sino a no ser un objeto de tipo *hashable*. Un objeto de tipo *hashable* es aquel se puede pasar a una función *hash*. Una función *hash* mapea una entrada de datos a un valor alfanumérico o númerico (depende del algoritmo de *hashing*) de tamaño fijo que resumen la información.

In [None]:
hash([1, 2, 3])

In [None]:
hash("user_001"), hash(123187873478237489127349127349213742)

### Operadores y funciones integradas<a name="set_operadores"></a> 
[Volver al índice](#indice)

Al igual que para otras estructuras de datos, el operador **in** nos permite evaluar si un valor se encuentra en un set.

In [None]:
s = {1, 3, '004', 2}

In [None]:
1 in s

Otras funciones que ya hemos visto para listas y tuplas son también aplicables a *sets*:

In [None]:
len(s), min(s, key=str), max(s, key=int)

Hay varios operadores y métodos que realizan la misma operación con *sets*:

* "|" o *.union()*: devuelve un *set* con los valores de cualquier de los dos *sets*.
* "&" o *.intersection()*: devuelve un *set* con los elementos comunes en ambos *sets*.
* "-" o *.difference()*: devuelve un *set* substrayendo al primer *set* los elementos del segundo *set*.
* "^" o *.symmetric_difference()*: devuelve un *set* con los elementos no presentes en ambos *sets*.


Estos son las operaciones básicas en *set theory*: https://en.wikipedia.org/wiki/Set_(mathematics).

In [14]:
s1 = {'pyc', 'pyd', 'pyx'}
s2 = {'py', 'pyc', 'ipynb'}

Union: $s_1 \cup s_2$

In [15]:
s1 | s2

{'ipynb', 'py', 'pyc', 'pyd', 'pyx'}

In [16]:
s1.union(s2)  # s2 puede ser cualquier iterador, no sólo un objeto de tipo set.

{'ipynb', 'py', 'pyc', 'pyd', 'pyx'}

In [17]:
s1.union(['py', 'pyc', 'ipynb'])

{'ipynb', 'py', 'pyc', 'pyd', 'pyx'}

Intersección: $s_1 \cap s_2$

In [18]:
s1 & s2

{'pyc'}

In [19]:
s1.intersection(s2)

{'pyc'}

Diferencia: $s_1 \setminus s_2$

In [20]:
s1 - s2

{'pyd', 'pyx'}

In [None]:
s1.difference(s2)

Diferencia simétrica

In [21]:
s1 ^ s2

{'ipynb', 'py', 'pyd', 'pyx'}

In [None]:
s1.symmetric_difference(s2)

La lista completa de métodos implementados en la clase **set** se pueden consultar aquí: https://docs.python.org/3.8/library/stdtypes.html#set

### Sets: mutables y dinámicos<a name="set_mutables_dinamicos"></a> 
[Volver al índice](#indice)

Los *sets* son estructuras de datos mutables, pero como hemos comentado, debe contener elementos inmutables.

In [None]:
s1, s2

Podemos añadir nuevos elementos al *set* mediante el método *.add()*.

In [None]:
s1.add("txt")
s1

También podemos eliminar elementos del *set* empleando el método *.remove()*. Si el valor no está presente nos devolverá un error.

In [None]:
s1.remove('pyx')
s1

In [None]:
s1.remove('csv')

Para evitar el mensaje de error podemos utilizar en su lugar el método *.discard()*. El método no devolverá error si no existe el valor.

In [None]:
s1.discard('csv')
s1

Igual que otras estructuras, el método *.copy()* está disponible para realizar una copia de un *set*.

In [None]:
s3 = s1.copy()
s3

El método *.pop()* es similar al de las listas, pero no nos permite pasar el índice del elemento a eliminar. Sigue un esquema LIFO (last-in first-out).

In [None]:
s3.pop()
s3

In [None]:
s3.pop(0)

El método *.clear()* nos devuelve el *set* vacío.

In [None]:
s3.clear()
s3

Hay otros métodos disponibles para actualizar un *set* sin devolver una copia. Por ejemplo, el método *.update()*:

In [None]:
s1.update(s2)

In [None]:
s1

Otros métodos para actualizar un *set* son los siguientes:

* *.intersection_update()*: https://docs.python.org/3.8/library/stdtypes.html#frozenset.intersection_update
* *.difference_update()*: https://docs.python.org/3.8/library/stdtypes.html#frozenset.difference_update
* *.symmetric_difference_update()*: https://docs.python.org/3.8/library/stdtypes.html#frozenset.symmetric_difference_update

Por último, existe un tipo de *set* inmutable, llamado *frozenset*: https://docs.python.org/3/library/stdtypes.html#frozenset

## Diccionarios<a name="diccionarios"></a> 
[Volver al índice](#indice)

Los diccionarios en Python son un tipo de estructuras de datos que permiten guardar un conjunto no ordenado de pares clave-valor, siendo las claves únicas dentro de un mismo diccionario. Un diccionario en Python se define como una secuencia de pares clave-valor separados por comas y delimitada por corchetes, { }:

<pre>my_dict = {
    "clave_0": 0,
    "clave_1": 1,
    "clave_2": 2
}</pre>

Los diccionarios:

* No almacenan los pares en ningún order en particular. El orden de entrada no está garantizado.
* Pueden contener un objeto de cualquier tipo como valor, pero no como clave.
* Se puede acceder a sus elementos por indexación y clave.
* Pueden anidar otros diccionarios.
* Son dinámicos y mutables.


Primero vamos a ver varios modos de crear un diccionario:

Modo "estándar":

In [24]:
d1 = {
    'nombre' : 'Carlos',
    'edad' : 22,
    'cursos': ['Python','Finanzas'] 
}

print(d1)

{'nombre': 'Carlos', 'edad': 22, 'cursos': ['Python', 'Finanzas']}


Modo incremental:

---
&#x26a0;&#xfe0f; No confundir {} y *dict()* con *set()*. Recordad que los *sets* vacíos no se pueden definir usando llaves.

---

In [25]:
d2 = dict()
d2['nombre'] = 'Carlos'
d2['edad'] = 22
d2['cursos'] = ['Python', 'Finanzas']
print(d2)

{'nombre': 'Carlos', 'edad': 22, 'cursos': ['Python', 'Finanzas']}


Utilizando una lista de tuplas:

In [26]:
d3 = dict([('nombre', 'Carlos'), ('edad', 22), ('cursos', ['Python', 'Finanzas'])])
print(d3)

{'nombre': 'Carlos', 'edad': 22, 'cursos': ['Python', 'Finanzas']}


Utilizando una lista para claves y otra para valores. Función *zip()*: https://docs.python.org/3.3/library/functions.html#zip

In [27]:
claves = ['nombre', 'edad', 'cursos']
valores = ['Carlos', 22, ['Python', 'Finanzas']] 
d4 = dict(zip(claves, valores))
print(d4)

{'nombre': 'Carlos', 'edad': 22, 'cursos': ['Python', 'Finanzas']}


Modo *keywords*:

In [22]:
d5 = dict(
    nombre = 'Carlos',
    edad = 22,
    cursos = ['Python','Finanzas'] 
)

print(d5)

{'nombre': 'Carlos', 'edad': 22, 'cursos': ['Python', 'Finanzas']}


Un diccionario sólo con claves y todos los valores fijados a *None*.

In [31]:
d6 = dict.fromkeys(claves, None)
print(d6)

{'nombre': None, 'edad': None, 'cursos': None}


In [23]:
type(d1), type(d2), type(d3), type(d4), type(d5), type(d6)

NameError: name 'd1' is not defined

Una clave sólo puede aparecer en una ocasión:

In [33]:
d6 = {"a": 2, "a": 3}
d6

{'a': 3}

Sólo datos que son *hashable* se pueden utilizar como claves:

In [32]:
d7 = {[1, 2]: 3, 'a': 2}
d7

TypeError: unhashable type: 'list'

In [34]:
d8 = {(1, 2): 3, 'a': 2}
d8

{(1, 2): 3, 'a': 2}

Podemos acceder a los valores de un diccionario utilizando claves:

In [None]:
print(d1['nombre'])
print(d1['edad'])
print(d1['cursos'])

Si el valor correspondiente a una clave es de tipo lista, podemos acceder directamente a uno de sus elementos:

In [None]:
print(d1['cursos'][0])
print(d1['cursos'][1])

También es posible actualizar el valor correspondiente a una clave:

In [None]:
d1['edad'] = 25
d1

Parecido a listas, se pueden crear diccionarios anidados, por ejemplo:

In [37]:
d2 = {"k1": 1, "k2": {"k21": 21}}
print(d2)
d2["k2"]["k21"]

{'k1': 1, 'k2': {'k21': 21}}


21

Encadenamos la indexación con claves:

In [None]:
print(d2['k1'])
print(d2['k2']['k21'])

### Operadores y funciones integradas<a name="dict_operadores"></a> 
[Volver al índice](#indice)

Para los mostrar los operadores y funciones integradas en diccionarios, creamos un diccionario con diferentes lenguajes de programación y sus autores/creadores.

In [39]:
d_lenguajes = {
    "fortran": "John Backus",
    "lisp": "John McCarthy",
    "prolog": ["Colmerauer", "Roussel", "Kowalski"],
    "perl": "Larry Wall"
}

El operador **in** indica si el valor es una de las claves del diccionario.

In [40]:
"fortran" in d_lenguajes

True

In [41]:
"python" not in d_lenguajes

True

Quizá los tres métodos más empleados con diccionarios son:

* *.keys()*: devuelve un iterador con las claves del diccionario.
* *.values()*: devuelve un iterador con los valores del diccionario.
* *.items()*: devuelve un iterador con las tuplas clave-valor del diccionario.

In [43]:
print(d_lenguajes.keys())
list(d_lenguajes.keys())

dict_keys(['fortran', 'lisp', 'prolog', 'perl'])


['fortran', 'lisp', 'prolog', 'perl']

In [44]:
print(d_lenguajes.values())
list(d_lenguajes.values())

dict_values(['John Backus', 'John McCarthy', ['Colmerauer', 'Roussel', 'Kowalski'], 'Larry Wall'])


['John Backus',
 'John McCarthy',
 ['Colmerauer', 'Roussel', 'Kowalski'],
 'Larry Wall']

In [45]:
print(d_lenguajes.items())
list(d_lenguajes.items())

dict_items([('fortran', 'John Backus'), ('lisp', 'John McCarthy'), ('prolog', ['Colmerauer', 'Roussel', 'Kowalski']), ('perl', 'Larry Wall')])


[('fortran', 'John Backus'),
 ('lisp', 'John McCarthy'),
 ('prolog', ['Colmerauer', 'Roussel', 'Kowalski']),
 ('perl', 'Larry Wall')]

El método *.get()* devuelve el valor correspondiente a una clave. Si la clave no existe, devuelve *None*, pero hay la posibilidad de devolver un valor por defecto:

In [51]:
print(d_lenguajes["fortran"])
print(d_lenguajes.get("fortran"))
print(d_lenguajes.get("python"))
print(d_lenguajes["python"])  # como no existe pues falla (con get le metes un default)
print(d_lenguajes.get("python", -1))

John Backus
John Backus
None


KeyError: 'python'

Ésta es una opción interesante para evitar el error que surge cuando accedemos con una clave que no está presente en el diccionario.

In [52]:
d_lenguajes["python"]

KeyError: 'python'

Algo parecido ocurre con el método *.pop()*. A diferencia de otras estructuras de datos, requiere una clave como argumento.

In [55]:
autor = d_lenguajes.pop("fortran")
print(autor)

KeyError: 'fortran'

In [56]:
d_lenguajes

{'lisp': 'John McCarthy',
 'prolog': ['Colmerauer', 'Roussel', 'Kowalski'],
 'perl': 'Larry Wall'}

In [59]:
autor = d_lenguajes.pop("python")

KeyError: 'python'

In [60]:
autor = d_lenguajes.pop("python", None)
print(autor)

None


El método *.popitem()* es análogo al método *.pop()* aplicado a listas:

In [None]:
d_lenguajes.popitem()
d_lenguajes

Por último, el método *.update()* permite actualizar un diccionario con los pares clave-valor de otro diccionario.

In [None]:
d_lenguajes_2 = {"python": "Guido Van Rossum", "c++": "Bjarne Stroustrup"}

d_lenguajes_3 = d_lenguajes.copy()
d_lenguajes_3.update(d_lenguajes_2)

In [None]:
d_lenguajes_3

Otro método para mezclar diccionarios es el siguiente:

In [62]:
d1 = {"a": 0, "b": 1}
d2 = {"c": 2, "d": 3}
d3 = {"e": 4, "f": 5}

d4 = {**d1, **d2, **d3}
d4

{'a': 2, 'b': 1, 'd': 3, 'e': 4, 'f': 5}

## Estructuras de control de flujo<a name="estructuras_control_flujo"></a> 
[Volver al índice](#indice)

En clase anterior vimos las estructuras de control condicional. Esas estructuras no permitían crear ejecuciones de código no secuenciales. Ahora introduciremos estructuras de control de flujo, que nos permiten realizan operaciones de forma iterativa.

### *for*-loop <a name="for_loop"></a> 
[Volver al índice](#indice)

La implementación de *for* loop se basa en recorrer una secuencia o colección de valores iterable. Al igual que los *if-elif-else* es importante el uso adecuado de indentaciones:

<pre>
for <span style="color:blue">variable</span> in <span style="color:blue">iterable</span>:
    <span style="color:green">sentencia 1</span>
    <span style="color:green">sentencia 2</span>
    <span style="color:green">...</span>
    <span style="color:green">sentencia n</span>

<span style="color:blue">siguiente sentencia</span>
</pre>

Para saber si un objeto es iterable, podemos utilizar la función *iter()*:

In [None]:
iter("hola"), iter([1, 2, 3]), iter((1, 2, 3)), iter({1, 2, 3}), iter({1: 0, 2: 1, 3: 2})

In [None]:
iter(1)

Veamos un ejemplo con las ciudades del final de la clase anterior:

In [None]:
ciudades = ["Madrid", "Guadalajara", "Tafalla", "Navarra"]

for ciudad in ciudades:
    print(ciudad)

Como en la creación de *sets*, es importante diferenciar el comportamiento cuando iteramos sobre cadenas de caracteres:

In [None]:
for c in "navarra":
    print(c)

In [None]:
for c in ["navarra"]:
    print(c)

Es posible iterar sobre listas de tuplas especificando dos variables como iteradores:

In [None]:
for i, j in [('a', 0), ('b', 1), ('c', 2)]:
    print(i, j)

#### *range()*

La función *range()* genera un rango de valores numéricos dados un inicio, fin y paso:

In [None]:
range(10), type(range(10)), iter(range(10))

*range()* produce un objeto iterable que se puede convertir a tupla o lista, por ejemplo:

In [None]:
tuple(range(10))

In [None]:
list(range(10))

Para mostrar los primeros 10 números:

In [25]:
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


O los valores de -100 a 100 cada 10:

In [None]:
for i in range(-100, 100, 10):
    print(i)

También podemos utilizar los valores de *range()* como índices dada la longitud de una lista:

In [None]:
n = len(ciudades)

for i in range(n):
    print(f"{i}: {ciudades[i]}")

#### *enumerate()*

Para casos como el anterior, es más conveniente emplear la función *enumerate()*. Esta función genera un iterable con el índice y valor de cada elemento de la lista:

In [None]:
for id_ciudad, ciudad in enumerate(ciudades):
    print(f"{id_ciudad}: {ciudad}")

#### *for*-loop diccionarios

In [None]:
d_lenguajes = {
    "fortran": "John Backus",
    "lisp": "John McCarthy",
    "perl": "Larry Wall",
    "python": "Guido Van Rossum",
    "c++": "Bjarne Stroustrup"
}

Los diccionarios también son iterables. Cuando iteramos sobre un diccionario, a la variable se le asignan las claves del diccionario. Los siguientes dos *for*-loop son equivalentes:

In [None]:
for lenguaje in d_lenguajes:
    print(lenguaje)

In [None]:
for lenguaje in d_lenguajes.keys():
    print(lenguaje)

Para iterar sobre los valores de un diccionario podemos usar las claves o extraer los valores previamente:

In [None]:
for lenguaje in d_lenguajes:
    print(d_lenguajes[lenguaje])

In [None]:
for autor in d_lenguajes.values():
    print(autor)

Por último, si queremos iterar sobre el diccionario accediendo a los pares clave-valor, el método adecuado es el siguiente:

In [None]:
for lenguaje, autor in d_lenguajes.items():
    print(f"{lenguaje.title()} fue creado por {autor}.")

#### break y continue

Las sentencias **break** y **continue** nos permiten interrumpir el *loop*, por ejemplo:

**break** para el *loop* si se cumple la condición:

In [None]:
for i in range(10):
    if i == 5:
        break
    
    print(i)

**continue** salta a la siguiente iteración si se cumple la condición, sin ejecutar el bloque se sentencias posterior.

In [None]:
for i in range(10):
    if i == 5:
        continue
    
    print(i)

#### *for-else*

**else** se ejecutará al finalizar correctamente el *loop*. Si el *loop* se interrumpe prematuramente mediante **break**, el bloque de sentencia después de **else** no se ejecutará.

In [None]:
n = 10

for i in range(n):
    print(i)
else:
    print(f"Iterador range({n}) finalizado.")

### list comprehensions <a name="list_comprehensions"></a> 
[Volver al índice](#indice)

Empecemos con un ejemplo sencillo: dada una lista de caracteres creamos una nueva lista con aquellos caracteres que son numéricos:

In [None]:
lista_carac = ["a", "1", "4"]

new_cadena = []
for c in lista_carac:
    if c.isnumeric():
        new_cadena.append(c)
        
''.join(new_cadena)

Las *list comprehensions* son una forma elegante de generar expresiones compactas en una única línea.

In [None]:
"".join([c for c in lista_carac if c.isnumeric()])

*List comprehensions* pueden incluir condicionales. Nota que a diferencia del ejemplo anterior, el condicional se emplea para seleccionar un resultado, no para filtrar.

In [None]:
x_pows = []

for x in range(100):
    if x % 2 == 0:
        x_pows.append(x ** 2)
    else:
        x_pows.append(x ** 3)

x_pows[:10]

In [None]:
x_pows2 = [x ** 2 if x % 2 == 0 else x ** 3 for x in range(100)]
x_pows2[:10], x_pows == x_pows2

El siguiente ejemplo muestra como crear una *list comprehension* con un doble *for*-loop:

In [None]:
lista_anidada = [["a", "b"], ["c", "d"], ["e", "f"]]
lista_1_nivel = [y for x in lista_anidada for y in x]
lista_1_nivel

In [None]:
lista_1_nivel == sum(lista_anidada, [])

Veamos un ejemplo más elaborado:

In [None]:
from string import printable
import random

In [None]:
n = len(printable)
cadena = ""
for i in range(10000):
    cadena += printable[random.randint(0, n - 1)]

In [None]:
n = len(printable)
cadena = "".join([printable[random.randint(0, n - 1)] for i in range(10000)])

In [None]:
new_cadena = []
for c in cadena:
    if c.isnumeric():
        new_cadena.append(c)
        
cadena_numeric = ''.join(new_cadena)

In [None]:
cadena_numeric = "".join([c for c in cadena if c.isnumeric()])

En varias situaciones las *list comprehensions* son más rápidas que los *for*-loop, para evaluarlo utilizamos el comando del Notebook **timeit**:

In [None]:
%%timeit

n = int(1e6)
cuadrados = []
for i in range(n):
    cuadrados.append(i * i)

In [None]:
%timeit cuadrados_2 = [i * i for i in range(n)]

Python tiene varias funciones que nos permiten utilizar programación funcional. Algunas de ellas son *map()*, *filter()* y *reduce()*. El comportamiento de estas funciones se puede replicar utilizando *list comprehensions*, mostrando sus versatilidad.

---
&#x26a0;&#xfe0f; En esta sección usaremos expresiones **lambda**. Entraremos en más detalle en la próxima sesión.

---

#### *map()*

In [36]:
suma_cubo = sum(x ** 3 for x in range(int(1000)))
suma_cubo

249500250000

In [37]:
sum(map(lambda x: x ** 3, range(1000)))

249500250000

In [None]:
lenguajes = d_lenguajes.keys()

u_lenguajes = list(map(lambda lenguaje: lenguaje.upper(), lenguajes))
u_lenguajes_2 = [lenguaje.upper() for lenguaje in lenguajes]

In [None]:
u_lenguajes, u_lenguajes_2

In [38]:
lista_numerica = list(map(int, ["1", "2", "3"]))
lista_numerica, type(lista_numerica[0])

([1, 2, 3], int)

#### *filter()*

In [None]:
lista_par = [i for i in range(1000) if i % 2 == 0]
lista_par[:20]

In [None]:
lista_par2 = list(filter(lambda x: x % 2 == 0, range(10000)))
lista_par2[:20]

In [None]:
usuarios = ['Juan', 'Manuel', 'Mario', 'Aurelio']

for usuario_m in filter(lambda x: x.startswith("M"), usuarios):
    print(usuario_m)

#### *reduce()*

In [73]:
from functools import reduce

In [74]:
reduce(lambda x, y: str(x) + str(y), range(10))

'0123456789'

In [None]:
"".join(map(str, range(10)))

In [None]:
d1 = {"a": 0, "b": 1}
d2 = {"c": 2, "d": 3}
d3 = {"e": 4, "f": 5}
d4 = {"g": 6, "h": 7}

list_dicts = [d1, d2, d3, d4]

reduce(lambda x, y: {**x, **y}, list_dicts)
maptnin

### dict comprehensions <a name="dict_comprehensions"></a> 
[Volver al índice](#indice)

De forma similar a las *list comprehensions*, podemos crear diccionarios utilizando *dict comprehensions*. En el siguiente ejemplo tenemos una lista de usuarios y vamos a crear un diccionario con la fecha de alta, igual a la fecha de entrada en el sistema.

In [None]:
from datetime import datetime

usuarios = ['Juan', 'Manuel', 'Mario', 'Aurelio']

In [None]:
d_fecha_alta = {usuario: datetime.now().strftime("%m/%d/%Y, %H:%M:%S.%f") for usuario in usuarios}

In [None]:
d_fecha_alta

### *while* <a name="while"></a> 
[Volver al índice](#indice)

La sentencia **while** se usa para construir bucles indefinidos, es decir, a diferencia de *for*-loop, donde la dimension del iterable está determinada, la finalización de un bucle **while** está condiciona a los cambios que las sentencias apliquen a la condición de parada. Igual que las estructuras de control que hemos visto previamente, se requiere indentación. Por otro lado, las sentencias de control *break*, *continue* y *else* que vimos en *for*-loop son análogas para **while**.

<pre>
while <span style="color:blue">condición</span>:
    <span style="color:green">sentencia 1</span>
    <span style="color:green">sentencia 2</span>
    <span style="color:green">...</span>
    <span style="color:green">sentencia n</span>

<span style="color:blue">siguiente sentencia</span>
</pre>

In [None]:
i = 0

while i <= 3:
    print(i)
    i += 1
    
print("i:", i)

En este ejemplo, pedimos por pantalla un nombre. El bucle seguirá pidiendo un nombre hasta que pasemos 'quit'. La palabra 'quit' fue añadida a la lista de nombres, ¿puedes arreglarlo?

In [None]:
nombres = []
nombre = ''

# empieza bucle que termina al teclear 'quit'
while nombre != 'quit':
    nombre = input("Dame un nombre o introduce 'quit' para finalizar: ")  # preguntamos por nuevo nombre
    nombres.append(nombre)

print(nombres)

El **while** también se puede utilizar para recorrer una lista mientras haya elementos en ella. En el siguiente ejemplo vamos asignar una clave de usuario, primero al último usuario que entró en el sistema, y después al más reciente.

In [None]:
import random

usuarios = ['Juan', 'Manuel', 'Mario', 'Aurelio']
d_clave_usuario = {}

while usuarios:
    usuario = usuarios.pop()
    d_clave_usuario[usuario]= random.randint(0, int(1e5))
    
print(d_clave_usuario, usuarios)

In [None]:
usuarios = ['Juan', 'Manuel', 'Mario', 'Aurelio']
d_clave_usuario = {}

while usuarios:
    usuario = usuarios.pop(0)
    d_clave_usuario[usuario]= random.randint(0, int(1e5))
    
print(d_clave_usuario, usuarios)

## Introducción a NumPy <a name="numpy"></a> 
[Volver al índice](#indice)

NumPy es la librería por excelencia de Python para algebra lineal y computación científica. Esta librería open-source fue creada en 2005 y sigue en continuo desarrollo:

* https://github.com/numpy/numpy
* https://numpy.org/

Para que os hagáis una idea de su uso, a día de hoy (14/10/2020) **488160** repositorios de GitHub requieren NumPy.

In [138]:
import numpy as np

### Creación de numpy arrays<a name="creacion_numpy"></a> 
[Volver al índice](#indice)

Podemos inicializar arrays con una lista. Un array de 1 dimensión (1-D):

In [None]:
a = np.array([1, 2, 3])
print(a, type(a))

Un array tiene varias propiedades:
    
* .shape: devuelve una tupla (filas, columnas).
* .size: devuelve el número de elementos del array.
* .ndim: devuelve el número de dimensions del array.
* .dtype: devuelve el tipo de datos que contiene el array.

---
&#x26a0;&#xfe0f; A diferencia de la lista, un array sólo puede contener elementos de un mismo tipo.

---

In [None]:
a.shape, a.size, a.ndim, a.dtype

Para arrays 1-D, la indexación es igual a la de listas:

In [None]:
print(a[0], a[1], a[2])

Podemos reemplazar el contenido de un elemento de forma similar. ¿Por qué 3.11 se convierte a 3?

In [None]:
a[0] = 3.11
a

NumPy tiene soporte a arrays 2-D (matrices). También soporta más dimensiones (tensores), pero no los veremos aquí. Un array 2-D se puede crear a partir de una lista de anidada:

In [None]:
b = np.array([[1, 2, 4], [4, 5, 6], [7, 8, 9]])
b

In [None]:
b.shape, b.size, b.ndim, b.dtype

En 2-D la indexación no requiere "[][]", sino que se emplea una notación más cercana a las matemáticas: $A_{i,j}$, [fila, columna].

In [None]:
print(b[0, 1], b[2, 2])

Se pueden crear arrays 2-D a partir de la secuencia generada por *np.arange()* y después especificando el número de filas y columnas con el método *.reshape()*.

In [None]:
c = np.arange(10).reshape((2, 5))
c

Podemos crear un array empleando un iterador y especificando el tipo:

In [None]:
c = np.array(range(10), dtype=np.float).reshape((2, 5))
c

In [None]:
c = np.arange(10).reshape((5, 2)).astype(dtype=np.complex)
c

NumPy proporciona varias funciones para crear arrays:

* *np.zeros()*: devuelve array con todos los elementos 0.
* *np.ones()*: devuelve array con todos los elementos 1.
* *np.empty()*: devuelve array vacío.
* *np.full()*: devuelve array con todos los elementos igual al valor dado.
* *np.eye()*: devuelve una matriz cuadrada con 1 en la diagonal.
* *np.linspace()*: devuelve array 1-D con una secuencia de valores dado inicio, fin y paso.

In [None]:
np.zeros((4, 5))

In [None]:
np.ones((3))

In [None]:
np.empty((6, 3))

In [None]:
np.full((3, 3), np.nan)

In [None]:
np.eye(7)

In [None]:
np.linspace(0, 10, 4)

### Indexación<a name="indexacion_numpy"></a> 
[Volver al índice](#indice)

En NumPy hay varias formas de indexar un array:

In [None]:
A = np.arange(12).reshape((3, 4))
A

Para obtener las primeras 2 filas y las primeras 3 columnas:

In [None]:
A[:2, :3]

O las primera columna y la primera fila:

In [None]:
A[:, 0], A[0, :]

Para extraer las dos primera filas:

In [None]:
print(A[[1, 2]], "\n")
print(A[1:3, :])

NumPy permite aplicar máscaras booleanas:

In [None]:
b = np.arange(12)
mascara = b % 2 == 0
print(b[mascara], mascara)

In [None]:
A = A.astype(np.float)
A[2, 2] = np.nan
np.isnan(A)

También podemos indexar pasando una lista de índices:

In [None]:
c = np.array([1, 5, 7, 9, 6])
c[[0, 3, 2]]

### Operaciones básicas<a name="operaciones_basicas_numpy"></a> 
[Volver al índice](#indice)

Las operaciones aritméticas en NumPy se aplican a cada uno de los elementos del array. Podemos operar directamente entre arrays sin escribir nuestros propios loops.

In [None]:
a = np.array([1.2, 3.1, 22.1, -6.7, 3.64])
b = np.array([4.1, 6.5, -12, -6.1, 1.99])

print(a + b)
print(a - b)
print(a ** 2)
print(a / b)

In [None]:
a *= 3
a

Producto escalar usando *.dot()* o *dot()*.

In [None]:
print(np.dot(a, b))
print(a.dot(b))

Comparaciones elemento a elemento:

In [None]:
print(a < 0)
print(b >= 0)

U otras operaciones más complejas:

In [None]:
np.absolute(b)

In [None]:
np.exp(b * 1j)

El posible realizar un análisis descriptivo de un array usando los métodos *.min()*, *.max()*, *.sum()*, *.std()* y *.var()*:

In [None]:
print(a.min())
print(a.max())
print(a.sum())
print(a.std())
print(a.var())

In [None]:
np.median(a)

U obtener los valores únicos de un array:

In [None]:
a = np.random.randint(0, 10, 10000)

np.unique(a)

In [None]:
%timeit np.unique(a)
%timeit set(a)

Veamos ahora como realizar operaciones con matrices:

In [None]:
A = np.random.randn(100).reshape(20, 5)
b = np.random.randn(20)

In [None]:
A.shape, b.shape

Podemos transponer una matriz con la propiedad *.T* o usuando *np.transpose()*:

In [None]:
A.T.shape, np.transpose(A).shape

Producto escalar entre matriz y vector: $c = A^T b$

In [None]:
c = np.dot(A.T, b)
c

Suma de todas las columnas:

In [None]:
A

In [None]:
np.sum(A, axis=0)

In [None]:
np.array([A[:, i].sum() for i in range(A.shape[1])])

NumPy también da soporte a arrays de caracteres:

In [None]:
C = [["a", "b"], ["c", "d"], ["e", "f"]]
D = np.array(C)
D

In [None]:
D.ravel()

In [None]:
D.flatten()

## Ejercicios <a name="ejercicios"></a> 
[Volver al índice](#indice)

1 - Crea cuatro diccionarios y únelos en un único diccionario. Utiliza al menos dos métodos distintos para ello.

In [71]:
dic1 = {'a1':1}
dic2 = {'a2':2}
dic3 = {'a3':3}
dic4 = {'a4':4}

dict_final = {**dic1, **dic2, **dic3 ,**dic4}
dict_final

{'a1': 1, 'a2': 2, 'a3': 3, 'a4': 4}

2 - Dado un texto con varias palabras debes encriptar el mensaje de la siguiente manera:

* La primera letra de cada palabra debe sustituirse por su código ASCII.
* La segunda letra y la última de cada palabra debe intercambiarse.

Por ejemplo: <pre>"hola mundo" => "104alo 109ondu"</pre>

Pista: usa la función *ord()* para obtener el código ASCII.

In [82]:
texto = "hola mundo"
word = texto.split()

for char in word:
    print(ord(char[0]))


104
109


3 - Dada una lista con enteros y cadenas de caracteres, devuelve una nueva lista sin las cadenas de caracteres. Utiliza varios métodos para conseguirlo.

In [90]:
lista = [2,4,5,"der"]
lista_final = []


test = ([lista_final.append(i) for i in lista if str(i).isdigit()])
list(filter(lambda x: not isintance(x,str), lista_mixta))
print(lista_final)

for i in lista: 
    if str(i).isdigit():
        lista_final.append(i)
print(lista_final)
    

[2, 4, 5]
[2, 4, 5, 2, 4, 5]


4 - Cuenta el número de caracteres duplicados en una cadena de caracteres. Nota: no hay diferencias entre mayúsculas y minúsculas. Por ejemplo: <pre>"AbracadaBra" => 3</pre>

In [130]:
cadena = "AbracadaBra"
cadena = cadena.lower()

veces = 0
for char in cadena:

    if cadena.count(char)>1:
        veces += 1
        cadena = cadena.replace(char,"")

print(veces)

d = {}
for c in cadena:
    if c in d:
        d[c] += 1
    else:
        d[c] = 1

sum(v > 1 for v in d.values())      

3

5 - Dada una cadena de caracteres reemplaza cada palabra separada por espacio con la suma de sus posiciones en el alfabeto. Por ejemplo:

<pre>"abba" => 1 + 2 + 2 + 1 = 6</pre>

Devuelve la suma de todas las palabras.

In [137]:
%%time
import string

alfabeto = string.ascii_lowercase
cadena = "abba aaaaa"
#fin = ''
suma = 0
for char in cadena:
    for k,v in enumerate(alfabeto):
        if char in v:
            #fin = fin + str(k+1)
            suma += k+1
            
        
print(fin)
print(suma)

122111111
11
Wall time: 0 ns


6 - Dadas dos cadenas de caracteres, determina si son anagramas. Una palabra es anagrama de otra si contiene exactamente las mismas letras. Por ejemplo, "mora" y "roma".

In [16]:
c = "mora"
c1 = "roma"

def anagram(chain1, chain2):
    "Compare the two chains and return if they are anagrams"
   
    dict1 = {i: chain1.count(i) for i in chain1}
    dict2 = {i: chain2.count(i) for i in chain2}

        
    return dict1 == dict2

anagram("mora","roma")


#     for i in chain2:
#         dict2[i] = chain2.count(i)


True

7 - Escriba un programa que calcule el factorial de un número introducido por teclado. Comprueba que el número es entero. Recuerda: $n! = \prod_{i=1}^n i$.

Extra: si no es un número entero emplea la función gamma: $\Gamma(n + 1) = n!$. Puedes usar las librerías **math** o **numpy**.

In [48]:
from functools import reduce

def factorial(n):
    "Devuelve el factorial a partir de un número de input"
    
    return reduce(lambda x,y:x*y,range(1,n+1))

factorial(4)

range(1, 3)


2

8 - Implementa la función exponential usando su serie de Taylor: $e^x = \sum_{i=0}^{\infty} \frac{x^n}{n!}$ usando un **while** y para cuando el error relativo entre dos iteraciones sea menor que $1e-8$. Para evitar problemas de inestabilidad utiliza $x < 1$. ¿Cómo evitarías que el bucle **while** continuara indefinidamente si no se consigue reducir el error relativo?

In [None]:
"""Buscar"""




9 - Resuelve un sistema de ecuaciones usando NumPy. Recuerda que debemos obtener $x$ de $Ax = b$. Puedes generar la matriz $A$ y el vector $b$ de forma aleatoria, pero la dimensiones deben ser consistentes: $A \in \mathbb{R}^{m \times m}$ y $b \in \mathbb{R}^m$. También debes comprobar que el determinante de $A \neq 0$. Necesitarás las funciones en *np.linag*.

In [63]:
import numpy as np
a = np.array([[1,2], [3,4]]) 

if np.linalg.det(a):
    print("determinante distinto de 0")


A = np.matrix([[3,9,-10],[1,-6,4],[10,-2,8]])

#Se definen los valores de la matriz B
B = np.matrix([[24],[-4],[20]])


""" A = inv(A)*B"""
#Se calcula el valor de X con X=inv(A)*B
X = A**(-1)*B
print(X)

determinante distinto de 0
[[ 2.99029126]
 [ 0.40776699]
 [-1.13592233]]


In [None]:
import math
numero = input(" Escribe un número: ")
while numero.isdigit() == False:
    print("Introduce un valor numérico")
    numero = input(" Escribe un número: ")

num =int(numero)
math.factorial(num)