# 1. Python

## 1.1. Intro

Python es un lenguaje de programación interpretado de tipado dinámico cuya filosofía hace hincapié en una sintaxis que favorezca un código legible. Se trata de un lenguaje de programación multiparadigma y disponible en varias plataformas.

Características de Python:

- Propósito general: sirve para multitud de propósitos diferentes: desarrollo web, apps, data science...etc.

- Multiplataforma: se puede correr en culquier sistema operativo.

- Interpretado: no es necesario compilar (traducir a lenguaje máquina) el código antes de su ejecución. En verdad se realiza, pero es una tarea transparente para el desarrollador, es por lo tanto un lenguaje de alto nivel.

- Orientado a objetos: la programación orientada a objetos está soportada en Python y ofrece en muchos casos una manera sencilla de crear programas con componentes reutilizables.

- Tipado dinámico: Las variables se comprueban en tiempo de ejecución y no es necesario declarar su tipología antes de utilizarlas.

- Funciones y librerías: dispone de muchas funciones incorporadas en el propio lenguaje, para el tratamiento de strings, números, estructuras de datos...etc. Además, existen muchos módulos que podemos importar en los programas para tratar temas específicos donde se puede disponer de funciones y métodos adicionales.

- Sintaxis clara: destacar que Python tiene una sintaxis muy visual, gracias a una notación identada (con márgenes) de obligado cumplimiento. Esto ayuda a que todos los programadores adopten unas mismas notaciones y que los programas de cualquier persona tengan un aspecto muy similar.

¿Por qué Python en Data Science?

Python está en movimiento y en pleno desarrollo, pero ya es una realidad y una interesante opción para realizar todo tipo de programas que se ejecuten en cualquier máquina. El equipo de desarrolladores está trabajando de manera cada vez más organizada, y cuentan con el apoyo de una comunidad que está creciendo rápidamente.

Debido a esto y a que un lenguaje de código abierto, la comundad puede ir desarrollando librerías que permitan la apliación de Python en campos de conocimiento concretos. Dentro de la escena del tratamiento de datos existen numérosos módulos que permiten que Python sea competente en el ámbito del data science, si sumamos a esto la versatilidad del lenguaje y su curva de aprendizaje moderada, es una opción muy buena para inciarse en el mundo de la ciencia de datos.

## 1.2. Nociones básicas en Python

### 1.2.1. Objetos

Todo en Python es un objeto. Cada objeto tiene en Python un tipo asociado, datos internos, y unos atributos determinados en función de su tipo. Se puede ejecutar el comando `type()` para saber el tipo de objeto de cualquier elemento en Python.

También se puede utlizar la función `isinstance(object,(type_of_object)` para comprobar si un objeto pertenece a un tipo en particular. Ejemplo: `isinstance(a, (int, float))`.

**Escalares:**

- int: número entero
- long: número entero grande
- float: número decimal
- str: string (cadena de caracteres)
- bool: True (1) or False (0)
- None: valor "null" en Python

**Estructuras de datos:**

- lista: secuencia mutable unidimensional de objetos de Python. Se escribe entre corchetes `[]`.
- tupla: sucuencia inmutable unidimensional de objetos de Python. Se escribe entre paréntesis `()`.
- diccionario: colección de pares llave-valor, donde las llaves y valores son objetos de Python. Se escribe entre llaves `{}`.
- set: colección única (sin duplicados) de valores. Se escribe entre llaves `{}`.

In [5]:
## Definimos diferentes tipos de objetos
a = 7
b = "hola"
c = [1, 2, 3]
d = (1, 2, 3)
e = False
f = {"nombre": "Carlos", "altura": 182, "peso": 57}
g = {1, 2, 3, "hola"}

## Consultamos el tipo de objeto de cada uno
type(a), type(b), type(c), type(d), type(e), type(f), type(g)

(int, str, list, tuple, bool, dict, set)

### 1.2.2. Atributos y métodos

Los atributos pueden definirse como objetos de Python alojados en el interior de otro objeto; o métodos, que son funciones asociadas a un objeto que permite obtener información interna de ese objeto. Se puede acceder a los atributos de un objeto mediante la sintaxis `object_name.attribute_name`.

Cada tipo de objeto tiene unos atributos asociados diferentes, para saber cuales de ellos están disponibles en función del tipo de objeto, se pueden utilizar las siguientes funciones:

- `hasattr(object, attribute)`: consulta si el objeto tiene el atributo indicado, devuelve un valor booleano.
- `dir(object)`: devuelve una lista con todos los atributos y métodos vinculados a ese objeto.

In [11]:
## Definimos una variable tipo string y consultamos los atributos disponibles
a = "hola"
dir(a)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isascii',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
 'title',
 'translate',
 'upper',


### 1.2.3. Referenciar objetos

Al asignar (`=`) una variable en Python, lo que en verdad se está haciendo es crear una referencia al objeto en el lado derecho del signo igual. Al referenciar objetos, se aplican por igual los cambios realizados en la parte izquierda de la igualdad en la parte derecha.

In [6]:
## Creamos una lista a con 3 objetos, y referenciamos "b" a "a"
a = [1, 2, 3]
b = a
print(f"La lista a contiene los valores: {a}")
print(f"La lista b contiene los valores: {b}")

La lista a contiene los valores: [1, 2, 3]
La lista a contiene los valores: [1, 2, 3]


In [7]:
## Añadimos un objeto adicional a la lista "a"
a.append(4)

## Al estar "b" referenciada a "a" también habrá sido modificada
print(f"La lista a contiene los valores: {a}")
print(f"La lista b contiene los valores: {b}")

La lista a contiene los valores: [1, 2, 3, 4]
La lista b contiene los valores: [1, 2, 3, 4]


In [9]:
## Se puede realizar una comprobación adicional y ver que ambas variables apuntan a la mism posición de memoria
id(a), id(b)

(1838939602184, 1838939602184)

## 1.3. Estructuras de control de flujo

Una estructura de control, es un bloque de código que permite agrupar instrucciones de manera controlada en base a una serie de condiciones. En Python, como en el resto de los lenguajes de programación, tenemos varios modos de controlar el flujo del programa:

- `if`: ejecuta un bloque particular de comandos en función del resultado de un test.
- `while`: ejecuta un bloque de comandos mientras que se cumpla un test determinado.
- `for`: ejecuta un bloque de comandos un cierto número de veces.

Cuando se emplea estas estructuras, es obligatoria la identación, que no es otra cosa que realizar una sangría de 4 espacios en blanco o una tabulación. Esta identación facilita la lectura y escritura de código en Python. La mayoría de IDE's o editores de texto identifican cuando comienza un estructura de control de flujo e identan automaticamente las siguientes lineas.

### 1.3.1. Estructura de control condicional - If

Los condicionales nos permiten comprobar condiciones y hacer que nuestro programa se comporte de una forma u otra, y que ejecute un bloque de código particular dependiendo de esta condición.

Mediante los comandos `if`, `elif` y `else`, le indicamos a Python que queremos ejecutar una porción de código solo si se cumple una determinada condición, es decir, si el resultado del condicional es `True`.

In [22]:
## Control de flujo que indica si cruzar una calle en función del sem´foro:
semaforo = "verde"

if semaforo == "verde": 
    print("Cruzar la calle")
elif semaforo == "ambar":
    print("No cruces, está en ambar...")
else: 
    print("Espera verde")

Cruzar la calle


### 1.3.2. Estructura de control iterativa - While

El comando `while` permite ejecutar una porción de código de forma repetida hasta que la condición especificada sea `False`; o, dicho de otro modo, ejecuta una porción de código mientras que la condición sea verdadera.

In [1]:
a = 1

while a < 4:
    print("¡Hola, mundo!")
    a = a + 1

¡Hola, mundo!
¡Hola, mundo!
¡Hola, mundo!


Mediante los comandos `break` y `continue` podemos establecer condiciones de parada o continuidad dentro del bucle.

In [5]:
a = 1

while a < 10:
    print(a)
    if a == 4:
        break
    a = a + 1

1
2
3
4


### 1.3.3. Estructura de control iterativa - For

El bucle `for` permite iterar sobre una estructura de datos, del tipo lista o tupla, y realizar una acción sobre cada uno de los objetos de éstas.

In [3]:
seq = [1, 2, 3, 4, "Hola"]

for i in seq:
    print(i)

1
2
3
4
Hola


Mediante los comandos `break` y `continue` podemos establecer condiciones de parada o continuidad dentro del bucle.

In [7]:
sequence=[1, 2, None, 4, None, 6]
total = 0

for i in sequence:
    if i is None:
        continue
    total = total + i
    print(total)

1
3
7
13


Los bucles `for` permiten también correr el proceso con dos variables, o incluso realizar bucles dentro de otros bucles.

In [22]:
seq = [1, 2, 3, 4, "Hola"]

for i, j in enumerate(seq):
    print(i, j)

0 1
1 2
2 3
3 4
4 Hola


## 1.4. Funciones

Una función es un bloque de código, que recibe cero o más argumentos como entrada, sigue una secuencia de sentencias las cuales ejecutan una operación deseada, y devuelve un valor y/o realiza una tarea. Una vez definido este bloque, puede ser llamado cuando se necesite.

El uso de funciones es una componente muy importante en el paradigma de la programación estructurada, y tiene varias ventajas:

- Modularización: permite segmentar un programa complejo en una serie de partes o módulos más simples, facilitando así la programación y el depurado.
- Reutilización: permite encapsular una serie de tareas, y reutilizarlas en distintos programas o partes de un mismo script.

Python dispone de una serie de funciones integradas que son nativas del lenguaje, pero también permite crear funciones definidas por el usuario para ser usadas en su propios desarrollos.

### 1.4.1. Definir funciones

Para definir una función se emplea la siguiente sintaxis:

In [None]:
def function_name(param1, param2...):    # Se define el nombre de la función y se indican los paráemtros de entrada                         
    '''Description                       # Se describe el funcionamiento de la función
    '''
    actions                              # Se indica lo que debe hacer
    return                               # Devuelve el output

Las funciones pueden comunicarse con el exterior de las mismas usando la sentencia `return`. Si este parámetro no es indicado, el valor de salida de la función por defecto será `None`.

Se puede acceder a la información de una función mediante el comando `help(function)`. Como salida de este proceso se obtiene el descriptivo que haya indicado el desarrollador, o el propio Python, dentro de esa función.

### 1.4.2. Funciones lambda

Una función lambda o función anónima, como su nombre indica, es una función sin nombre. Esto significa que podemos ejecutar una función sin definirla mediante la sintaxis `def function_name():`.

La diferencia fundamental entre una función definida y una anónima, es que el contenido de una función lambda debe ser una única expresión en lugar de un bloque de acciones. Por tanto podríamos decir que, mientras las funciones anónimas lambda sirven para realizar funciones simples, las funciones definidas con def sirven para manejar tareas más extensas.

Las funciones anónimas tienen la siguiente sintaxis: `function_name = lambda var: expr`.

In [2]:
## Definir una función que devuelve el doble de un número
def double_num(num):
    return 2 * num

double_num(13)

26

In [3]:
## Definir una función anónima que devuelve el doble de un número
lambda_double_num = lambda num: 2 * num

lambda_double_num(13)

26

Estas funciones son muy útiles dentro del análisis de datos ya que existen métodos que pueden tomar como argumentos el resultado de una función, abriendo un abanico de posibilidades muy elevado. Adicionalmente, las funciones lambda en combinación con las funciones `filter()` y `map()`, permiten una variedad aún mayor.

**Función filter():**

Tal como su nombre indica, `filter()` significa filtrar, ya que a partir de una lista o iterador y una función condicional, es capaz de devolver una nueva colección con los elementos filtrados que cumplan esa condición dada `True`.

La sintaxis de esta función es: `filter(function, iterable)`.

In [6]:
def multiple(numero):    # Primero declaramos una función condicional
    if numero % 5 == 0:  # Comprobamos si un numero es múltiple de cinco
        return True      # Sólo devolvemos True si lo es

numeros = [2, 5, 10, 23, 50, 33]

filter(multiple, numeros)

<filter at 0x1ffef62af48>

In [9]:
list(filter(multiple, numeros))  # El resultado de filter() es un objeto tipo filtro, hay que convertirlo en una lista

[5, 10, 50]

In [10]:
list(filter(lambda numero: numero%5 == 0, numeros))  # La función "multiple" se puede sustituir por una lambda

[5, 10, 50]

**Función map():**

Esta función trabaja de una forma muy similar a `filter()`, con la diferencia de que en lugar de aplicar una condición a un elemento de una lista o secuencia que cumpla determinada condición, aplica una función sobre todos los elementos y como resultado se devuelve un iterable de tipo map.

La función `map()` se utiliza mucho junto a expresiones lambda ya que permite ahorrarnos el esfuerzo de crear bucles `for`.

La sintaxis de esta función es: `map(function, iterable)`.

In [11]:
def doblar(numero):
    return numero*2

numeros = [2, 5, 10, 23, 50, 33]

map(doblar, numeros)

<map at 0x1fff14a4448>

In [12]:
list(map(doblar, numeros))

[4, 10, 20, 46, 100, 66]

In [13]:
list(map(lambda x: x*2, numeros))

[4, 10, 20, 46, 100, 66]

### 1.4.3. Importar módulos

Un módulo es un fichero con extensión `.py` que contiene funciones y variables adicionales. Los módulos pueden ser creados por un desarrollador para mejorar y extender las funcionalidades de python, como por ejemplo un módulo con funciones matemáticas avanzadas.

Estos módulos permiten organizar el código, y hacerlo más modular y escalable.

La sintaxis para llamar a un módulo es: `import [module] as [alias]`, o `from [module] import [function] as [alias]`.

Dentro del ámbito del data science existen una serie de módulos que son de uso frecuente, y qué ademas se importan siempre bajo el mismo nombre, de modo que si otra persona leyera nuestro código supiera a que módulo pertenece cada función.

```python
import pandas as pd                # módulo data wrangling
import numpy as np                 # módulo arrays y álgebra lineal
import matplotlib.pyplot as plt    # módulo visualización
import seaborn as sns              # módulo visualización
```

Una buena práctica es extraer de cada módulo, solo aquellas funciones que vayan a utilizarse. De este modo quedan definidas al principio del script, y si se encontrara alguna función desconocida durante el código se puede analizar rápidamente si pertenece a uno de los módulo cargados, o no.

## 1.5. Escalares

Dentro de los objetos escalares podemos identificar:

- int: número entero
- long: número entero grande
- float: número decimal
- str: string (cadena de caracteres)
- bool: True (1) or False (0)
- None: valor "null" en Python

### 1.5.1. Numéricos

Son aquellos datos que hacen referencia exclusivamente a valores numéricos.

In [11]:
k = 12342
k, type(k)

(12342, int)

In [4]:
k = 3.141592
k, type(k)

(3.141592, float)

Con estos objetos se pueden llevar a cabo las operaciones matemáticas más clásicas como sumas, restas, multiplicaciones...etc. Para operaciones más avanzadas puede que sea necesario importar módulos específicos.

In [6]:
a = 3
b = 4
c = 5

print(a*b + (c-a)**b)

28


### 1.5.2. Strings

Los objetos de tipo string son aquellos que concatenan carácteres de tipo texto. Se introducen entre comillas simples o dobles. Un valor numérico se puede pasar como string si es entrecomillado.

Este tipo de objeto es inmutable, por lo que para modificarse debe ser alojado en una nueva variable.

In [6]:
a = 'this is a string'
type(a)

str

### 1.5.3. Booleanos

El tipo booleano sólo puede tener dos valores: `True` y `False`. Estos valores son especialmente importantes dentro de las estructuras de control de flujo.

En el contexto de las operaciones booleanas, y también cuando las expresiones son usadas bajo sentencias de flujo de control, los siguientes valores son interpretados como False:

- False
- None
- Número cero
- Cadena de caracteres vacia
- Contenedores, incluyendo cadenas de caracteres, tuplas, listas, diccionarios y conjuntos mutables e inmutables.

In [19]:
print(bool(0))
print(bool(0.))
print(bool(""))
print(bool([]))

False
False
False
False


## 1.6. Estructuras de datos

### 1.6.1. Listas

Es una secuencia de obejetos, unidimensional, de longitud variable, y mutable. Se escriben entre corchetes `[]`. También pueden ser creadas pasando una lista de objetos como argumentos del comando `list()`.

Ejemplo de lista:

In [25]:
stars = ['Alderaan', 'Arcturus', 'Vega']
type(stars)

list

A continuación se indican algunos de los métodos más comunes de las listas:

**Unpack:**

Esta estructura permite asignar valores a más de una variable.

In [63]:
lista = [1, 2, 3]
a, b, c = lista

b

2

**Swap variables:**

Esta estructura permite intercambiar el valor de dos variables de forma rápida y sencilla.

In [72]:
a = 1
b = 2
print(a, b)

1 2


In [73]:
[a, b] = [b, a]
a, b

(2, 1)

**Slicing:**

Las listas tienen un índice (base 0) que permite acceder a los diferentes elementos de la misma para leerlos, modificarlos o aplicar una determinada operación.

In [26]:
stars = ['Alderaan', 'Arcturus', 'Vega']
stars[0], stars[1], stars[2]

('Alderaan', 'Arcturus', 'Vega')

En ocasiones, las listas pueden estar formadas por listas adicionales, el índex funcionaría de forma similar solo que añadiendo más parámetros.

In [1]:
planets = [['mercury', 1], ['venus', 2], ['earth', 3]]
planets[-1][0], planets[-1][-1]

('earth', 3)

**Append:**

Mediante el método `.append(arguments)` se puede añadir a una lista existente objetos adicionales.

In [31]:
list_1 = [1, 2, 3]
object_1 = 4

list_1.append(object_1)
list_1

[1, 2, 3, 4]

In [35]:
list_1 = [1, 2, 3]
list_2 = [5, 6]

list_1.append(list_2)
list_1

[1, 2, 3, [5, 6]]

Si se quisiera adjuntar los objetos uno a uno, se puede recurrir a un bucle `for` y concatenar cada elemento de una lista con el comando `+`, o con el método `.extend()`.

**Remove:**

Mediante el método `.remove(arguments)` se puede eliminar un objeto de una lista. Existe una variante de este método que permite guardar de forma adicional el objeto eliminado, `.pop(arguments)`.

In [40]:
list_1 = [1, 2, 3, 4, 5, 6, 7, 'Hola']
object_1 = 'Hola'

list_1.remove(object_1)
list_1

[1, 2, 3, 4, 5, 6, 7]

In [43]:
list_1 = [1, 2, 3, 4, 5, 6, 7, 'Hola']
object_nth = 5

seis = list_1.pop(object_nth)
list_1, seis

([1, 2, 3, 4, 5, 7, 'Hola'], 6)

**Count:**

Mediante el método `.count()` se puede obtener el número de ocurrencias de un objeto en una lista.

In [45]:
actores = ['antonio banderas', 'penelope cruz', 'veronica echegui', 'antonio banderas']
actores.count('antonio banderas')

2

**Index:**

Mediante el método `.index()` se puede obtener la posición que ocupa un objeto dentro de una lista.

In [48]:
actores = ['antonio banderas', 'penelope cruz', 'veronica echegui', 'antonio banderas']
actores.index('penelope cruz')

1

**Extend:**

Mediante el método `.extend()` se pueden añadir elementos adicionales a una lista, es equivalente a concatenar `+`, solo que desde el punto de vista computacional es más eficiente.

In [52]:
actores = ['antonio banderas', 'penelope cruz', 'veronica echegui', 'antonio banderas']
actores.extend(['brays efe', 'belen cuesta'])
actores

['antonio banderas',
 'penelope cruz',
 'veronica echegui',
 'antonio banderas',
 'brays efe',
 'belen cuesta']

**Sort:**

Mediante el método `.sort()` se pueden ordenar los objetos de una lista.

In [55]:
actores = ['antonio banderas', 'penelope cruz', 'veronica echegui', 'antonio banderas']
actores.sort()
actores

['antonio banderas', 'antonio banderas', 'penelope cruz', 'veronica echegui']

El método `.sort()` tiene como argumento un parámetro denominado `key` que permite personalizar el criterio para ordenar una lista. El argumento `key` se puede combinar tanto con métodos propios de los tipos de objeto de python, como con funciones anónimas definidas por el usuario.

In [57]:
## Ordenr la lista de palabras alfabeticamente sin tener en cuenta las mayúsculas
pokemons = ['pikachu', 'charmander', 'Charizard', 'Ekans', 'ekans']
pokemons.sort(key = str.lower)
pokemons

['Charizard', 'charmander', 'Ekans', 'ekans', 'pikachu']

In [1]:
## Ordenar la lista de palabras por el número de "l's" que contiene cada elemento de la lista
palabras = ['small', 'hell', 'hello', 'man', 'foxes']
palabras.sort(key = lambda l_count: l_count.count('l'))
palabras

['man', 'foxes', 'small', 'hell', 'hello']

Ejercicios:

In [17]:
## Ordenar la lista de palabras por el número de "a's" que contiene cada iterable de forma descendente
stars = ['Alderaan', 'Arcturus', 'Vega', 'AAaaa', 'AAAAA']

stars.sort(key = lambda a_count: a_count.count('a'), reverse = True)
stars

['AAaaa', 'Alderaan', 'Vega', 'Arcturus', 'AAAAA']

In [19]:
## Ordenar la lista de palabras por el número de "a's" (not case sensitive) que contiene cada iterable de forma descendente
stars = ['Alderaan', 'Arcturus', 'Vega', 'AAaaa', 'AAAAA']

stars.sort(key = lambda a_count: a_count.lower().count('a'), reverse = True)
stars

['AAaaa', 'AAAAA', 'Alderaan', 'Arcturus', 'Vega']

**List comprehensions:**

La comprensión de listas, del inglés *list comprehensions*, es una funcionalidad que nos permite crear listas avanzadas en una misma línea de código. La filosofía que subyace detrás de este método es similar al de las funciones lambda.

La sintaxis de esta estructura de código es: `list = [action for object in iterable if condition]`.

In [28]:
## Crear una lista con el doble de los valores numéricos de otra lista si estos son pares
numbers = [1, 2, 3, 4, 5]

double_numbers = []
for number in numbers:
    if number % 2 == 0:
        double_numbers.append(number*2)
    
double_numbers

[4, 8]

In [31]:
## Crear una lista con el doble de los valores numéricos de otra lista si estos son pares, utilizando list comprehension
numbers = [1, 2, 3, 4, 5]

double_numbers = [number*2 for number in numbers if number % 2 == 0]

double_numbers

[4, 8]

Al igual que se puede realizar un for dentro de otro for, también se pueden anidar las *list comprehensions*.

### 1.6.2. Tuplas

Es una secuencia de obejetos, unidimensional, de longitud variable, e inmutable (los propios objetos si pueden ser mutables). Se escriben entre paréntesis `()`. También pueden ser creadas pasando una lista de objetos como argumentos del comando `tuple()`.

Ejemplo de tupla:

In [56]:
stars = ('Alderaan', 'Arcturus', 'Vega')
type(stars)

tuple

Mediante el comando `tuple()` se pueden crear tuplas siempre que se pase como argumento un objeto iterable. Existe una excepción con los diccionarios, los cuales son un conjunto de pares llave-valor; si se pasa un diccionario como argumento de esta función, python devuelve una tupla que contiene exclusivamente las llaves del diccionario.

In [75]:
diccionario = {'color_1': 'rojo', 'color_2': 'verde'}
tuple(diccionario)

('color_1', 'color_2')

Muchos de los métodos que se han explicado en el epígrafe aplican igual para las tuplas. Se debe tener en cuenta que las tuplas por su naturaleza no pueden ser modificadas, por lo que métodos como `.sort()` por ejemplo no tendrían sentido.

### 1.6.3. Diccionarios

Son junto a las listas, las colecciones más utilizadas y se basan en una estructura mapeada donde cada elemento de la colección se encuentra identificado con una clave única, por lo que no puede haber dos claves iguales. En otros lenguajes se conocen como arreglos asociativos.

Los diccionarios se definen igual que los conjuntos, utilizando llaves, pero también se pueden crear vacíos con ellas.

In [76]:
diccionario = {'rojo': 'red', 'verde': 'green', 'azul': 'blue'}
type(diccionario)

dict

Se puede acceder a los valores de un diccionario si conocemos su llave. Para ello se utiliza una estructura similar a la que se emplea en el slicing de listas y tuplas, solo que pasando como argumento la llave: `dict[key]`.

In [77]:
diccionario['rojo']

'red'

Los diccionarios son mutables, por lo que cualquier de los valores asociados a una de las claves puede ser modificado:

In [83]:
diccionario['rojo'] = 'rouge'
diccionario

{'rojo': 'rouge', 'azul': 'blue', 'verde': 'green', 'amarillo': 'yellow'}

Se puede crear un diccionario mediante el comando `dict()`, y pasando como argumento de la función cualquier conjunto de datos que tenga una estructura similar a un diccionario, es decir string-objeto.

- tupla de tuplas: `dict((('key1', 1), ('key2', 2)))`
- tupla de listas: `dict((['key1', 1], ['key2', 2]))`
- lista de lista: `dict([['key1', 1], ['key2', 2]])`
- lista de tuplas: `dict([('key1', 1), ('key2', 2)])`

A continuación se muestran algunas de las funciones y métodos más comunes en el tratamiento de diccionarios.

**Keys:**

Mediante el método `.keys()` se puede obtener una lista con los valores de las llaves.

In [4]:
dict1 = {'alumno': ['juan', 'juana'], 'asignatura': ['musica', 'lengua'], 'notas': [5, 6]}
list(dict1.keys())

['alumno', 'asignatura', 'notas']

**Values:**

Mediante el método `.values()` se puede obtener una lista de los valores para cada llave.

In [5]:
dict1 = {'alumno': ['juan', 'juana'], 'asignatura': ['musica', 'lengua'], 'notas': [5, 6]}
list(dict1.values())

[['juan', 'juana'], ['musica', 'lengua'], [5, 6]]

**Items:**

Mediante el método `.items()` se puede obtener una lista de tuplas con las claves y valores de un diccionario.

In [7]:
dict1 = {'alumno': ['juan', 'juana'], 'asignatura': ['musica', 'lengua'], 'notas': [5, 6]}
list(dict1.items())

[('alumno', ['juan', 'juana']),
 ('asignatura', ['musica', 'lengua']),
 ('notas', [5, 6])]

**Zip:**

Esta función combina dos iterables uno a uno y devuelve una tupla. La sintaxis es `zip(iter_1, iter_2)`.

In [82]:
colores_esp = ('rojo', 'azul', 'verde', 'amarillo')
colores_eng = ('red', 'blue', 'green', 'yellow')

diccionario = dict(zip(colores_esp, colores_eng))
diccionario

{'rojo': 'red', 'azul': 'blue', 'verde': 'green', 'amarillo': 'yellow'}

### 1.6.4. Sets

Son colecciones desordenadas de elementos únicos utilizados para hacer pruebas de pertenencia a grupos y eliminación de elementos duplicados. Se dice que son desordenados porque gestionan automáticamente la posición de sus elementos, en lugar de conservarlos en la posición que nosotros los añadimos.

Los sets se definen igual que los diccionarios, utilizando llaves. Para crearlos vacíos es necesario recurrir al comando `set()`.

In [17]:
set_prueba = {1, 3, 3, 5, 5, 99, 'Hola'}
type(set_prueba)

set

In [18]:
set_prueba

{1, 3, 5, 99, 'Hola'}

También se puede definir un set mediante el comando `set()` y pasando como argumento una lista.

In [21]:
set([1, 2, 5, 'hola otra vez'])

{1, 2, 5, 'hola otra vez'}

Algunos de los métodos más comunes de los conjuntos, son uniones, intersecciones...etc, que tienen similitud con las teorías de conjuntos del álgebra:

**Union - OR:**

Une un conjunto a otro y devuelve el resultado en un nuevo conjunto. La sintaxis es `set_1.union(set_2)`, un método alternativo es mediante el símbolo pipeline `|`, `set_1 | set_2`.

In [22]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

a.union(b)

{1, 2, 3, 4, 5, 6, 7, 8}

In [23]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

a | b

{1, 2, 3, 4, 5, 6, 7, 8}

**Intersection - AND:**

Devuelve un conjunto con los elementos comunes de dos conjuntos. La sintaxis es `set_1.intersection(set_2)`, un método alternativo es mediante el símbolo `&`, `set_1 & set_2`.

In [24]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

a.intersection(b)

{4, 5}

In [25]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

a & b

{4, 5}

**Difference:**

Devuelve un conjunto con los elementos no comunes del primero de los conjuntos. La sintaxis es `set_1.difference(set_2)`, un método alternativo es mediante el símbolo `-`, `set_1 - set_2`.

In [26]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

a.difference(b)

{1, 2, 3}

In [27]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

a - b

{1, 2, 3}

**Symmetric difference - XOR:**

Devuelve los elementos simétricamente diferentes entre dos conjuntos, es decir, todos los elementos que no concuerdan entre los dos conjuntos. La sintaxis es `set_1.symmetric_difference(set_2)`, un método alternativo es mediante el símbolo `^`, `set_1 ^ set_2`.

In [28]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

a.symmetric_difference(b)

{1, 2, 3, 6, 7, 8}

In [30]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

a ^ b

{1, 2, 3, 6, 7, 8}

**Issubset:**

Comprueba si el conjunto es subconjunto de otro conjunto, es decir, si sus ítems se encuentran todos dentro de otro. La sintaxis de este método es `set_1.issubset(set_2)`.

In [33]:
a = {1, 2, 3, 4, 5}
b = {3, 4, 5}

a.issubset(b)

False

In [34]:
a = {1, 2, 3, 4, 5}
b = {3, 4, 5}

b.issubset(a)

True

## 1.7. Programación orientada a objetos - POO

En Python todo es un objeto. Cuando creas una variable y le asignas un valor entero, ese valor es un objeto; una función es un objeto; las listas, tuplas, diccionarios, conjuntos...etc, son objetos; una cadena de caracteres es un objeto. Y así podría seguir indefinidamente.

Pero, ¿por qué es tan importante la programación orientada a objetos? Bien, este tipo de programación introduce un nuevo paradigma que nos permite encapsular y aislar datos y operaciones que se pueden realizar sobre dichos datos, reduciendo de forma considerable la cantidad de código, y definiendo funciones que sean autoexplicativas y faciliten la legibilidad del código.

Dentro de la POO de python, podemos encontrar dos elementos principales:

- Clases
- Objetos

Podéis imaginaros los objetos como un nuevo tipo de dato cuya definición viene dada en una estructura llamada clase.

Suelo hacer una metáfora y comparar las clases con moldes de galletas y los objetos con las galletas en sí mismas. Si bien todas las galletas que se hacen con el mismo molde tienen la misma forma, cada una adquiere atributos individuales después del horneado. Atributos como el color, la textura, o el sabor, pueden llegar a ser muy distintas.

En otras palabras, las galletas comparten un proceso de fabricación y unos atributos, pero son independientes entre ellas y del propio molde, y eso hace que cada una sea única. Extrapolando el ejemplo, una clase es sólo un guión sobre como deben ser los objetos que se crearán con ella.

### 1.7.1. Clases y objetos

Para crear una clase se utiliza la palabra reservada de python `class`. Una buena práctica a la hora de definir una clase, es poner la primera letra en mayúscula.

In [1]:
# Definir una clase
class Galleta:
    pass

Esta es una definición muy simple de lo que es una galleta, ya que con `pass` la dejo vacía. Luego añadiremos más información, pero por ahora veamos como crear galletas con este molde.

Es importante tener claro que los objetos existen sólo durante la ejecución del programa y se almacenan en la memoria del sistema operativo. Es decir, mientras las clases están ahí en el código haciendo su papel de instrucciones, los objetos no existen hasta que el programa se ejecuta y se crean en la memoria.

Este proceso de crear los objetos en la memoria se denomina instanciación y para realizarlo es tan fácil como llamar a la clase como si fuera una función:

In [9]:
# Definir un objeto de una clase
una_galleta = Galleta()
otra_galleta = Galleta()

Demostrar que las galletas existen como entes independientes dentro de la memoria, es tan sencillo como imprimirlas por pantalla:

In [4]:
print(una_galleta)
print(otra_galleta)

<__main__.Galleta object at 0x000001EE6ABCBEE0>
<__main__.Galleta object at 0x000001EE6ABCBFA0>


Cada instancia tiene su propia referencia, demostrando que están en lugares distintos de la memoria. En cambio la clase no tiene una referencia porque es sólo un guión de instrucciones:

In [5]:
print(Galleta)

<class '__main__.Galleta'>


Es posible consultar la clase de un objeto con la función type(), pero también se puede consultar a través de su atributo especial class:

In [6]:
print(Galleta)
print(type(una_galleta))
print(una_galleta.__class__)

<class '__main__.Galleta'>
<class '__main__.Galleta'>
<class '__main__.Galleta'>


A su vez las clases tienen un atributo especial name que nos devuelve su nombre en forma de cadena sin adornos:

In [7]:
print(Galleta.__name__)
print(type(una_galleta).__name__)
print(una_galleta.__class__.__name__)

Galleta
Galleta
Galleta


Resumiendo, los objetos son instancias de una clase.

### 1.7.2. Atributos y métodos

Si hay algo que ilustre el potencial de la POO esa es la capacidad de definir variables y funciones dentro de las clases, aunque aquí se conocen como atributos y métodos respectivamente.

- Atributos: variables internas dentro de la clae
- Métodos: funciones internas dentro de la clase

**Atributos**

Dado que Python es muy flexible los atributos pueden manejarse de distintas formas, por ejemplo se pueden crear dinámicamente (al vuelo) en los objetos:

In [6]:
# Crear el atributo sabor par la clase Galleta
class Galleta:
    pass

galleta = Galleta()
galleta.sabor = "salado"

Aunque la flexibilidad de los atributos dinámicos puede llegar a ser muy útil, tener que definir los atributos de esa forma es tedioso. Es más práctico definir unos atributos básicos en la clase. De esa manera todas las galletas podrían tener unos atributos por defecto:

In [7]:
class Galleta:
    chocolate = False
    
galleta = Galleta()
galleta.chocolate

False

Luego podemos cambiar su valor en cualquier momento.

Por lo menos de esta forma nos aseguraremos de que el atributo chocolate existe en todas las galletas desde el principio. Además es posible consultar el valor por defecto que deben tener las galletas haciendo referencia al atributo en la definición de la clase.

Lo curioso es que si cambiamos ese atributo de clase (que no de objeto) a True, las siguientes galletas se crearán con chocolate, es decir, habremos modificado las instrucciones de creación de los objetos.

**Métodos:**

Si por un lado tenemos las variables de las clases, por otro tenemos sus funciones, que evidentemente nos permiten definir funcionalidades para llamarlas desde las instancias.

Definir un método es bastante simple, sólo tenemos que añadirlo en la clase y luego llamarlo desde el objeto con los paréntesis, como si de una función se tratase:

In [8]:
class Galleta:
    chocolate = False

    def saludar():
        print("Hola, soy una galleta muy sabrosa")

galleta = Galleta()
galleta.saludar()

TypeError: saludar() takes 0 positional arguments but 1 was given

Sin embargo, al intentar ejecutar el código anterior desde una galleta veréis que no funciona. Nos indica que el método saludar() requiere 0 argumentos pero se está pasando uno.

Lo que tenemos aquí, es la diferencia fundamental entre métodos de clase y métodos de instancia. Probamos a ejecutar el método llamando a la clase en lugar del objeto:

In [9]:
class Galleta:
    chocolate = False

    def saludar():
        print("Hola, soy una galleta muy sabrosa")

Galleta.saludar()

Hola, soy una galleta muy sabrosa


Los objetos tienen una característica muy importante: son conscientes de que existen. Cuando se ejecuta un método desde un objeto (que no desde una clase), se envía un primer argumento implícito que hace referencia al propio objeto. Si lo definimos en nuestro método podremos capturarlo y ver qué es:

In [10]:
class Galleta:
    chocolate = False

    def saludar(soy_el_propio_objeto):
        print("Hola, soy una galleta muy sabrosa")
        print(soy_el_propio_objeto)

galleta = Galleta()
galleta.saludar()

Hola, soy una galleta muy sabrosa
<__main__.Galleta object at 0x0000016E1B25E070>


Podemos acceder al propio objeto desde el interior de sus métodos. Lo único que como este argumento hace referencia al objeto en sí mismo por convención se le llama `self`.

Poder acceder al propio objeto desde un método es muy útil, ya que nos permite acceder a sus atributos. Fijaros, el siguiente código no funcionaría como esperamos:

In [11]:
class Galleta:
    chocolate = False

    def chocolatear(self):
        chocolate = True

galleta = Galleta()
galleta.chocolatear()
print(galleta.chocolate)

False


En cambio, si hacemos ver que `self` es el propio objeto:

In [12]:
class Galleta:
    chocolate = False

    def chocolatear(self):
        self.chocolate = True

galleta = Galleta()
galleta.chocolatear()
print(galleta.chocolate)

True


Como se explicaba antes de que las instancias tienen que saber quienes son porque sino no pueden acceder sus atributos internos, y por eso tienen que enviarse asimismas a los métodos.

Sea como sea con este ejemplo podemos entender que por defecto el valor de un atributo se busca en la clase, pero para modificarlo en la instancia es necesario hacer referencia al objeto.

**Métodos especiales:**

Ahora que sabemos crear métodos y hemos aprendido para qué sirve el argumento `self`, es momento de introducir algunos métodos especiales de las clases.

Se llaman especiales porque la mayoría ya existen de forma oculta y sirven para tareas específicas.

- Constructor `__init__`: el constructor es un método que se llama automáticamente al crear un objeto. La finalidad del constructor es, como su nombre indica, construir los objetos. Por esa razón permite sobreescribir el método que crea los objetos, permitiéndonos enviar datos desde el principio para construirlo.



In [14]:
class Galleta:
    chocolate = False

    def __init__(self, sabor = None, color = None):
        self.sabor = sabor
        self.color = color
        print(f"Se acaba de crear una galleta {self.color} y {self.sabor}.")

galleta_1 = Galleta("marrón", "amarga")
galleta_2 = Galleta("blanca", "dulce")

Se acaba de crear una galleta amarga y marrón.
Se acaba de crear una galleta dulce y blanca.


Como los métodos se comportan como funciones tienen sus mismas características, permitiéndonos definir valores nulos, valores por posición y nombre, argumentos indeterminadas, etc.

- Destructor `__del__`: existe un destructor que se llame al eliminar el objeto para que encargue de las tareas de limpieza como vaciar la memoria. Ese es el papel del método especial `__del__`. Es muy raro sobreescribir este método porque se maneja automáticamente, pero es interesante saber que existe. Todos los objetos se borran automáticamente de la memoria al finalizar el programa, aunque también podemos eliminarlos automáticamente pasándolos a la función `del()`.

In [16]:
class Galleta:

    def __del__(self):
        print("La galleta se está borrando de la memoria")

galleta = Galleta()

del(galleta)

La galleta se está borrando de la memoria


En este punto vale comentar algo respecto a los métodos especiales como éste, y es que pese a que tienen accesores en forma de función para facilitar su llamada, es totalmente posible ejecutarlos directamente como si fueran métodos normales `object.__del__()`.

- String `__str__`: el método `__str__` es el que devuelve la representación de un objeto en forma de cadena. Un momento en que se llama automáticamente es cuando imprimirmos una variable por pantalla. Por defecto los objetos imprimen su clase y una dirección de memoria, pero eso puede cambiarse sobreescribiendo el comportamiento:

In [17]:
class Galleta:

    def __init__(self, sabor, color):
        self.sabor = sabor
        self.color = color

    def __str__(self):
        return f"Soy una galleta {self.color} y {self.sabor}."

galleta = Galleta("dulce", "blanca")

print(galleta)
print(str(galleta))
print(galleta.__str__())

Soy una galleta blanca y dulce.
Soy una galleta blanca y dulce.
Soy una galleta blanca y dulce.


Hay que tener en cuenta que este método debe devolver la cadena en lugar de mostrar algo por pantalla, ese es el funcionamiento que se espera de él.

- Length `__len__`: otro método especial interesante es el que devuelve la longitud. Normalmente está ligado a colecciones, pero nada impide definirlo en una clase. Y sí, digo definirlo y no redefinirlo porque por defecto no existe en los objetos aunque sea el que se ejecuta al pasarlos a la función len().

In [19]:
class Cancion:

    def __init__(self, autor, titulo, duracion):  # en segundos
        self.duracion = duracion

    def __len__(self):
        return self.duracion

cancion = Cancion("Queen", "Don't Stop Me Now", 210)

print(len(cancion))
print(cancion.__len__())

210
210


### 1.7.3. Objetos dentro de objetos:

Hasta ahora no lo hemos comentado, pero al ser las clases un nuevo tipo de dato resulta más que obvio que se pueden poner en colecciones e incluso utilizarlos dentro de otras clases.

Os voy a dejar un pequeño código de ejemplo sobre un catálogo de películas para que lo estudiéis detenidamente:

In [26]:
# Se define la clase Película
class Pelicula:

    # Constructor de clase
    def __init__(self, titulo, duracion, lanzamiento):
        self.titulo = titulo
        self.duracion = duracion
        self.lanzamiento = lanzamiento
        print(f'Se ha creado la película {self.titulo}')

    def __str__(self):
        return f'{self.titulo} ({self.lanzamiento})'

In [27]:
# Se define la clase Catálogo, hecha de clases Película
class Catalogo:

    peliculas = []  # Esta lista contendrá objetos de la clase Pelicula

    def __init__(self, peliculas=[]):
        self.peliculas = peliculas

    def agregar(self, p):  # p será un objeto Pelicula
        self.peliculas.append(p)

    def mostrar(self):
        for p in self.peliculas:
            print(p)  # Print toma por defecto str(p)

In [28]:
p1 = Pelicula("El Padrino", 175, 1972)
c = Catalogo([p1])  # Añado una lista con una película desde el principio
c.mostrar()

Se ha creado la película El Padrino
El Padrino (1972)


In [29]:
p2 = Pelicula("El Padrino: Parte 2", 202, 1974)
c.agregar(p2)  # Añadimos otra
c.mostrar()

Se ha creado la película El Padrino: Parte 2
El Padrino (1972)
El Padrino: Parte 2 (1974)


# 2. Shell con Python y magic functions

Desde jupyter también se pueden ejecutar comandos en la shell. La forma de realizar esto depende del sistema operativo:

- `!`: Linux y MacOS
- `!wsl`: Windows Subsystem for Linux

Es importante tener en cuenta que la shell donde se ejecutan estos comandos es descartada automáticamente una vez se muestra la salida. Debido a esto, comandos como `cd` no tienen efecto cuando se ejecutan con el símbolo `!` delante.

Para solventar algunos de estos inconvenientes, se puede recurrir a los magic commands:

- `%`: magic line
- `%%`: magic cell

Las magic functions son comandos propios del intérprete de Python (IPython) que permiten controlar el comportamiento del intérprete en sí, además de algunas características de tipo sistema.

Dado que no son comandos de Python, si se ejecutan en cualquier otro intérprete que no sea este mostrará *SyntaxError*. Cuando se indica con una exclamación `!` que un comando de shell va a ser introducido, en verdad se está haciendo referencia a la magic cell `%%!`.

Con la función `%lsmagic` se pueden listar todas las funciones mágicas disponibles. Con `%magic` se puede obtener información general sobre qué son las funciones mágicas.

In [41]:
!wsl pwd

/mnt/c/Users/Guillermo/Desktop/Developer/github_repositories/kschool_ds_master


In [71]:
%%bash
pwd

/mnt/c/Users/Guillermo/Desktop/Developer


Se le puede asignar a variables de Python, los outputs de los comandos ejecutados en la shell.

In [2]:
%%bash
ls -l

total 180
-rwxrwxrwx 1 gmachin gmachin   1180 Oct  5 23:19 README.md
-rwxrwxrwx 1 gmachin gmachin 144604 Oct  1 12:19 _01_shell_git.ipynb
-rwxrwxrwx 1 gmachin gmachin  31019 Oct  6 11:47 _02_python_algebra_estadistica.ipynb
drwxrwxrwx 1 gmachin gmachin   4096 Sep 29 13:43 _data_open_travel_data
drwxrwxrwx 1 gmachin gmachin   4096 Sep 29 17:43 _images


In [8]:
fichero_readme = ! cat README.md
type(fichero_readme)

IPython.utils.text.SList

Los output en python pueden tener los siguientes atributos especiales que permiten modificar la forma de mostrar información almacenada en la variable:

- .l (o .list) : lista
- .n (o .nlstr): newline-separated string
- .s (o .spstr): space-separated string

In [4]:
# Por ejemplo con la función %%timeit puede obtener una estimación del tiempo que tarda en ejecutarse una celda:

%%timeit

suma = 0
for i in range(100):
    suma += i
    
suma

6.45 µs ± 964 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


# 3. Ficheros con Python

En la mayoría de casos cuando se requiere cargar un fichero en Python desde una herramienta externa, se pueden utilizar herramientas de alto nivel como `pd.read_csv()`. Este tipo de herramientas permite pasar de forma sencilla de un fichero plano de texto, a uno con formato etructurado de datos tipo tabla.

Sin embargo, es necesario conocer herramientas adcionales como el comando `open(path, [opt])` de Python.

In [11]:
## Descargar mediante la shell el contenido de la url dada a un fichero .txt
!wsl curl -s http://www.gutenberg.org/files/76/76-0.txt > Adventures.txt
!wsl head Adventures.txt

ï»¿
The Project Gutenberg EBook of Adventures of Huckleberry Finn, Complete
by Mark Twain (Samuel Clemens)

This eBook is for the use of anyone anywhere at no cost and with almost
no restrictions whatsoever. You may copy it, give it away or re-use
it under the terms of the Project Gutenberg License included with this
eBook or online at www.gutenberg.net

Title: Adventures of Huckleberry Finn, Complete


In [17]:
## Guardar en una variable el contenido del fichero
file = open('Adventures.txt', mode='r')
file

<_io.TextIOWrapper name='Adventures.txt' mode='r' encoding='cp1252'>

In [18]:
type(file)

_io.TextIOWrapper

# 4. Ejercicios

## 4.1. Funciones y escalares

In [23]:
## 1. Escribe una función que indicando el nombre y el año de nacimiento de una persona, indique en qué año cunplirá 100 años. La función debe preever que el año de nacimiento pueda ser numérico o string.

def centenario(name, birth):
    if isinstance(birth, int):
        print(f"{name} will reach 100 years in {birth+100}")
    else:
        print(f"{name} will reach 100 years in {int(birth)+100}")
        

centenario("Guille", "1993")

Guille will reach 100 years in 2093


In [26]:
## 2. Define una función que contabilice la longitud de un texto, el número de palabras, y el número de lineas.

def word_count(string1):
    longitud = len(string1)
    palabras = len(string1.split(" "))
    lineas = len(string1.split("\n"))
    print(f"La longitud es {longitud}")
    print(f"El número de palabras es {palabras}")
    print(f"El número de lineas es {lineas}")

word_count("Vaya vaya,\n que tenemos aquí")

La longitud es 28
El número de palabras es 5
El número de lineas es 2


In [28]:
## 3. Escribe una función para eliminar el n-ésimo carácter de un string. Si el string estuviera vacío, indicarlo.

def remove_nth(word, n):
    if word == "":
        print("El string se encuentra en blanco.")
    else:
        first_part = word[:n]
        last_part = word[n+1:]
    return first_part + last_part

remove_nth('Python', 4)

'Pythn'

## 4.2. Listas

In [44]:
## 1. Obtener el cuadrado de cada elemento de una lista del 1 al 8, utilizando lambda functiones

list(map(lambda num: num**2, range(1, 9)))

[1, 4, 9, 16, 25, 36, 49, 64]

In [47]:
## 2. Obtener el cuadrado de cada elemento de una lista del 1 al 8, utilizando list comprehensions

[num**2 for num in range(1, 9)]

[1, 4, 9, 16, 25, 36, 49, 64]

In [37]:
## 3. Para una lista de nombres, devolver un lista nueva con todas las consonantes como minúsculas, y todas las vocales como mayúsculas.

names = ['Juan', 'Juanita', 'Juana de Arco', 'Juanjo', 'Joseja', 'Jorgeja']

def transform_letter(word):
    new_word = ""
    for letter in word:
        if letter in 'aeiouAEIOU':
            new_word += letter.upper()
        else:
            new_word += letter.lower()
    return new_word

list(map(transform_letter, names))

['jUAn', 'jUAnItA', 'jUAnA dE ArcO', 'jUAnjO', 'jOsEjA', 'jOrgEjA']

In [51]:
## 4. Crear una función que devuelve un string al revés

def new_order(word):
    return word[::-1]

new_order('ysae saw siht')

'this was easy'

In [55]:
## 5. Escribe una función que dada una lista de palabras, de la longitud de la más larga

def max_length(words_list):
    return max([len(word) for word in words_list])

lista = ['uno', 'dos', 'tres', 'siete', 'muchas letras aquí']

max_length(lista)

18

In [1]:
## 6. Dada una lista de int y un target, devolver el índice de aquellos 2 números cuya suma sea igual al target

def two_sum(nums, target):
    for i, x in enumerate(nums):
        for j, y in enumerate(nums):
            if i != j and x + y == target:
                return [i, j]

## 4.3. Diccionarios

In [9]:
## 1. Escribe una función que para una lista de número de vuelva el mínimo, el máximo, y la media

def stats(list_num):
    return {'min': min(list_num), 'max': max(list_num), 'avg': sum(list_num)/len(list_num)}

numbers = [1, 2, 3, 5, 8, 13, 21]
stats(numbers)

{'min': 1, 'max': 21, 'avg': 7.571428571428571}

In [11]:
## 2. En la función anterior, añadir el primer número, el último, y el número de elemetos de la lista

def stats_2(list_num):
    return {'min': min(list_num), 'max': max(list_num), 'avg': sum(list_num)/len(list_num), 'first': list_num[0],
            'last': list_num[-1], 'length': len(list_num)}

numbers = [1, 2, 3, 5, 8, 13, 21]
stats_2(numbers)

{'min': 1,
 'max': 21,
 'avg': 7.571428571428571,
 'first': 1,
 'last': 21,
 'length': 7}

In [3]:
## 3. Dentro de una cadena de ADN, cambiar cada elemento por su complementario

dict_dna = {'A':'T','T':'A','C':'G','G':'C'}  ## Se indica cada complementario en un diccionario

def DNA_strand(dna):
    return ''.join([dict_dna[letter] for letter in dna])

DNA_strand('AATGCGA')

'TTACGCT'

## 4.4. Programación Orientada a Objetos - POO

**Ejercicio 1:**
    
- Crea una clase llamada Rectangulo con dos puntos (inicial y final) que formarán la diagonal del rectángulo. Crea para ello también la clase Punto con dos coordenadas x e y.

- Añade un método constructor para crear ambos puntos fácilmente, si no se envían se crearán dos puntos en el origen por defecto.

- Añade al rectángulo un método llamado base que muestre la base.

- Añade al rectángulo un método llamado altura que muestre la altura.

- Añade al rectángulo un método llamado area que muestre el area.

In [33]:
# Clase Punto
class Punto:
    def __init__(self, x=0, y=0):
        self.x = x
        self.y = y

# Clase Rectangulo
class Rectangulo:
    def __init__(self, pInicial=Punto(), pFinal=Punto()):
        self.pInicial = pInicial
        self.pFinal = pFinal
        # Hago los cálculos, pero no llamo los atributos igual que los métodos
        # porque sino podríamos sobreescribirlos
        self.vBase = abs(self.pFinal.x - self.pInicial.x)
        self.vAltura = abs(self.pFinal.y - self.pInicial.y)
        self.vArea = self.vBase * self.vAltura
        
    def base(self):
        print(f'La base del rectángulo es {self.vBase}')
        
    def altura(self):
        print(f'La altura del rectángulo es {self.vAltura}')
        
    def area(self):
        print(f'El area del rectángulo es {self.vArea}')

In [34]:
A = Punto(2,3)
B = Punto(5,5)

In [35]:
R = Rectangulo(A, B)
R.base()
R.altura()
R.area()

La base del rectángulo es 3
La altura del rectángulo es 2
El area del rectángulo es 6


## 4.5. Shell

In [None]:
## 1. Contar las palabras en la frase "this is shell in python".

text = 'this is shell in python'
! echo {text} | wc -w

In [None]:
## 2. Para cada directorio del historial de directorios (_dh, %dhist), obtener el número de archivos.

for folder in _dh:
    n_files = ! ls $folder | wc -l    ## Las variables en shell se introducen mediante el símobolo $.
    print(folder, n_files)

In [None]:
## 3. Mediante comandos de shell, crea un fichero .py que al ejcutarse imprima "Hello World!".

! echo 'print("Hello World!")' > hello_world.py

# 5. Bibliografía

- KSchool Data Science Master Ed. 23.
- Python for Data Analysis. ISBN: 978-1-491-95766-0.
- Udemy - Curso Maestro de Python 3. Héctor Costa Guzmán.
- https://es.wikipedia.org/wiki/Python
- https://docs.hektorprofe.net/python/