<a href="https://colab.research.google.com/github/solozano0725/diplomadoMLNivel1/blob/main/DipMLsesion4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<p><img alt="Colaboratory logo" height="140px" src="https://upload.wikimedia.org/wikipedia/commons/archive/f/fb/20161010213812%21Escudo-UdeA.svg" align="left" hspace="10px" vspace="0px"></p>

# **Diplomado de Análisis de datos y Machine Learning en Python**


El presente diplomado hace parte del centro de Big Data de la facultad de ciencias exactas y naturales (FCEN) de la Universidad de Antioquia.

## **Sesión 4**

## **Contenido**

- <a href="#est"> Estructuras de datos</a><br>
  - <a href="#list"> Listas por comprensión</a><br>
  - <a href="#tup"> Tuplas</a><br>
  - <a href="#dic"> Diccionarios</a><br>
- <a href="#fun"> Funciones</a><br>
  - <a href="#arg"> Argumentos de la función</a><br>
    - <a href="#req"> Argumentos requeridos</a><br>
    - <a href="#pre"> Argumentos predeterminados</a><br>

<p><a name="lpc"></a></p>

# **Estructuras de datos**

# **Listas por comprensión**

Las listas por comprensión son simplemente una forma de comprimir un ciclo de construcción de listas en una sola línea corta y legible. La sintáxis es de la forma

>  

    [expresion for var_iter in secuencia if cond] 


donde `expresion` es cualquier expresión válida dentro de python, `var_iter` es la variable de iteración, `secuencia` es cualquier objeto de Python iterable, y `cond` es alguna condición que, opcionalmente, se imponga sobre la variable de iteración.  

Por ejemplo, para construir una lista con el cuadrado de los primeros 5 enteros podríamos escribir lo siguiente:

In [None]:
L = []

for i in range(1,6):
  L.append(i**2)

L

[1, 4, 9, 16, 25]

La lista por comprensión equivalente es la siguiente:

In [None]:
[i**2 for i in range(1,6)]

[1, 4, 9, 16, 25]

Observe las equivalencias entre ambos bloques de código. Al igual que con muchas sentencias de Python, casi podemos leer el significado de esta sentencia: "construya una lista que consista en el cuadrado de `i` para cada `i` desde 1 hasta 5". 

Adicionalmente, podemos controlar aún más la iteración agregando un condicional al final de la expresión. Por ejemplo, ya habíamos escrito el siguiente código:



In [None]:
l = []

for elemento in range(1,11):
  if elemento % 2 == 0:
    l.append(elemento)

l

[2, 4, 6, 8, 10]

Una lista por comprensión equivalente sería:

In [None]:
[elemento for elemento in range(1,11) if elemento % 2 == 0]

[2, 4, 6, 8, 10]

Incluso podemos añadir las sentencias `if` y `else` para tener mayor control sobre los elementos de la lista. Por ejemplo, construyamos una lista con 10 elementos, tal que sus primeros cinco elementos sean los primeros cinco números enteros, y que el resto de elementos sean el cuadrado de los enteros 6,7,8,9 y 10

In [None]:
[i if i < 6 else i**2 for i in range(1,11)]

[1, 2, 3, 4, 5, 36, 49, 64, 81, 100]

**Ejercicio 1:** Dado el siguiente listado de alumnos de una clase

> 
    alumnos = ['Ana', 'Luis', 'Pedro', 'Marta', 'Nerea', 'Pablo']

Crear dos listas: una que contenga la primera letra de cada nombre y otra que contenga la última letra

In [None]:
alumnos = ['Ana', 'Luis', 'Pedro', 'Marta', 'Nerea', 'Pablo']

primera_letra = []
ultima_letra = []

for nombre in alumnos:
  primera_letra.append(nombre[0])
  ultima_letra.append(nombre[1])

print(primera_letra)
print(ultima_letra)

['A', 'L', 'P', 'M', 'N', 'P']
['n', 'u', 'e', 'a', 'e', 'a']


In [None]:
primera_letra = [nombre[0] for nombre in alumnos]
ultima_letra = [nombre[-1] for nombre in alumnos]

print(primera_letra)
print(ultima_letra)

['A', 'L', 'P', 'M', 'N', 'P']
['a', 's', 'o', 'a', 'a', 'o']


<p><a name="tup"></a></p>

# **Tuplas**

Las tuplas son en muchos aspectos similares a las listas, pero se definen entre paréntesis en lugar de corchetes, o separando los elementos por una coma:

In [None]:
t = (1, 2, 3)
t

(1, 2, 3)

In [None]:
type(t)

tuple

In [None]:
# equivalentemente
t = 1,2,3 
t

(1, 2, 3)

Vemos que en Python las tuplas son un objeto de tipo `tuple`. 

Al igual que las listas, las tuplas tienen una noción de longitud y de orden, por lo que podremos indexar y segmentar estos objetos:

In [None]:
print(f"indexación: {t[0]}") 
print(f"segmentación: {t[1:]}")

indexación: 1
segmentación: (2, 3)


La principal característica distintiva de las tuplas es que son estructuras de datos inmutables, lo cual significa que una vez que se crean, no es posible modificar su tamaño y contenido. Si intentamos modificar un elemento de la tupla obtendremos un error:

In [None]:
t[0] = 1

TypeError: ignored

Las tuplas cumplen una función doble: pueden usarse como listas inmutables y también para almacenar información sin una etiqueta explícita. Por ejemplo, supongamos que queremos almacenar la informacion de un punto en el plano cartesiano $(x,y)$. Podríamos tener esta información en una tupla, donde se usará la posición dentro de la tupla para referenciar los puntos

In [None]:
# coordenadas de un punto en el plano (x,y)
coordenadas = (4, 3)

Note que en esta expresión, ordenar la tupla destruiría la información ya que el significado de cada elemento está dado por su posición en la tupla.

**Mecanismo de *unpacking*:** En Python, hay una característica de asignación de tuplas muy poderosa que asigna "el lado derecho de los valores al lado izquierdo". Esto es, "desempaquetamos" los valores de una tupla en variables individuales. Veamos un ejemplo





In [None]:
tupla = ("Carlos", 45, "Medellin")

In [None]:
# unpacking
nombre, edad, ciudad = ("Carlos", 45, "Medellin")

Note que hemos asignado `"Carlos", 45, "Medellin"` a `nombre`, `edad` y `ciudad`, respectivamente, en una sola sentencia. A este tipo de procesos se hace referencia cuando se habla del mecanismo de *unpacking* de las tuplas. Por ejemplo, este es el mecanismo que nos permite definir múltiples variables en una sola sentencia (asignación paralela)


   

In [None]:
a, b = 1, 2

print(f"a: {a}")
print(f"b: {b}")

a: 1
b: 2


Este mecanismo también permite "desempaquetar" listas:

In [None]:
data = "carlos-45-medellin"

# el método split retorna una lista
# a partir del str data
nombre, edad, ciudad = data.split("-")

print(nombre)
print(edad)
print(ciudad)

carlos
45
medellin


Si, por ejemplo, solo queremos tomar una parte de la tupla, podemos utilizar una variable como `_` de la siguiente manera: 

In [None]:
nombre, _, _ = data.split("-")

nombre

'carlos'

In [None]:
# codigo postal de algunos paises
codigo_postal = [("USA", 32423), ("COL", 34234), ("BRA", 34232)]

for pais, codigo in codigo_postal:
  print(pais, codigo)

USA 32423
COL 34234
BRA 34232


Este mecanismo también nos permite iterar sobre múltiples índices de forma independiente

In [None]:
# solo tomamos el primer valor (pais) de las tuplas
for pais, _ in codigo_postal:
  print(pais)

USA
COL
BRA


Para finalizar veamos otro ejemplo que involucra tuplas. En Python podemos tener mútiples ciclos. Por ejemplo:

In [None]:
l = []

for i in range(2):
  for j in range(2):
    l.append((i,j))

l

[(0, 0), (0, 1), (1, 0), (1, 1)]

Las listas por comprensión admiten este tipo de ciclos:

In [None]:
[(i, j) for i in range(2) for j in range(2)]

[(0, 0), (0, 1), (1, 0), (1, 1)]

<p><a name="dic"></a></p>

# **Diccionarios**

Los diccionarios son mapeos extremadamente flexibles de claves a valores, y forman la base de gran parte de la implementación interna de Python. Se pueden crear mediante una lista separada por comas de pares `clave:valor` dentro de llaves:

In [None]:
nums = {"uno":1, "dos":2, "tres":3}
nums

{'dos': 2, 'tres': 3, 'uno': 1}

In [None]:
type(nums)

dict

a cada par `clave:valor` se le conoce como un *item*. Alternativamente, podemos crear un objeto tipo `dict` directamente con el constructor `dict`

In [None]:
# pasando los items en la forma clave=valor
dict(uno=1, dos=2, tres=3)

{'dos': 2, 'tres': 3, 'uno': 1}

Supongamos que queremos construir un diccionario a partir de 

In [None]:
codigos = [(86, 'China'), (91, 'India'), (62, 'Indonesia')]

donde las claves sean el país y los valores los códigos asociados. Esto no será posible debido a que que las posiciones de país y código están intercambiadas

In [None]:
dict(codigos)

{62: 'Indonesia', 86: 'China', 91: 'India'}

Para construir el diccionario en la forma requerida, podemos construirlo como un diccionario por comprensión 

In [None]:
{pais:codigo for codigo, pais in codigos}

{'China': 86, 'India': 91, 'Indonesia': 62}

otro ejemplo:

In [None]:
{f"clave{i}":i for i in range(4)}

{'clave0': 0, 'clave1': 1, 'clave2': 2, 'clave3': 3}

A diferencia de los elementos dentro de una lista o tupla, los items del diccionario no tienen una noción de orden o posición. 

Podemos acceder o definir un item del diccionario mediante la sintaxis de indexación utilizada para las listas y tuplas, excepto que el índice no es numérico sino una clave válida dentro del diccionario


In [None]:
# accediendo a un elemento del diccionario
nums["uno"]

1

Como los diccionarios son objetos mutables, podemos crear nuevos items o modificar items existentes:

In [None]:
# definiendo diccionarios vacios
dic = {}

# añadiendo un elemento al diccionario vacio
dic["c1"] = 1

dic

{'c1': 1}

In [None]:
# definiendo un nuevo elemento del diccionario
dic["c2"] = 2
dic

{'c1': 1, 'c2': 2}

Tenga en cuenta que las claves son únicas dentro de un diccionario, mientras que los valores pueden no serlo. Los valores de un diccionario pueden ser de cualquier tipo, pero las claves deben ser de un tipo de dato inmutable, como cadenas, números o tuplas, de manera que podemos construir estructuras más complejas como la siguiente:

In [None]:
dic = {"nombres": ["daniel", "carlos", "camila", "maria"], "edades":[23, 26, 17, 23]}

Podemos acceder a los diferentes elementos del diccionario individualmente o al *item* completo si así lo necesitamos. Esto se puede realizar utilizando los métodos `keys`, `values` y `items`, respectivamente. 

In [None]:
# accediendo a las claves
dic.keys()

dict_keys(['nombres', 'edades'])

In [None]:
# accediendo a los valores
dic.values()

dict_values([['daniel', 'carlos', 'camila', 'maria'], [23, 26, 17, 23]])

In [None]:
# accediendo a los items
dic.items()

dict_items([('nombres', ['daniel', 'carlos', 'camila', 'maria']), ('edades', [23, 26, 17, 23])])

Podemos utilizar estos métodos para iterar sobre alguno de los elementos

In [None]:
# iterando sobre las claves
for clave in dic.keys():
  print(clave)

nombres
edades


Note que por defecto, si iteramos sobre el diccionario, estaremos iterando sobre las claves, por lo que en este caso no hay necesidad de utilizar el método `keys`

In [None]:
# iterando sobre las claves
for clave in dic:
  print(clave)

nombres
edades


In [None]:
# iterando sobre los valores
for valor in dic.values():
  print(valor)

['daniel', 'carlos', 'camila', 'maria']
[23, 26, 17, 23]


In [None]:
# iterando sobre las tuplas clave:valor
for clave, valor in dic.items():
  print(clave, valor)

nombres ['daniel', 'carlos', 'camila', 'maria']
edades [23, 26, 17, 23]


**Ejercicio 2:** Dado el diccionario

> 
    notas = {'Ana':9, 'Luis':7, 'Pedro':2, 'Marta':5, 'Nerea':4, 'Pablo':6}

  1) cree una lista que contenga notas mayores o iguales a 5.

  2) cree una lista que contenga los nombres de los estudiantes que contengan la letra "a".

  3) cree una lista que contenga los nombres de los estudiantes que aprobaron (nota $\geq$ 5) 

**Ejercicio 3:** Dada la siguiente lista, itere sobre ella y cuente la aparición de cada elemento y cree un diccionario para mostrar el recuento de cada elemento

> 
    Lista = [11, 45, 8, 11, 23, 45, 23, 45, 89]

<p><a name="fun"></a></p>

# **Funciones**

Hasta ahora, nuestros programas han sido bloques de código simples y de un solo uso. Una forma de organizar nuestro código de Python y hacerlo más legible y reutilizable es descomponer piezas útiles en funciones reutilizables. 

Ya hemos visto funciones antes. Por ejemplo, `print()` es una función:

In [None]:
print("abc")

abc


aquí `print` es el nombre de la función, y `"abc"` es el *argumento* de la función, en este caso un argumento *requerido*.

Adicional a los argumentos requeridos, existen los argumentos predeterminados o *argumentos por palabra clave* (keyword arguments o kwargs) que se especifican por el nombre o palabra clave Por ejemplo, un kwarg disponible para la función `print` es `end` que controla qué caracter añadir al final del último valor 



In [None]:
print(1, 2, 3, end=".")

1 2 3.

o el kwarg `sep`, que controla qué caracter utilizar para separar los diferentes valores



In [None]:
print(1, 2, 3, sep=",")

1,2,3


Las funciones se vuelven aún más útiles cuando comenzamos a definir las nuestras. La sintáxis general para crear una función es la siguiente

>  

    def Nombre( argumento(s) ):

      sentencia(s) 
            
      return expresion
    
     
* Los bloques de funciones comienzan con la palabra clave `def` seguida del nombre de la función y paréntesis ().
* Cualquier parámetro o argumento de entrada debe colocarse entre los paréntesis.
* El bloque de código dentro de cada función comienza con dos puntos (:) y está indentado.
* La declaración final `return expresion` es opcional. Al incluirla, una vez se llame la función, esta tomará el valor definido en `expresion`.

Por ejemplo, podemos definir la función $f(x)=x^2$ en Python como:

In [None]:
# definicion
def f(x):
  return x**2

y la podemos *llamar* de la siguiente manera

In [None]:
# llamada de la funcion
f(2)

4

La posibilidad de definir nuestras propias funciones nos ayudará de diversas maneras:

* Cuando estemos escribiendo un programa y veamos que estamos escribiendo el mismo código más de una vez, probablemente sea mejor definir una función con el código repetido. Luego podremos llamar a la función tantas veces como sea necesario en lugar de reescribir el código una y otra vez. Es importante que evitemos escribir el mismo código más de una vez en nuestros programas.

* Si escribimos el mismo código más de una vez y cometemos un error, debemos corregir ese error en cada lugar donde copiamos el código. Si por el contrario, tenemos el código en un solo lugar, definido en una función, podremos resolver el error solo en este lugar y olvidarnos del resto de lugares. 

* Si cometemos un error al escribir una función, y luego corregimos el código en la función, habremos corregido automáticamente el código en cada lugar que utiliza la función. Este principio de programación modular es un concepto muy importante.

* Las funciones también ayudan a que nuestro código sea más fácil de leer. Cuando usamos buenos nombres para las variables y funciones en nuestros programas, podemos leer el código y comprender lo que hemos escrito, no solo mientras lo escribimos, sino tiempo después, cuando necesitemos mirar el código que escribimos nuevamente. 

Las funciones son pues una forma de organizar nuestro código y hacerlo más legible y reutilizable. 




<p><a name="arg"></a></p>

# **Argumentos de la función**

Podemos llamar una función utilizando los siguientes tipos de argumentos formales:

* Argumentos requeridos.
* Argumentos predeterminados.
* Argumentos de longitud variable.

<p><a name="req"></a></p>

## **Argumentos requeridos**

Los argumentos requeridos son argumentos pasados a una función, que tienen un carácter obligatorio y se dan en el **orden posicional correcto**. Veamos un ejemplo: creemos una función que, dados dos parámetros, nos devuelva la resta de estos:

In [None]:
def resta(a,b):
  return a-b

Aquí, el número de argumentos en la llamada a la función debe coincidir exactamente con el número de argumentos definidos en la función. En este caso, para llamar la función `resta`, debemos pasar obligatoriamente los dos argumentos `a` y `b` con los que se ha definido:

In [None]:
resta(2,1)

1

Si cambiamos el orden en el que pasamos los parámetros naturalmente cambiará la salida:

In [None]:
resta(1,2)

-1

Si los parámetros los pasamos de forma explícita no importará el orden

In [None]:
resta(b=1, a=2)

1

Recuerde que a la hora de llamar la función esta toma el valor definido en el `return` con el tipo de dato correspondiente:

In [None]:
type(resta(1,2))

int

Por lo que podremos tratar la llamada de la función como si fuera del tipo que se ha definido en el `return`. Por ejemplo, si definimos una función que nos devuelva un dato de tipo `str`, podremos aplicar métodos de este objeto a la hora de llamar la función:

In [None]:
def saludo(nombre):
  return f"Hola {nombre}, ¿cómo estás?"

In [None]:
# aplicando un metodo del objeto str
saludo("Carlos").upper()

'HOLA CARLOS, ¿CÓMO ESTÁS?'

Ahora, ¿recuerda la descripción de las funciones que obtuvimos mediante la función propia de Python `help` o mediante el caractér `?`? Esta descripción  se define mediante lo que se conoce como el *Docstring*, que se puede definir dentro de una función encerrando el texto descriptivo entre tres comillas:

In [None]:
def resta(a,b):
  """
  función que devuelve la resta de a y b
  """
  return a-b

In [None]:
resta?

debemos tener en cuenta que las funciones definen su propio entorno. Es decir, si definimos una variable dentro de la función, esta no estará definida en el entorno global

<p><a name="pre"></a></p>

## **Argumentos predeterminados (*kwarg*)**

A menudo, al definir una función, hay ciertos valores que queremos que la función use la mayor parte del tiempo, pero también nos gustaría tener cierta flexibilidad en la elección de estos valores. En tal caso, podemos usar valores predeterminados para los argumentos. Veamos cómo definirlos:

Redefinamos, por ejemplo, la función `saludo` de manera que el argumento `nombre` tome un valor predeterminado



In [None]:
def saludo(nombre="Carlos"):
  """
  Función que devuelve un string con un saludo 
  """
  return f"Hola {nombre}, ¿cómo estás?"

De esta manera, el parámetro `nombre` no es requerido al momento de llamar la función

In [None]:
saludo()

'Hola Carlos, ¿cómo estás?'

Cuando en una función uno de sus argumentos lleva un valor por defecto, éste se convierte automáticamente en un *kwarg*. Por lo tanto, puede ser especificado indicando su nombre al momento de llamar la función o utilizando simplemente la posición del argumento

In [None]:
# utilizando la palabra clave
saludo(nombre="Camila")

'Hola Camila, ¿cómo estás?'

In [None]:
# utilizando la posicion del arg
saludo("Camila")

'Hola Camila, ¿cómo estás?'

Debemos tener en cuenta que a la hora de definir los argumentos de la función y de la llamada de esta, todos los argumentos requeridos deben definirse antes de los kwargs


In [None]:
# forma correcta
def PrintInfo(nombre, año=2019):
  pass

PrintInfo("Carlos", año=2020)

# forma incorrecta
def PrintInfo(año=2019, nombre):
  pass

PrintInfo(año=2020, "Carlos")

**Ejercicio 4:** Escriba una función que devuelva `True` si una palabra dada es un palíndromo o `False` si no lo es

In [None]:
def mod_str(cadena):
  """
  retorna una version modificada de una cadena
  eliminando los espacios en blanco y con todas
  las letras en minúscula
  """
  return cadena.lower().replace(" ","")

In [None]:
def es_palindromo(cadena):
  """funcion que evalua si una cadena es un palindromo"""
  if mod_str(cadena) == mod_str(cadena[::-1]):
    return True
  else:
    return False

es_palindromo("Ala")

True

**Ejercicio 5:** Escriba una función que tome como argumento una lista y devuelva el conteo del número de vocales en dicha lista.