# Clase 2: Introducción a Python

Python es un lenguaje de programación de alto nivel, intérprete y de propósito general. Creado a los finales de los 80's por Guido von Rossum,soporta múltiples paradigmas de programación, incluyendo programación estructurada, orientada a objetos y orientada a eventos.

La filosofía de Python está resumida en el texto The [Zen of Python](https://peps.python.org/pep-0020/) (PEP 20), el cual incluye:

* Lo bello es mejor que lo feo.
* Lo explícito es mejor que lo implícito.
* Lo simple es mejor que lo complejo.
* Lo complejo es mejor que lo complicado.
* La facilidad de lectura cuenta.

En resumen, Python se centra en una sintáxis y gramática fácil de entender y simple, a la vez que le da la oportunidad a los programadores más expertos de crear su propia metodología por medio de módulos (o paquetes).

> **Dato curioso:** el nombre de este lenguaje de programación surge a partir del programa de Monthy Python, no del animal.

Cabe explicar también los siguientes términos sobre Python:

* **Es un lenguaje de alto nivel:** implica que hay alta abstracción de los detalles del computador. Los lenguajes de bajo nivel son aquellos que incluso utilizan elementos del lenguaje natural, lo que los hace más "sencillos" de entender, como Stata.
* **Es un lenguaje interpretado:** implica que no hay compilación del código. Simplemente se corre directamente.
* **Es un lenguaje de propósito general:** implica que puede utilizarse para un amplio rango de objetivos, tales como programación de juegos, análisis estadísticos, entre otros.

Ahora debemos aprender un poco sobre cómo utilizar y programar Python. Vamos paso a paso.

No obstante, primero vamos a cumplir con la tradición de iniciación de programación: en la siguiente celda impriman "Hello, world!" con el método `´print()`:

# 1. Algoritmos

# 2. Aritmética básica

## 2.1. Operaciones básicas

Las operaciones básicas en Python son muy intuitivas. Solamente se utilizan los operadores que normalmente conocemos: suma (`+`), resta (`-`), multiplicación (`*`), división (`/`). A continuación veremos algunos ejemplos:

In [1]:
# Suma
print("Suma:")
print(1+1)

# Resta
print("Resta:")
print(50-25)

# Multiplicación
print("Multiplicación:")
print(6*6)

# División
print("División:")
print(125/25)

Suma:
2
Resta:
25
Multiplicación:
36
División:
5.0


Las operaciones básicas que no son tan intuitivas son la potencia y la raíz cuadrada, cuyos operadores en Python son (`**`), como se ve a continuación:

In [2]:
# Potencia
print("Potencia:")
print(6**2)
print(pow(6, 2))

# Raíz cuadrada
print("Raíz cuadrada:")
print(49**(1/2))
print(pow(49, (1/2)))

Potencia:
36
36
Raíz cuadrada:
7.0
7.0


También se pueden utilizar **paquetes** o **librerías** (de las cuales hablaremos en el transcurso del curso). Por ahora, podemos utilizar la librería `math`, la cual tiene el comando `sqrt()` para realizar la raíz cuadrada:

In [3]:
# Se importa la librería math
import math

# Raíz cuadrada
print("Raíz cuadrada")
print(math.sqrt(4))
print(math.sqrt(36))

Raíz cuadrada
2.0
6.0


> **Nota:** en Python se puede hacer uso de las librerías llamando la librería seguida de la función que se necesita, separado por un punto, como se ve en el ejemplo. Más adelante profundizaremos más.

## 2.2. Operador módulo

En la aritmética, existe un operador que sirve en ocasiones para algunos algoritmos: el operador modular. El operador modular (`%`) obtiene el residuo de una división. Por tanto, podríamos ver el siguiente ejemplo:

$$13 \% 4 = 1 \:\: \neq \:\: 13/4  \simeq 3 $$

Es decir, 13 dividido 4 tiene como cociente 3 y residuo 1. Comprobémoslo en código:

In [4]:
# Operador módulo
print("Operador módulo")
print(13%4)
print(25%5)
print(135%2)

Operador módulo
1
0
1


## 2.3. Ejercicios

Calcule la siguiente fórmula:

$$[ ( 12^2 )*( 1/3 )+52 ]^{1/2}$$

In [5]:
print("La respuesta es: {0}.".format((12**(2)*(1/3)+52)**(1/2)))

La respuesta es: 10.0.


Encuentre el residuo de:

$$29/3$$

In [6]:
print("La respuesta es: {0}.".format(29%3))

La respuesta es: 2.


# 3. Tipos de datos

Python (y todo tipo de lenguaje de programación) tiene clasificaciones de los tipos de datos (o variables). Es importante manejar bien los tipos de datos para que podamos obtener lo que necesitamos, ya que cada variable puede ser guardado en diferentes tipos y cada tipo permite hacer diferentes cosas.

Los tipos más comúnes son los siguientes:

## 3.1. Tipo String (`str`)

Los textos se guardan como strings (`str`), de la siguiente manera:

In [21]:
# Creando la variable
x = "Hello, world"
print("El texto", x, "es de tipo ", type(x))

El texto Hello, world es de tipo  <class 'str'>


Podemos establecer el tipo de una variable con el comando `str()`:

In [8]:
x = str("Hello, world")
type(x)

str

Se puede realizar algunas operaciones con los strings:

## 3.1.1. Cambios de mayúsculas y minúsculas

In [22]:
# Creando la variable
x = "I love Big Data"
print("Original:")
print(x)
print("\n")

print("Lower:")
print(x.lower()) # Todas las letras se vuelven minúscula
print("\n")

print("Upper:")
print(x.upper()) # Todas las letras se vuelven mayúscula
print("\n")

print("Capitalize:")
print(x.capitalize()) # Solo la primera letra se vuelve mayúscula
print("\n")

print("Title:")
print(x.title()) # Todas las primeras letras de cada palabra se vuelven mayúscula
print("\n")

print("Swap Case:")
print(x.swapcase()) # Intercambia las mayúsculas y minúsculas

Original:
I love Big Data


Lower:
i love big data


Upper:
I LOVE BIG DATA


Capitalize:
I love big data


Title:
I Love Big Data


Swap Case:
i LOVE bIG dATA


### 3.1.2. Manipulación de los strings

In [10]:
# Creando la variable
x = "I am your father, Luke. Yes, I am."
print("Original:")
print(x)
print("\n")

print("Split:")
y = x.split() # Divide el string en sus partes
print(y)
y = x.split(".") # Se puede dividir por un caracer en específico, en este caso con un punto "."
print(y)
print("\n")

print("Replace:")
y = x.replace("am", "was") # Reemplaza una palabra específica por otra
print(y)
print("\n")

Original:
I am your father, Luke. Yes, I am.


Split:
['I', 'am', 'your', 'father,', 'Luke.', 'Yes,', 'I', 'am.']
['I am your father, Luke', ' Yes, I am', '']


Replace:
I was your father, Luke. Yes, I was.




### 3.1.3. Búsqueda en strings

In [68]:
# Creando la variable
x = "Elon Musk is a crazy man, man."
print("Original: \n{0}".format(x))
print("\n")

print("Find:")
print(x.find("man")) # Busca el string y devuelve la primera posición en la que está (pos. 22)
print("\n")

print("RFind:")
print(x.rfind("man")) # Busca el string y devuelve la última posición en la que está (pos. 27)

Original: 
Elon Musk is a crazy man, man.


Find:
21


RFind:
26


> **Nota:** se debe notar que las posiciones que devuelve el programa están un valor por debajo que el que podemos observar. Por ejemplo, si lo encontramos en la posición 27, nos devuelve 26. Esto ocurre porque Python **cuenta desde 0, no desde 1**.

### 3.1.4. Operaciones complejas

In [83]:
# Creando la variable
x = "That's one small step for man, one big leap for mankind."

y = x.split() # Dividiendo el string
y[2] = "big" # Cambiando una palabra
" ".join(y) # Volviendo a unir la lista

"That's one big step for man, one big leap for mankind."

### 3.1.5. Pequeño ejercicio

Coja el siguiente elemento `str` del gran canta-autor Darío Gómez y conviértala en mayúsculas y divídala en una lista de palabras:

In [None]:
lyrics = "Nadie es eterno en el mundo, Ni teniendo un corazón, Que tanto siente y suspira por la vida y el amor"

In [None]:
# Convirtiendo el str en mayúsculas
lyrics = lyrics.upper()

# Dividiéndolo en una lista
lyrics = lyrics.split(" ")

# Mostrando los resultados
print(lyrics)

## 3.2. Tipo Numérico (`int`, `float`, `complex`)

Los números se guardan bajo tres tipos: enteros (`int`), reales (`float`) y complejos (`complex`). Nos concentraremos en `int` y `float`:

In [13]:
# Creando una variable entera
x = 1
print(type(x))

# Creando una variable real no entera
y = 1.1
print(type(y))

<class 'int'>
<class 'float'>


Los tipo numérico diferencian entre los enteros y los reales no enteros por memoria: los reales no enteros ocupan más memoria que los enteros. No obstante, se puede establecer manualmente los tipos:

In [14]:
x = float(x) # Estableciendo manualmente tipo float
print("El número {0} es de tipo {1}.".format(x, type(x)))

x = int(x) # Estableciendo manualmente tipo int
print("El número {0} es de tipo {1}.".format(x, type(x)))

El número 1.0 es de tipo <class 'float'>.
El número 1 es de tipo <class 'int'>.


### 3.2.1. Aproximación de valores

In [15]:
import math

print("Round:")
x = 2.456
print(round(x)) # Aproxima los valores a entero
print(round(math.pi, 2)) # Aproxima los valores a dos decimales
print("\n")

print("Ceil:")
print(math.ceil(3.2)) # Aproxima al entero siguiente, así no supere la mitad en decimales
print("\n")

print("Floor:")
print(math.floor(5.7)) # Aproxima al entero anterior, así supere la mitad en decimales
print("\n")

print("Valor absoluto:")
print(math.fabs(-3))

Round:
2
3.14


Ceil:
4


Floor:
5


Valor absoluto:
3.0


### 3.2.2. Valores constantes

In [16]:
import math

print("Pi:")
print(math.pi)
print("\n")

print("Euler:")
print(math.e)
print("\n")

print("Missing o valor vacío:")
print(math.nan)

Pi:
3.141592653589793


Euler:
2.718281828459045


Missing o valor vacío:
nan


## 3.3. Tipos de secuencia

Los tipos de secuencia son variables que se construyen de diferentes datos. Hay tres tipos: lista (`list`), tupla (`tuple`) y rango (`range`). Las variables tipo tupla tienden a ser complicados y no permiten la modificación de sus datos internos, por lo cual no lo profundizaremos en este curso. Nos concentraremos en los tipos `list` y `range`:

### 3.3.1. Tipo `list`

Las litas se construyen con los operadores `[]`, incluyendo dentro las variables que queremos ingresar:

In [17]:
# Creando una lista con variables del mismo tipo
x = [1, 5, 8] # Numérico
y = ["Hola", "Amigos", "Míos"] # String

print("Lista con elementos del mismo tipo:")
print("{0}\n{1}".format(x, y))
print("\n")

# Creando una lista con variables de diferentes tipos
z = [1, "Wey", True]

print("Lista con elementos de diferente tipo:")
print("{0}".format(z))
print("\n")

Lista con elementos del mismo tipo:
[1, 5, 8]
['Hola', 'Amigos', 'Míos']


Lista con elementos de diferente tipo:
[1, 'Wey', True]




También se pueden crear con variables ya creadas con anterioridad (¡incluyendo listas!):

In [18]:
# Creando variables
x = 1
y = "Obvio, bobis"
z = ["Hasta que nos muramuramonos", 1]

lst = [x, y, z]
print(lst)
print("\n")

[1, 'Obvio, bobis', ['Hasta que nos muramuramonos', 1]]




Se pueden extraer elementos de esas listas fácilmente, llamando la lista y su posición con el operador `[]`:

In [19]:
print("¿Se puede?")
lst[1]

¿Se puede?


'Obvio, bobis'

Incluso se puede llamar un elemento dentro de la lista que teníamos dentro de la lista principal:

In [20]:
lst[2][0]

'Hasta que nos muramuramonos'

También podemos obtener la posición en la que está un elemento en particular:

In [21]:
lst.index(1)

0

### 3.3.2. Tipo `range`:

Los tipo `range` son rangos de números. Estos sirven mucho para ciclos (loops), los cuales utilizaremos más adelante:

In [22]:
x = range(6)
print(x)
print(type(x))

range(0, 6)
<class 'range'>


Un ejemplo de su uso es el siguiente:

In [23]:
# Iniciando desde 0
for i in range(5):
    print(i)
    
print("\n")
    
# Iniciando desde un número específico
for i in range(1, 3):
    print(i)

0
1
2
3
4


1
2


## 3.3. Tipo valores booleanos

Los valores booleanos son verdadero (`True`) y falso (`False`). Representan respuestas a preguntas o condicionales:

In [24]:
# Creando una variable booleana
x = True
print(type(x))

<class 'bool'>


Se puede convertir manualmente un valor en booleano:

In [25]:
x = bool(3.2) # Estableciendo manualmente tipo booleano
print("El número {0} es de tipo {1}.".format(x, type(x)))

El número True es de tipo <class 'bool'>.


También se puede crear una comparación de tipo booleano:

In [26]:
x = 5
y = 5

bo = (x == y)

print(bo)

True


### 3.3.1. Operadores de comparación

Existen operadores que permiten comparar valores numéricos, strings, de secuencia e, incluso, de diccionario (que después veremos). Ello nos facilitará la construcción de condicionales, pero también nos permite comparar elementos. Estos operadores son:

Operador    | Descripción
------------|-----------------
`>`         | `True` si el operando de la izquierda es estructamente mayor al de la derecha. `False` en caso contrario.
`>=`        | `True` si el operando de la izquierda es mayor o igual al de la derecha. `False` en caso contrario.
`<`         | `True` si el operando de la izquierda es estructamente menor al de la derecha. `False` en caso contrario.
`<=`        | `True` si el operando de la izquierda es menor o igual al de la derecha. `False` en caso contrario.
`==`        | `True` si el operando de la izquierda es igual al de la derecha. `False` en caso contrario.
`!=`        | `True` si el operando de la izquierda es diferente al de la derecha. `False` en caso contrario.


Veamos un ejemplo sencillo sobre cómo se ve este tipo de comparación:

In [27]:
# Creando variables
x = 12
y = 11

x < y

False

Ahora veamos varios ejemplos:

In [28]:
# Creando las variables
x = 10
y = 5
print("Comparaciones con los números {0} y {1}".format(x, y))
# Realizando comparaciones
print("Mayor que: \t{0}".format(x > y))
print("Menos que: \t{0}".format(x < y))
print("Igual que: \t{0}".format(x == y))
print("Diferente que: \t{0}".format(x != y))
print("\n")

# Creando las variables
x = "Hola"
y = "hola"
print("Comparaciones con los strings '{0}' y '{1}'".format(x, y))
# Realizando comparaciones
print("Sin estandarizar: \t{0}".format(x == y)) # Comparación sin modificar los strings
print("Con estandarizar: \t{0}".format(x.upper() == y.upper())) # Comparación haciendo una estandarización de los strings

Comparaciones con los números 10 y 5
Mayor que: 	True
Menos que: 	False
Igual que: 	False
Diferente que: 	True


Comparaciones con los strings 'Hola' y 'hola'
Sin estandarizar: 	False
Con estandarizar: 	True


> **Nota:** es importante anotar que para el computador un caracter con mayúscula es diferente a uno con minúscula. En ese sentido, "bEbExIto" es diferente de "bebexito", aunque para nosotros es claro que es la misma palabra. Teniendo en cuenta lo anterior, se debe realizar un procesamiento previo para que las palabras se entiendan como iguales. Al procesamiento de texto de este tipo se le llama Procesamiento de Lenguaje Natural (_Natural Language Processing_ - NLP).

Las comparaciones también funcionan con operaciones matemáticas:

In [29]:
x = 10
y = 5

print("Suma:")
print(x + y != 15)
print("\n")

print("División:")
print(x/2 == y)
print("\n")

print("Operador modular:")
print(x%y == 0)

Suma:
False


División:
True


Operador modular:
True


## 3.4. Tipo categórico o factor

Este tipo no es un tipo construido dentro del ambiente de Python, los demás sí lo son. No obstante, dentro de la Ciencia de Datos, especialmente en ML y AI es bastante importante, ya que permite analizar qué categorías tenemos en una base de datos. Ejemplos de categorías en la vida real son: estratos socioeconómicos, género, universidad en la que estudió, entre otros. Incluso podemos crear nuestras propias categorías: nivel de ingreso, si alguien estuvo expuesto a un tratamiento o no, categorizaciones de otras variables, entre otros.

En ese sentido, las variables categóricas pueden ser obtenidas de valores originalmente numéricos (`int` o `float`) o en texto (`str`), pero tienen su tipo especial dentro de Python: 

In [30]:
#pip install pandas

In [31]:
# Importando librerías
import numpy as np # Numpy
import pandas as pd # Pandas (hablaremos de este después)
 
# Categorías usando dtype
c = pd.Series(["a", "b", "d", "a", "d"], dtype ="category")
print ("\nCategoría sin pandas.Categorical() : \n", c)
 
# Categorías usando pandas
print("\nCategoría usando pandas.Categorical() : \n")
c1 = pd.Categorical([1, 2, 3, 1, 2, 3])
print ("c1 : ", c1)
 
c2 = pd.Categorical(["alto", "medio", "alto", "alto", "bajo",
                     "alto", "bajo", "medio", "alto"])
print ("\nc2 : ", c2)


Categoría sin pandas.Categorical() : 
 0    a
1    b
2    d
3    a
4    d
dtype: category
Categories (3, object): ['a', 'b', 'd']

Categoría usando pandas.Categorical() : 

c1 :  [1, 2, 3, 1, 2, 3]
Categories (3, int64): [1, 2, 3]

c2 :  ['alto', 'medio', 'alto', 'alto', 'bajo', 'alto', 'bajo', 'medio', 'alto']
Categories (3, object): ['alto', 'bajo', 'medio']


También se puede estipular al programa si las categorías tienen un orden:

In [32]:
# Categorías sin orden
c1 = pd.Categorical(["b", "a", "e", "t", "c", 1])
print("Categoría sin orden: \n", c1)
print("\n")

# Categorías con orden
c2 = pd.Categorical(["b", "a", "e", "t", "c", 1, 5, 10], ordered = True)
print("Categoría con orden: \n", c2)

Categoría sin orden: 
 ['b', 'a', 'e', 't', 'c', 1]
Categories (6, object): [1, 'a', 'b', 'c', 'e', 't']


Categoría con orden: 
 ['b', 'a', 'e', 't', 'c', 1, 5, 10]
Categories (8, object): [1 < 5 < 10 < 'a' < 'b' < 'c' < 'e' < 't']


Se ordena por orden alfabético, dando una jerarquía entre ellas. Ello sirve para ordenar categorías, gráficas y otros elementos. Sin embargo, veamos otro ejemplo:

In [33]:
# Categorías sin orden
c1 = pd.Categorical(["Miércoles", "Jueves", "Lunes", "Martes",
                     "Viernes", "Domingo", "Sábado"])
print("Categoría sin orden: \n", c1)
print("\n")

# Categorías con orden alfabético
c2 = pd.Categorical(["Miércoles", "Jueves", "Lunes", "Martes",
                     "Viernes", "Domingo", "Sábado"], ordered = True)
print("Categoría con orden: \n", c2)
print("\n")

Categoría sin orden: 
 ['Miércoles', 'Jueves', 'Lunes', 'Martes', 'Viernes', 'Domingo', 'Sábado']
Categories (7, object): ['Domingo', 'Jueves', 'Lunes', 'Martes', 'Miércoles', 'Sábado', 'Viernes']


Categoría con orden: 
 ['Miércoles', 'Jueves', 'Lunes', 'Martes', 'Viernes', 'Domingo', 'Sábado']
Categories (7, object): ['Domingo' < 'Jueves' < 'Lunes' < 'Martes' < 'Miércoles' < 'Sábado' < 'Viernes']




Pero hay un problema: el orden establecido solamente con la opción `ordered = True` es insuficiente, pues lo organiza alfabéticamente. Sin embargo, podemos establecer el orden que nosotros deseemos de categorías.

In [34]:
# Categorías con orden establecido
c3 = pd.Categorical(["Miércoles", "Jueves", "Lunes", "Martes",
                     "Viernes", "Domingo", "Sábado"], 
                    categories = ["Lunes", "Martes", "Miércoles", "Jueves", "Viernes", "Sábado", "Domingo"],
                    ordered = True)
print("Categoría con orden establecido: \n", c3)

Categoría con orden establecido: 
 ['Miércoles', 'Jueves', 'Lunes', 'Martes', 'Viernes', 'Domingo', 'Sábado']
Categories (7, object): ['Lunes' < 'Martes' < 'Miércoles' < 'Jueves' < 'Viernes' < 'Sábado' < 'Domingo']


## 3.5. Diccionarios

Los diccionarios son una gran ayuda para Python, ya que ayudan a crear parejas de objetos (llaves y valores) que ayudan en la programación en general. Estos normalmente se crean con corchetes (`{}`) de la siguiente manera:

In [35]:
# Creando un diccionario
my_dic = {"Nombre" : "Juan", "Apellido" : "Londoño"}
my_dic

{'Nombre': 'Juan', 'Apellido': 'Londoño'}

La primera parte del diccionario es la llave (aquella que va antes de los dos puntos) y la segunda parte es el valor (lo que va después de los dos puntos). Se puede obtener cada uno con los siguientes comandos:

In [36]:
# Obtener las llaves
print("Obtener las llaves: \n")
print(my_dic.keys())

# Obtener los valores
print("Obtener los valores: \n")
print(my_dic.values())

Obtener las llaves: 

dict_keys(['Nombre', 'Apellido'])
Obtener los valores: 

dict_values(['Juan', 'Londoño'])


Se puede obtener alguno de los valores por su llave, por ejemplo:

In [37]:
my_dic["Nombre"]

'Juan'

Así mismo, los valores pueden ser listas, de tal manera que podemos guardar varios elementos:

In [38]:
my_dic = {"Nombre" : ["Juan", "Caro", "Lorena", "Camilo"], "Apellido" : ["Londoño"]}
my_dic["Nombre"]

['Juan', 'Caro', 'Lorena', 'Camilo']

Se puede añadir nuevas llaves al diccionario y nuevos valores a los diccionarios ya existentes con el método `append`:

In [39]:
# Agregar llaves
my_dic["Edad"] = 10

# Agregar valores
my_dic["Apellido"].append("Martínez")
print(my_dic)

{'Nombre': ['Juan', 'Caro', 'Lorena', 'Camilo'], 'Apellido': ['Londoño', 'Martínez'], 'Edad': 10}


> **Nota:** para que pueda agregar un nuevo elemento a una lista, se debe tener una lista en el diccionario.

Se pueden eliminar elementos enteros (llave y valores) con el método `pop`:

In [40]:
my_dic.pop("Edad")
print(my_dic)

{'Nombre': ['Juan', 'Caro', 'Lorena', 'Camilo'], 'Apellido': ['Londoño', 'Martínez']}


### 3.5.1. Diccionario de la clase

Pregúntele a las dos personas que se sientan a su derecha e izquierda y pregúntele los siguientes datos y cree un diccionario con dicha información:

* Nombre.
* Apellido.
* Edad.
* Comida favorita.

In [46]:
dic_class = {"Nombre": ["Nicolás", "Ángela"], "Apellido": ["Bermúdez", "Parra"], 
             "Edad": ["25", "25"], "Comida Favorita": ["Falafel", "Cigarrillos"]}
dic_class

{'Nombre': ['Nicolás', 'Ángela'],
 'Apellido': ['Bermúdez', 'Parra'],
 'Edad': ['25', '25'],
 'Comida Favorita': ['Falafel', 'Cigarrillos']}

Ahora agréguele sus propios datos:

In [47]:
dic_class["Nombre"].append("Juan")
dic_class["Apellido"].append("Londoño")
dic_class["Edad"].append("25")
dic_class["Comida Favorita"].append("Helado")

dic_class

{'Nombre': ['Nicolás', 'Ángela', 'Juan'],
 'Apellido': ['Bermúdez', 'Parra', 'Londoño'],
 'Edad': ['25', '25', '25'],
 'Comida Favorita': ['Falafel', 'Cigarrillos', 'Helado']}

Imprima los datos suyos obteniéndolos desde el diccionario:

In [48]:
print("Nombre: {0} \nApellido: {1} \nEdad: {2} \nComida Favorita: {3}".format(dic_class["Nombre"][2], dic_class["Apellido"][2], dic_class["Edad"][2], dic_class["Comida Favorita"][2]))

Nombre: Juan 
Apellido: Londoño 
Edad: 25 
Comida Favorita: Helado


## 3.6. Ejercicios (20 mins)

### 3.6.1. Bad Bunny game

Tome la siguiente frase del cantautor contemporáneo Bad Bunny:

<br>
<center> "Si hay sol hay playa <br>
Si hay playa hay alcohol <br>
Si hay alcohol hay *!#% <br>
Si es contigo mejor" </center>
<br>

Y cambie el segundo, cuarto y sexto "hay" por "poseo". Cambie la palabra "\*!#%" por lo que usted considere. Déjelo todo en mayúsculas.

In [41]:
x = "Si hay sol hay playa, Si hay playa hay alcohol, Si hay alcohol hay *!#%, Si es contigo mejor."

In [42]:
# Separo la frase
y = x.split()

# Cambio las palabras
y[3] = "poseo"
y[8] = "poseo"
y[13] = "poseo"
y[14] = "guayabo tardío,"

# Vuelvo a unir la lista
y = " ".join(y) 

# Volviendo todo en mayúsculas
y = y.upper()

# Imprimo el resultado
print(y)

SI HAY SOL POSEO PLAYA, SI HAY PLAYA POSEO ALCOHOL, SI HAY ALCOHOL POSEO GUAYABO TARDÍO, SI ES CONTIGO MEJOR.


### 3.6.2. Music string

Cree una lista con una estrofa de su canción preferida y extraiga la palabra que más le guste y la posición en la que se encuentra en la lista y la cadena de string.

In [43]:
# Creando el string
lyrics = "Salí con tu mujer ¿Qué? Salí con tu mujer No, yo no estoy creyendo esto Salí con tu mujer No, no Salí con tu mujer Que te perdone Dios, yo no lo voy a hacer Los perdí a los dos y a la misma vez Ya veo que todo era mentira cuando ella me decía Que se iba pa' Puerto Rico a vacaciones con su amiga Me mintió"
# Separando el string para crear una lista
lst = lyrics.split()
# Extrayendo la palabra, la posición en el string y la posición en la lista
print("Respuesta:")
word = "¿Qué?"
res = [word, lyrics.find(word), lst.index(word)]
print(res)
print("\n")
# Mostrando los resultados para entenderse mejor
print("Respuesta detallada:")
print("Mi palabra favorita es: '{0}' \nPosición en string: {1} \nPosición en la lista: {2}".format(res[0], res[1], res[2]))

Respuesta:
['¿Qué?', 18, 4]


Respuesta detallada:
Mi palabra favorita es: '¿Qué?' 
Posición en string: 18 
Posición en la lista: 4


### 3.6.3. Géneros de música

Organice los siguientes géneros de música en orden del que más le guste al que menos le guste de forma categórica:

<br>
<center> Rock, Indie, Reggaeton, Reggae, Música Popular, Vallenato, Pop, Joropo, Carranga, Bachata, Jazz, Electrónica </center>
<br>

Cambie a aquel que menos le gusta con el nombre que usted quiera para mostrarle su desprecio a ese género musical.

In [44]:
generos = ["Rock", "Indie", "Reggaeton", "Reggae", "Música Popular", "Vallenato", "Pop", "Joropo", "Carranga", "Bachata", "Jazz", "Electrónica"]
generos

['Rock',
 'Indie',
 'Reggaeton',
 'Reggae',
 'Música Popular',
 'Vallenato',
 'Pop',
 'Joropo',
 'Carranga',
 'Bachata',
 'Jazz',
 'Electrónica']

In [45]:
generos = ["Rock", "Indie", "Reggaeton", "Reggae", "Música Popular", "Vallenato", "Pop", "Joropo", "Carranga", "Bachata", "Jazz", "Electrónica"]

gen_ordered = pd.Categorical(generos, ordered = True, 
               categories = reversed(["Indie", "Reggaeton", "Pop", "Música Popular", "Electrónica", 
                             "Rock", "Reggae", "Bachata", "Jazz", "Joropo", "Vallenato", "Carranga"]))

print("Mis géneros en preferencia: \n\n", gen_ordered)

Mis géneros en preferencia: 

 ['Rock', 'Indie', 'Reggaeton', 'Reggae', 'Música Popular', ..., 'Joropo', 'Carranga', 'Bachata', 'Jazz', 'Electrónica']
Length: 12
Categories (12, object): ['Carranga' < 'Vallenato' < 'Joropo' < 'Jazz' ... 'Música Popular' < 'Pop' < 'Reggaeton' < 'Indie']


# 4. Matrices

Las matrices son formas de organizar los datos de una manera más estructurada. Se divide en filas y columnas, de tal manera que puede representar multiplicidad de datos. Por ejemplo, puede mostrar qué gasto en comida tuvimos en diferentes fechas: la fila es el gasto en comida y las columnas son diferentes fechas, como se muestra a continuación:

Variable      | 01/01/2022    | 02/01/2022    | 03/01/2022   | ... | DD/MM/AAAA
--------------|---------------|---------------|--------------| --- | -------------
Almuerzo      | 10.000        | 20.0000       | 15.000       | ... | M columnas
Cena          | 7.000         | 5.000         | 10.000       | ... |
...           | ...           | ...           | ...          | ... | 
N filas       |               |               |              |     | Matrix N x M

No osbtante, las matrices pueden representar cualquier tipo de información que querramos estructurar: datos de clientes, reportes financieros, pixeles de una imagen, entre otros. Solamente debemos pensar cómo representarlo.

Normalmente notamos matemáticamente una matriz de dimensión N x M (con N filas y M columnas) de la siguiente manera:

$$A_{N x M}$$

Las matrices son muy importantes en las matemáticas y Big Data, ya que permite realizar operaciones con múltiples datos al tiempo. En ese sentido, nos permite calcular elementos de interés de una manera más rápida y precisa, apoyándonos en el poder computacional que tenemos a la mano. Esta área de la matemática se llama Álgebra Lineal.

Vamos a aprender cómo se maneja una matriz en Python.

## 4.1. Creación de una matriz

In [49]:
# Creación de una matriz desde una lista
M1 = [[8, 14, -6], 
      [12,7,4], 
      [-11,3,21]]
M1

[[8, 14, -6], [12, 7, 4], [-11, 3, 21]]

Aunque no parezca, esto ya es una matriz: cada una de las listas dentro de la lista es una fila. Podemos acceder a sus elementos como mostramos antes:

In [50]:
# Acceder a la primera fila
print("Primera fila: {0}".format(M1[0])) 
print("\n")

# Acceder al primer elemento de la segunda fila
print("Primer elemento de la segunda fila: {0}".format(M1[1][0]))
print("\n")

# Imprimir cada una de las filas
print("Toda la matriz por filas:")
for i in M1:
    print(i)
print("\n")

Primera fila: [8, 14, -6]


Primer elemento de la segunda fila: 12


Toda la matriz por filas:
[8, 14, -6]
[12, 7, 4]
[-11, 3, 21]




Ahora vamos a hacer las cosas más fáciles: vamos a utilizar `numpy`, un paquete especializado para el manejo de datos:

In [51]:
# pip install numpy
import numpy as np # Importamos numpy

M2 = np.array(M1) # Creamos la matriz
M2

array([[  8,  14,  -6],
       [ 12,   7,   4],
       [-11,   3,  21]])

Podemos acceder a sus filas y columnas, como anteriormente hicimos:

In [52]:
# Acceder a la segunda fila
print("Segunda fila: {0}".format(M2[1]))
print("\n")

# Acceder a la primera columna
print("Primera columna: {0}".format(M2[:,0]))
print("\n")

# Acceder al valor del centro
print("Valor del centro: {0}".format(M2[1,1]))

Segunda fila: [12  7  4]


Primera columna: [  8  12 -11]


Valor del centro: 7


 > **Nota:** El truco es en ubicarse en la matriz contando desde cero:

Pos.  | 0   | 1   | 2
------| --- | --- | --
0     | 8   | 14  | -6
1     | 12  | 7   | 4
2     | -11 | 3   | 21

 > Bajo esa lógica podemos ubicarnos en la matriz, sabiendo que dentro de la estructura `[,]`, las filas se eligen a la izquierda de la coma y las columnas a la derecha de la coma. Si se quiere elegir una columna o fila entera, se escriben dos puntos (`:`) en la contraparte, lo que indica que se quieren elegir todos los valores de esa serie.

## 4.2. Modificaciones de las matrices

Podemos modificar las matrices, solamente escogiendo qué valor queremos cambiar:

In [53]:
# Un solo valor
print("Un solo valor: \n{0}".format("-"*20))
print("Original:")
print(M2)
print("\n")

# Cambiamos un valor
M2[2, 1] = -99
print("Modificado:")
print(M2)
print("\n")

# Una fila completa
print("Una fila completa: \n{0}".format("-"*20))
print("Original:")
print(M2)
print("\n")

# Cambiamos una fila
M2[2] = [1, 2, 3]
print(M2)

Un solo valor: 
--------------------
Original:
[[  8  14  -6]
 [ 12   7   4]
 [-11   3  21]]


Modificado:
[[  8  14  -6]
 [ 12   7   4]
 [-11 -99  21]]


Una fila completa: 
--------------------
Original:
[[  8  14  -6]
 [ 12   7   4]
 [-11 -99  21]]


[[ 8 14 -6]
 [12  7  4]
 [ 1  2  3]]


## 4.3. Operaciones con matrices


Las matrices pueden sumarse, restarse, _multiplicarse_, transponerse, entre otros. Solamente se debe tener muy en cuenta las reglas del álgebra lineal en este caso para no entrar en errores:

### 4.3.1. Pequeño ejercicio

Cree dos matrices con nombre M1 y M2, ambas con dimensión 3x3. La primera con números del 1 al 9 y la segunda del 10 al 18.

In [54]:
import numpy as np

# Creando las matrices
M1 = np.array([[1, 2, 3],
               [4, 5, 6],
               [7, 8, 9]])

M2 = np.array([[10, 11, 12],
               [13, 14, 15],
               [16, 17, 18]])

print("{0}\n\n{1}".format(M1, M2))

[[1 2 3]
 [4 5 6]
 [7 8 9]]

[[10 11 12]
 [13 14 15]
 [16 17 18]]


Las operaciones más básicas (**suma y resta**) se realizan como cualquier otra operación aritmética:

In [55]:
print("Suma:")
print(M1 + M2)

print("Resta:")
print(M1 - M2)

Suma:
[[11 13 15]
 [17 19 21]
 [23 25 27]]
Resta:
[[-9 -9 -9]
 [-9 -9 -9]
 [-9 -9 -9]]


La **transposición** (convertir las filas en columnas y las columnas en filas) no es tampoco complicado:

In [56]:
print("Original:")
print(M1)
print("\n")

print("Transpuesta:")
print(M1.transpose())

Original:
[[1 2 3]
 [4 5 6]
 [7 8 9]]


Transpuesta:
[[1 4 7]
 [2 5 8]
 [3 6 9]]


La **multiplicación** tiene sus reglas, por lo cual debe hacerse con cuidado. Se debe tener en cuenta que con dos matrices $A_{MxN}$ y $B_{KxL}$, solamente pueden realizar **multiplicación punto** si las dimensiones $N$ de $A$ y $K$ de $B$ son iguales. En otra notación, $N = K$.

Es decir, si tenemos $A_{3x4}$ y $B_{4x1}$, la multiplicación punto se puede realizar, ya que $N = K = 4$. Por el contrario, si tenemos $A_{3x4}$ y $B_{2x3}$, no se puede realizar la multiplicación, ya que $4 = N \neq K = 2$. Otro ejemplo son las siguientes matrices:

\begin{bmatrix}
a_{11} & a_{12} & a_{13} \\
a_{21} & a_{22} & a_{23}
\end{bmatrix}

\begin{bmatrix}
a_{11} & a_{12}\\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{bmatrix}

Si ya comprobamos eso, ya podemos multiplicar matrices evitando que nos surja un error. En este caso, ambas matrices son cuadradas de las mismas dimensiones, entonces no hay problema.

In [57]:
M3 = M1.dot(M2)
print(M3)

[[ 84  90  96]
 [201 216 231]
 [318 342 366]]


### 4.3.2. Ejercicio (5 mins)

Construya dos matrices diferentes $2x2$ que, sumadas, den como resultado una matriz con todos los números iguales por columnas, pero intercalados en signo. Es decir, un ejemplo genérico es el siguiente:

\begin{bmatrix}
A  & -B & C  \\
-A &  B & -C \\
A  & -B & C
\end{bmatrix}


In [58]:
# Creando las matrices
M1 = np.array([[1, -2, 3],
               [1,  4, -2],
               [7, 8, 9]])

M2 = np.array([[0, -2, 1],
               [-2, 0, -2],
               [-6, -12, -5]])

# Sumando
print(M1 + M2)

[[ 1 -4  4]
 [-1  4 -4]
 [ 1 -4  4]]


## 4.4. Matriz inversa y matriz identidad

La matriz inversa de una matriz es aquella que, multiplicada por la matriz original, genera una matriz identidad:

$$ AA^{-1} = I $$

Tal que la matriz identidad se define como una matriz cuadrada de la siguiente manera:

\begin{bmatrix}
1 & 0 & ... & 0\\
0 & 1 & ... & 0\\
... & ... & ... & ...\\
0 & 0 & ... & 1\\
\end{bmatrix}

La matriz identidad algo similar a lo que ocurre cuando multiplicamos un número por su inverso. Supongamos

$$ x = 8 $$

El inverso es

$$ x^{-1} = \frac{1}{8} $$

Cuando lo multiplicamos, encontramos el número identidad (el número 1):

$$ x * x^{-1} = 8 * \frac{1}{8} = 1 $$

La **matriz identidad** es lo mismo: una matriz cuadrada con una diagonal de unos y demás entradas en 0 que, multiplicada por una matriz A, obtiene la misma matriz A:

$$ AI = A $$

In [59]:
M1 = np.array([[3, 4, 9],
               [2, 5, 7],
               [8, 1, 2]])

print("Original:")
print(M1)
print("\n")

print("Matriz inversa:")
M1_inv = np.linalg.inv(M1) # Invierte la matriz
print(M1_inv)
print("\n")

print("Test: \n{0}".format(np.dot(M1, M1_inv)))
print("\n")

print("Matriz identidad:")
M1_id = np.identity(3) # Crea una matriz identidad de 3x3
print(M1_id)
print("\n")

print("Test: \n{0}".format(np.dot(M1, M1_id)))

Original:
[[3 4 9]
 [2 5 7]
 [8 1 2]]


Matriz inversa:
[[-0.024 -0.008  0.136]
 [-0.416  0.528  0.024]
 [ 0.304 -0.232 -0.056]]


Test: 
[[ 1.00000000e+00  2.22044605e-16 -6.93889390e-18]
 [-1.66533454e-16  1.00000000e+00  6.93889390e-18]
 [ 0.00000000e+00  0.00000000e+00  1.00000000e+00]]


Matriz identidad:
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


Test: 
[[3. 4. 9.]
 [2. 5. 7.]
 [8. 1. 2.]]


> **Aclaración:** En el caso de la matriz inversa, la multiplicación punto debería quedar con 0's en aquellas entradas que no son la diagonal, pero se acerca mucho. Esto se debe a que los programas no toman todos los decimales por términos de ahorro de procesamiento, pero es muy cercano.

> **Nota:** para que una matriz sea invertible debe tener **rango completo**. Eso significa que todas las columnas (o filas) deben ser lineamente independientes. Esto se puede comprobar con el determinante de la matriz.

### 4.4.1. Ejercicio (5 mins)

Eleve al cuadrado la siguiente matriz:

In [60]:
M1 = np.array([[3,  4, 3],
               [2, 10, 7],
               [12, 1, 2]])

In [61]:
# Método 1: manual con numpy
res = np.dot(M1, M1)
print(res)
print("\n")

# Método 2: método específico de numpy
res = np.linalg.matrix_power(M1, 2)
print(res)

[[ 53  55  43]
 [110 115  90]
 [ 62  60  47]]


[[ 53  55  43]
 [110 115  90]
 [ 62  60  47]]
