# Programa Ingenias+ Data Science

Antes de poder sumergirnos de lleno en aprender conceptos especificos del mundo de Data Science, hay una habilidad que debemos adquirir o mejorar: **Programación**. De todos los lenguajes de programación existentes, hay dos que dominan el mundo de Data Science.  
El primero de ellos es **R</t>**, un lenguaje que se utiliza mucho en investigación y estadistica. El otro es **Python**.
Si bien ambos son muy utiles, **Python** es el más utilizado hoy en día, y debido a esto más módulos han sido desarrollados.

Uno de los motivos por el cual Python ha crecido en los ultimos años es su gran comunidad de código abierto. Existen muchos eventos a los que se puede asistir para aprender más acerca de lo que se trabaja en Python. Todos ellos son inclusivos y abiertos al público.

# Clase 1: Introducción a Python

Python es un lenguaje de programación de propósito general muy poderoso y flexible, a la vez que sencillo y fácil de aprender.

**¿Donde recurro cuando estoy trabada o no se qué hacer?**

Python posee una amplia documentación que nos permite investigar cada función que contiene el lenguaje. Podes chequearla [acá](https://docs.python.org/3/)

Otra fuente para obtener respuestas es [Stackoverflow](https://es.stackoverflow.com/) o por supuesto, Google.

## Conceptos básicos de Python

En estas clases utilizaremos **Jupyter Notebook**. La ventaja de jupyter notebook es que permite mezclar celdas `Markdown` con celdas de código.

1) **Markdown** es un lenguaje de marcado que permite dar formato a un texto de manera rápida y fácil.

Para utilizarlo debes seguir ciertas convenciones que puedas consultar en la siguiente página web: [Guía Markdown](https://joedicastro.com/pages/markdown.html)

2) Por otro lado, en las celdas de código es donde vamos a escribir el código **Python**.  

Prestale atención a los corchetes que se encuentran al lado de cada celda de Python. Cuando tienen un número significa que esa celda ha sido corrida. Cuando tienen `*` implica que la celda esta corriendo.

Python posee una guía de estilo, que si bien no es obligatoria, se **RECOMIENDA** seguir. Podes leer acerca de las convenciones establecidas en el [PEP8](https://www.python.org/dev/peps/pep-0008/).

La filosofía de Python hace hincapié en una sintaxis que favorezca un código legible. Esta filosofía se resumen en lo que se conoce como el **ZEN de Python**.

In [None]:
#Corre esta linea para descubrir el zen de Python
import this

Empecemos con una función muy simple de Python: `print()`. Esta función imprime la variable que se le pase.

In [None]:
#Corre esta celda para descrubir el output
print("Python es muy fácil de aprender")

### Sintaxis: Indentación y Comentarios

La clave de la sintaxis de Python es la INDENTACIÓN. La indentación es la sangría inicial de un bloque de código, compuesta por 4 espacios o un tab

In [None]:
def suma(a, b):
    # esta linea suma a y b
    c = a + b
    # esta linea suma a y c
    d = a + c
    return c

def resta(a, b):
    return a - b

In [None]:
resta(1, 2)

In [None]:
# esto es un comentario
print(1)

El simbolo `#` se utiliza para determinar un comentario. Esto significa que al verlo, Python entendera que esa línea no corresponde a código que debe correrse.

Comentar el código es una practica muy útil para explicar que hace una linea de código. La convención es que el comentario se haga en la línea anterior a la linea de código correspondiente.

In [None]:
#Reemplaza las lineas de puntos con la función correspondiente.
print(100*(1.1**7))

## Variables y Estructura de datos

### Asignación de variables:

En Python, una variable permite referir a un valor utilizando un nombre en especifico. Para crear una variable, se debe usar `=` como en el siguiente ejemplo:

In [None]:
mi_numero = 8

In [None]:
print(mi_numero)

Ahora, sigue las instrucciones de los comentarios.

In [None]:
#Asigna 100 a la variable mi_variable
mi_variable = 100

In [None]:
#Muestra el contenido de la variable
print(mi_variable)

In [None]:
mi_numero = 20

In [None]:
print(mi_numero)

Las variables pueden ser llamadas posteriormente. Además podemos realizar calculos y operaciones con ellas.

In [None]:
#Crea una variable llamada factor que contenga el numero 1.1
factor = 1.1

#Calcula el resultado de elevar a la 7 la varible factor multiplicarla
#por el numero contenido en mi_varible y asignala a una nueva variable
#llamada resultado
resultado = factor**7*mi_variable
#Imprime el resultado
print(resultado)

Hay ciertas reglas que se deben cumplir a la hora de declarar una variable:  

- Los nombres de las variables siempre aparecen a la izquierda de `=`.
- Python diferencia mayusculas de minusculas en el nombre de las variables.
- Los nombres de las variables DEBEN comenzar con una letra. Luego pueden contener nombres y guiones bajos `_`. Pero no pueden contener caracteres especiales (como por ejemplo, `&`, `*`, `#`, etc).
- Si bien Python no le importa como llames a tus variables, los nombres de las variables deben ser descriptivos de los valores o datos que contienen para que otras personas puedan interpretarlo.
- Lee más acerca de estas convenciones en el **PEP8**.

**PALABRAS RESERVADAS**: Hay 33 palabras que no podes utilizar como nombres de variables, debido a que estan reservadas para el lenguaje ya que cumplen una función particular en Python.

_Ellas son_: False, None, True, and, as, assert, break, class, continue, def, del, elif, else, except, finally, for, from, global, if, import, in, is, lambda, nonlocal, not, or, pass, raise, return, try, while, with, yield



In [None]:
#Corre el siguiente codigo y observa que pasa
try = 6

### Tipo de Variables:

Python nos provee una función útil para chequear que tipo de variable contiene cada variable definida: `type()` [Chequea la documentación](https://docs.python.org/3/library/functions.html?highlight=type#type).

### ENTEROS

El primer tipo de datos que podemos tener son enteros, que corresponde al tipo `int` en Python.

In [None]:
#Declara la variable mi_numero y asignale el numero 4
mi_numero = 4

#Declara la variable otro_numero y asignale el numero -1
otro_numero = -1

#Chequea que tipo de variables son mi_numero y otro_numero
print(type(mi_numero))
print(type(otro_numero))

In [None]:
#Imprime el resultado de multiplicar mi_numero y otro_numero
print(mi_numero*otro_numero)

### FLOTANTES

Además de enteros, los datos también pueden ser de tipo flotantes. Esto es pueden contener numeros como `5.5`, `7.7`, `9014019401.43`. Este tipo de variable corresponde a `float` en Python.

In [None]:
#Declara la variable float_numero y asignale el numero 4.9
float_numero = 4.9

#Chequea que tipo de variable es float_numero
print(type(float_numero))

In [None]:
#Imprime el resultado de elevar float_numero a mi_numero, declarado anteriormente
print(float_numero**mi_numero)

### BOOLEANAS

Una variable booleana es una variable lógica que admite solo dos valores `True` y `False`.

In [None]:
#Corre la siguiente linea
mi_bool = True

In [None]:
#Ahora asigna a la variable otra_bool el valor False
otra_bool = False

In [None]:
#Chequea que tipo de variables son mi_bool y otra_bool
print(type(mi_bool))
print(type(otra_bool))

Pese a que las variables booleanas son definidas con los valores `True` y `False`, Python las trata como numeros.

In [None]:
#Prueba que ocurre si sumamos mi_bool y otra_bool
mi_bool + otra_bool

Así es Python devolvera un numero. En lugar de utilizar el operador suma, podemos utilizar los operadores lógicos: `&` o `and`, `|` o `or`, y `not`.

In [None]:
#Aplica el operador and o & entre las variables mi_bool y otra_bool
mi_bool and otra_bool

In [None]:
#Aplica el operador or o | entre las variables mi_bool y otra_bool
mi_bool or otra_bool

In [None]:
#Aplica el operador not a la variable mi_bool
not mi_bool

### SECUENCIA DE CARACTERES O STRINGS

La secuencia de caracteres o `string` es otro tipo de datos que podemos encontrar en Python. Estas variables poseen de particular que se definen utilizando comillas, como en el ejemplo siguiente:

In [None]:
#Corre las siguientes lineas
mi_frase = "Aprender Python es muy sencillo"
segunda_frase = 'Solo hay que practicar'
print(mi_frase)
print(segunda_frase)

In [None]:
mi_frase = 'esta es una frase"

##### Comillas

Como habras observado arriba, se pueden utilizar comillas dobles como simples para definir strings. La regla es que utilices las mismas comillas para **abrir y cerrar** el string.

In [None]:
#Define un string que quieras y asignaselo a la variable mi_primer_string
mi_primer_string = "Aca va un string"

#Imprime la variable mi_primer_string
print(mi_primer_string)

In [None]:
#Define un segundo string y asignaselo a la variable segundo_string
segundo_string = "Aca va otro string"

In [None]:
#Ahora aplica el operador suma (+) entre las dos variables y fijate que pasa
mi_primer_string + segundo_string

Como observaste los strings también pueden sumarse, o en terminos más correctos, concatenarse.

Python también nos permite acceder a un elemento del string o una porción de él. Esto se realiza mediante el uso de **indices** que se especifican con corchetes `[]`.

In [None]:
#Defino un string
prueba_indice = "Acceder a un caracter es facil"
print(prueba_indice)

In [None]:
print(prueba_indice[22])

In [None]:
prueba_indice[0]

In [None]:
#Accedo al cuarto caracter
prueba_indice[3]

**¿Observaste bien?** Si especifico el indice 3, me trae el 4to caracter. Esto es porque en Python los indices comienzan en 0. Entonces, el primer caracter tiene indice 0, el segundo 1 y asi sucesivamente.

In [None]:
#Accede al octavo caracter del string prueba_indice
print(prueba_indice[7])

#Accede al quinto caracter del string prueba_indice
print(prueba_indice[4])

También es posible acceder a una porción del string. Esto se hace utilizando también corchetes `[]`, pero se especifica el indice donde comienzo, luego `:` y luego el indice donde termino.

In [None]:
#Corre la siguiente linea
print(prueba_indice[8:22])

In [None]:
print(prueba_indice[::-1])

**¿Notaste algo en particular?** Para poder traer la porción entre el 9no y el 22do caracter, debo especificar el caracter donde comienza (`8`) y la posición donde termina (`21`).   
Sin embargo, especificamos 22. ¿Por qué? Porque Python **SIEMPRE excluye** la última posición que le especifiquemos. Entonces si especificamos hasta 21, traera hasta el 20. Si queremos hasta el 21 inclusive, debemos colocar 22 entonces.

In [None]:
#asigna el string a la variable mi_frase_prueba
mi_frase_prueba = "Es esencial que leas mucho"
mi_segunda_prueba = "Para muchos era invisible aunque sus ojos se destacaban"

In [None]:
#Selecciona el substring esencial de la variable mi_frase_prueba y asignalo a la variable primera_palabra
primera_palabra = mi_frase_prueba[3:11]

#Selecciona el substring invisible de la variable mi_segunda_prueba y asignalo a la variable segunda_palabra
segunda_palabra = mi_segunda_prueba[16:25]

#Selecciona el substring ojos de la variable mi_segunda_prueba y asignalo a la variable tercera_palabra
tercera_palabra = mi_segunda_prueba[37:41]

In [None]:
#Concatena los strings "Lo", primera_palabra, "es", segunda_palabra, "a los", tercera_palabra.
#Imprime el resultado. No te olvides de especificar espacios usando el string " "
print("Lo"+" "+primera_palabra+" "+"es"+segunda_palabra+" "+"a los"+" "+tercera_palabra)

In [None]:
#Ahora concatena tercera_palabra y la variable mi_numero definida anteriormente
tercera_palabra + mi_numero

Como podrás ver no es posible concatenar variables de distintos tipos. Sin embargo, hay algunas funciones que nos brinda Python que nos permiten transformar entre tipos de variables.

- `str()` convierte a string una variable o valor

In [None]:
print(mi_numero)

In [None]:
#Aplica la función str a la variable mi_numero y guardala en la variable mi_numero_str
mi_numero_str = str(mi_numero)

In [None]:
print(type(mi_numero_str))

In [None]:
#Concatena tercera_palabra y mi_numero_str
tercera_palabra + mi_numero_str

- `int()` convierte a entero una variable o valor

In [None]:
int("4")

In [None]:
#Aplica la función int a mi_numero_str y multiplicalo por 5
int(mi_numero_str) * 5

Otras funciones similares son: [`float()`](https://docs.python.org/3/library/functions.html#float) y [`bool()`](https://docs.python.org/3/library/functions.html#bool).

#### Inmutables

Todos los tipos de variables que vimos hasta ahora son **inmutables**. Esto significa que no pueden ser alteradas después de haber sido creadas.

In [None]:
#Corre la siguiente linea y observa que occurre
variable_inmutable = "Los strings son inmutables en Python"
variable_inmutable[8] = "f"

In [None]:
from datetime import datetime

In [None]:
mi_fecha = '2021-2-23'

In [None]:
datetime(mi_fecha)

Lo que nos dice el error, es que una vez asignada una variable, no puedo cambiar parte de ella.

Además de los mencionados hasta ahora, Python nos ofrece otras estructura de datos que son más flexibles y permiten agrupar varios valores. Además muchas de ellas son mutables, es decir, permiten que asignemos o alteremos valores una vez definidas.

### LISTAS

Una lista es una collección **mutable** de elementos **ORDENADOS**, que pueden ser de distinto tipo. Las listas se crean utilizando corchetes como en el ejemplo.

In [None]:
#Corre la siguiente linea para declarar la lista mi_lista
mi_lista = ["mi", "lista", 3, 4.5, True]

#Muestra el contenido de la variable mi_lista
print(mi_lista)

#Chequea el tipo de variable de mi_lista
print(type(mi_lista))

In [None]:
print(mi_lista)

In [None]:
#Define una lista que contenga 10 elementos y asignaselos a la variable primer_lista
primer_lista = [3, 4, 5, 14, "hola", "chau", "rojo", False, "AZUL", True]

Para poder acceder a un elemento en una lista, vamos a usar indices al igual que lo hicimos con los strings. También podemos obtener parte de la lista usando la notación `lista[n:m]` como lo hicimos en los strings.  
Algo que no dijimos es que si omito el primer indice, `lista[:m]`, esto indica que mi substring comienza con el indice 0, y si omito el segundo indice `lista[n:]` indica que mi substring va hasta el final de la lista.

In [None]:
#Imprime el cuarto elemento de la lista primer_lista
print(primer_lista[3])

In [None]:
#Imprime el resultado de sumar los numeros 2 y 4 contenidos en la siguiente lista
mis_numeros = [3, 5, 6, 4, 21, 2, 5]

print(mis_numeros[3]+mis_numeros[5])

In [None]:
primer_lista[5] = 4

In [None]:
print(primer_lista)

Hasta ahora vimos solo como acceder utilizando indices positivos, pero también podemos acceder usando **indices negativos**. El último caracter tendra el indice -1, el anteultimo -2 y así sucesivamente.

In [None]:
#Imprime el ultimo elemento de la lista primer_lista
primer_lista[-1]

In [None]:
#Imprime la sublista que va desde el cuarto elemento hasta el sexto elemento inclusive de la lista primer_lista
primer_lista[3:6]

In [None]:
#Imprime la sublista que contenga los primeros cinco elementos de primer_lista
print(primer_lista[:5])

#Imprime la sublista que contenga los últimos cinco elementos de primer_lista
print(primer_lista[-5:])

La función `len()` nos permite saber cuantos elementos hay en una lista.

In [None]:
#¿Cuantos elementos hay en la siguiente lista?
elementos_listas = [12, 241, 141, 5151, "hola", "python", 41, 141, "data science", "mujeres", True, 343.98,
                    "hallway", 11.25, "kitchen", 18.0,
                    "living room", 20.0, "bedroom", 10.75, "bathroom", 9.50]

#Numero elementos en lista
len(elementos_listas)

El operador `in` nos permite saber si un elemento esta en una lista.

In [None]:
#Chequea si False esta en elementos_lista
False in elementos_listas

Dijimos que las listas son estructuras de datos que pueden alterarse, o son mutables. Eso significa que podemos reasignar valores una vez definida la lista. Para esto especificamos usando el indice que elemento(s) queremos redefinir y le asignamos un nuevo valor.

In [None]:
#Imprime el quinto elemento presente en elementos_lista
elementos_listas[4]

In [None]:
#Asigna ahora el valor "chau" al quinto elemento de elementos_lista
elementos_listas[4] = 'chau'

In [None]:
#Imprime la lista elementos_lista
print(elementos_listas)

Las listas también se pueden concatenar utilizando el operador `+`.

In [None]:
#Concatena las listas elementos_listas y primer_lista. Asignaselo a la variable nueva_lista
nueva_lista = elementos_listas + primer_lista

#Imprime nueva_lista
print(nueva_lista)

### Diccionarios

Otra estructura de datos muy útil son los diccionarios. Los diccionarios en Python son un tipo de estructuras de datos que permite guardar un conjunto **no ordenado** de pares **clave-valor**, siendo las claves únicas dentro de un mismo diccionario (es decir que no pueden existir dos elementos con una misma clave).

En Python, los diccionarios se definen utilizando llaves `{}` y cada uno de los elementos estan separados por comas. Cada elemento lo definimos con su par clave:valor, pudiendo ser la clave y el valor de cualquier tipo (`int`, `float`, `string`, `bool`).

In [None]:
diccionario = {
    #clave : valor
    'Alberto' : [10, 87, True],
    'John' : False,
    'Juan' : 12,
    'Amanda' : [43, 5],
    'Maria': 45
}

In [None]:
dictionary = {
    9 : 'hola'
}

In [None]:
dictionary[9]

In [None]:
#Corre la siguiente linea y observa el resultado
diccionario.keys()

Para acceder a los valores, se hace mediante la clave utilizando también corchetes.

In [None]:
#Imprime los valores asociados con la clave 'Alberto'
print(diccionario['Alberto'])

In [None]:
#Corre la siguiente linea y observa el resultado
diccionario.values()

## Operadores Aritmeticos

Python puede usarse para hacer calculos básicos. Veamos alguna de las funciones que pueden ser utilizadas en Python.

In [None]:
#Suma
print(4 + 3)
#Resta
print(5 - 2)
#Multiplicacion
print(3 * 5)
#División
print(10 / 2)

In [None]:
#Corre las siguientes celdas y descubre que funciones se utilizan
print(4 ** 2)
print(18 % 7)
print(7//2)

### EXPLICACION
**La primera funcion es la potenciación esto es $4^2$**

**El operador % devuelve el resto de la division, en este caso entre 18 y 7**

**El operador // devuelve el cociente de la division entre 7 y 3**

Supongamos que tenemos \$100, que podemos invertir obteniendo el 10\% de interes cada año. Luego del primer año, tendremos 100\*1.1, luego de dos años tendremos 100\*1.1\*1.1.
**¿Cuanto tendrás luego de 7 años?**

Veremos tipos de operadores que nos permiten realizar comparaciones entre variables o valores.

### Operadores de comparación

Hay varios operadores en Python que nos permiten comparar variables o estructura de datos. Observemos la siguiente lista:

`==` : los valores son iguales (**OJO!** Es común confundirse y usar `=`, pero acordate que este es usado para asignar variables)  
`!=` : los valores no son iguales  
`<` : el valor a la izquierda es menor que el valor a la derecha  
`>` : el valor a la izquierda es mayor que el valor a la derecha  
`<=` : el valor a la izquierda es menor o igual que el valor a la derecha  
`>=` : el valor a la izquierda es mayor o igual que el valor a la derecha  

In [None]:
print(mi_bool)

In [None]:
print(otra_bool)

In [None]:
#Chequea si las variables mi_bool y otra_bool que definiste mas arriba son iguales
mi_bool == otra_bool

In [None]:
mi_bool and otra_bool

In [None]:
mi_bool or otra_bool

In [None]:
print(float_numero)

In [None]:
#Chequea si la variable float_numero es mayor a 4
float_numero > 4

In [None]:
#Chequea si la longitud de la variable primer_lista es mayor o igual que la longitud de elementos_listas
len(primer_lista) >= len(elementos_listas)

In [None]:
#Chequea si el cuarto elemento de elementos_listas es menor o igual a multiplicar mi_numero por el segundo valor
#asociado a la clave Alberto de diccionario
elementos_listas[3] <= mi_numero * diccionario['Alberto'][1]