<a href="https://colab.research.google.com/github/joaquinmenendez/curso_phyton/blob/master/Propuesta_curso.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#  Introducción a Python para ciencia de datos e IA
Docentes a cargo: [Joaquín Menéndez](https://www.linkedin.com/in/joaquin-menendez/) y Fernando Binder

Tanto este curso como el curso `Exploración y visualización de datos en Python` pueden accederse en el siguiente repositorio [JIS-2020](https://github.com/joaquinmenendez/JIS-2020)

## Temas
1. Python. 
    - ¿Qué es?
    - ¿Cómo instalarlo?
    - Notebooks y IDE (Integrated Development Enviroment)
2. Tipos de datos y estructuras de datos.
    - **int**, **float**, **string**, **bool**
    - **list**, **tuple**, **dictionary** , **set**
3. Condicionales y Bucles (o loops)
    - **if**
    - **for** y **where**
4. Funciones 
    - Importar librerias
    - Instalar librerias
    - Entornos virtuales o `Virtualenv`
5. Manipulación de Archivos en Python
    - `os`, `shutil` y `magic methods`
6. Programación Orientada a Objeto (OOP)
    - Definir una clase
    - Metodos de clase
    - Herencia de clase

## Links útiles
- [Anaconda](https://www.anaconda.com/products/individual)
- [Google Colab](https://colab.research.google.com/)
- [2 meses grátis de Datacamp](https://docs.microsoft.com/en-us/visualstudio/subscriptions/vs-datacamp)
- [StackOverflow](https://stackoverflow.com/)
- [Python (documentación)](https://python-reference.readthedocs.io/en/latest/index.html#)
- [Slicing](https://python-reference.readthedocs.io/en/latest/docs/brackets/slicing.html)



# 1. Python

**Primero que nada...¿Qué es Python?**

Python es un lenguaje de programación interpretado de tipado dinámico cuya filosofía hace hincapié en una sintaxis que favorezca un código legible. Se trata de un lenguaje de programación multiparadigma y disponible en varias plataformas.

En criollo, Python es:

- Interpretado: Se ejecuta sin necesidad de ser procesado por un compilador y se detectan los errores en tiempo de ejecución.
- Multiparadigma: Soporta diferentes tipos de programación, Ej: funcional, imperativa y orientada a objetos. En este curso veremos principalmente las dos primeras, pero siempre estaremos interactuando con objetos. Un poco de esto más adelante.
- Tipado dinámico: Las variables se comprueban en tiempo de ejecución. No es necesario definir qué tipo de datos vana contener nuestras variables. Si alguna vez programas en C, C++ o Java (te compadezco) tendras experiencia con esto.
- Multiplataforma: disponible para plataformas de Windows, Linux o MAC.
- Gratuito: Otros lenguajes como MATLAB requieren licencias pagas.


**¿Por qué Python?**
- Elegante, sencillo, fácil de aprender
- Una gran comunidad, abundante documentacion y ejemplos
- La mayoria del estado del arte en Machine Learning, Deep Learning y Data Science es en este lenguaje

**¿Cómo empiezo a usarlo?**

Hay muchas formas en que uno puede programar. Algunas personas disfrutan haciendo todo desde la consola, usando algun software como [EMACS](https://www.tldp.org/HOWTO/Emacs-Beginner-HOWTO-2.html).<br>
Otras personas disfrutan programando exclusivamente en notebooks como la que estas viendo ahora.<br>
Otros disfrutan usando un IDE (Integrated development environment). <br>
Si no tenes experiencia prevía recomendamos empezar con esta última opción.<br>

**Ejemplos de IDE :**
- Pycharm
![img](https://user-images.githubusercontent.com/43391630/94975828-eb316380-04e0-11eb-83da-dd757e79f6c9.png)

- Spyder
![img](https://user-images.githubusercontent.com/43391630/94975800-cd63fe80-04e0-11eb-9868-12a9acbe609a.png)

- Jupyter Notebook 

Esto es una _notebook_ del entorno Jupyter (en este caso usamos Google Colaboratory, una versión online gratuita).

Cada una de estas _celdas_ funciona como un bloque donde podemos escribir texto plano, Latex, HTML, además de ejecutar código Python, R, bash y otros. 

$$ \text{Esto esta escrito en } \LaTeX{}$$
$$\sum{x^2 + \sqrt{\dfrac{1}{9}}} $$

In [None]:
print('Esta celda ejecuta Python!!!')

In [None]:
#Esto es un comentario. Python no reconoce nada de lo que aparece a la derecha de un #

Jupyter Notebooks es una interfaz incluida en la instalación de Python ampliamente usada para Data Science. Si queres descargar todo lo necesario para empezar a usar Python y demas podes sencillamente instalar el gestionador de enviroments [Anaconda](https://www.anaconda.com/products/individual"/) el cual se encarga de instalar todo por vos. 

# 2. Tipos de datos o variables


### Tipos mas comunes de variables

In [None]:
# String
var1 = 'Esto es una string'

# Numeric
## Integer
var2 = 5
## Float (o numerico de precision)
var3 = 5.1

## Boolean (o valores lógicos)
var4 = True

In [None]:
var1, var2, var3, var4

Es importante conocer los types de nuestras variables porque todo es un Objeto o Clase en python. Este concepto es un poco mas avanzado, y no vamos a indagar mucho en este curso, pero la idea principal es que objetos diferentes van a poder hacer cosas distintas. Y dado que cada tipo de variable es una `clase` diferente de objeto van a tener diferentes propiedades o `metodos`. Las palabras que aparecen `asi` son conceptos técnicos, o a veces referirán a nombres de variables.

Si queres saber un poco más acerca de qué es esto de ['Todo es un Objeto'](https://es.wikibooks.org/wiki/Python/Su_primer_programa_en_Python/%C2%BFQu%C3%A9_es_un_objeto%3F#:~:text=Todo%20en%20Python%20es%20un,todo%20tiene%20atributos%20y%20m%C3%A9todos.&text=Los%20diferentes%20lenguajes%20de%20programaci%C3%B3n,los%20objetos%20pueden%20tener%20subclases.)

In [None]:
# Ej: Métodos para nuestros distintos tipos de variables 
var1.upper()

In [None]:
# Qué pasa si queremos hacer lo mismo con un Integer???
var2.upper() 

In [None]:
# Podemos sumar integers y float. Esto tiene sentido ya que ambos son numeros.
var2 + var3

In [None]:
# Cambiemos el True por False. Tan sencillo como:
not(var4)

Como vemos cada tipo va a tener diferentes funciones asociadas. No podemos realizar las mismas operaciones con una variable numerica que con un string por ejemplo. Para ver con mas detalle las diferentes funciones asociados con los tipos de variables consultar la [documentacion](https://python-reference.readthedocs.io/en/latest/basic_data_types.html)

In [None]:
type(var1)

`type` es una `palabra reservada` de Python. Esto quiere decir que es una `función` que vienen por defecto en el paquete standard de Python.<br>
En este caso `type` nos permite saber el tipo de variable dentro de los parentesis.
Lista de palabras reservadas: 
>['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']

In [None]:
# help es una funcion incorporada que nos permite acceder a la documentacion de diversas funciones. 
# En la celda 2 usamos una de estas palabras reservadas, vamos a ver que dice la documentación
help(print)

In [None]:
# Si queremos conocer en mas detalle una variable podemos usar el simbolo ? al final. Esto nos dira el tipo de variable y otros datos asociados
var1?

Va a haber momentos en que queramos usar funciones especificas que no vienen incluidas en nuestra libreria standard. En esos casos vamos a **instalar e importar** las librerías.<br>
Por suerte Colab viene con una gran cantidad de librerias ya incluidas. De cualquier manera, si queres ver esto en mas detalla haz click en el link:<br>
[Instalar librerias y Python en Windows](https://data-flair.training/blogs/install-pandas-on-windows/)


A veces nos vamos a encontrar con casos en los cuales queremos transformar una variable de un tipo a otro. Python nos permite hacer esto muy facilmente:

In [None]:
int(1.56)

In [None]:
float(7)

In [None]:
type('123')

In [None]:
type(int('123'))

In [None]:
str(int('123'))

### Operadores

Si bien los tipos de variable booleans admiten solamente dos valores (True o False), hay una serie de operadores que vamos a poder utilizar (dependiendo el tipo de variable) para realizar una evaluacion lógica, arrojando como resultado un valor de verdad, o en otras palabras, un boolean. 

Los operadores disponibles son:

Relacionales (aplicable a tipos de variable no booleanas):

- \>= , <=, <, > : Mayor o igual, menor o igual, mayor o menor
- != , == : Distinto, Igual
- in : Contenido en (dentro de)

Lógicos (aplicable solo a variables booleanas):
- not o ~ : Negación
- and o & : Ambas verdaderas
- or o | : Una u otra es verdadera




In [None]:
5 > 6

In [None]:
'VARIABLE' == 'VARIABLE'

In [None]:
1.0 in [1.0, 2.0 , 3.0]

In [None]:
True and False

In [None]:
(5 > 4) and (5 > 6)

### Secuencias 

Una `string` es un tipo de variable que corresponde a esta categoria, lo mismo sucede con las lista y tuplas. Si bien va a haber acciones comunes en todas las secuencias, va a haber otras que van a depender del tipo de variable de mi secuencias.

In [None]:
# Ejemplo uns string
palabra = 'Hospital'

In [None]:
# Poseeo metodos específicos para actuar sobre ellas
palabra.replace('s',"SSS")

In [None]:
# Al mismo tiempo puedo realizar operaciones. Estas van a depender nuevamente de mi tipo de variable
'las strings se pueden' + ' sumar/concatenar' 

In [None]:
'pero no se pueden' - ' restar'

**Slicing**

Las secuencias permiten ser indexadas, o en otras palabras, seleccionar N elementos de las mismas. Python nos permite una gran flexibilidad para hacer esto. Veamos como:
![Indexing](https://user-images.githubusercontent.com/43391630/94975818-dc4ab100-04e0-11eb-85ab-b58939445f1b.png)

In [None]:
# Entonces si queremos seleccionar la primer letra harems
palabra[0]

**Atención** los indices (el numero que corresponde a la posicion de un elemento en una sequencia) en Python empiezan en el 0. <br>
Para recordarlo pensemos en un ascensor, el primer elemento en vez de ser `primer piso` es `planta baja`(es decir 0)

In [None]:
# Tambien podemos indexar hacia atras
palabra[-1]

**Ejercicio** 

Seleccionar todas las vocales de la variable `palabra`


In [None]:
print(palabra)

**Ejercicio**

Imaginemos que queremos contar cuantas comas (,) hay en un corpus de texto.<br>
¿Cómo lo harias? Sugerimos que chusmees la [documentación](https://docs.python.org/es/3.8/library/string.html) <br>
pd: son 10

In [None]:
pal_larga = "The string module contains a number of useful constants and classes, as well as some deprecated legacy functions that are also available as methods on strings. In addition, Python’s built-in string classes support the sequence type methods described in the Sequence Types — str, unicode, list, tuple, bytearray, buffer, xrange section, and also the string-specific methods described in the String Methods section. To output formatted strings use template strings or the % operator described in the String Formatting Operations section. Also, see the re module for string functions based on regular expressions."

In [None]:
#imprime la cantidad de comas en la variable `pal_larga`


---

### Listas

Las listas en Python son una secuencia de valores los cuales pueden ser de cualquier tipo, cadenas, números, floats, contenido mixto o lo que sea. [Documentación](https://docs.python.org/es/3.8/tutorial/datastructures.html)

In [None]:
# Listas
seq1 = [1,2,3,"a", "b", "c", 1.1, 2.3, 3.5, True, False]

In [None]:
seq1

In [None]:
len(seq1) # Cantidad de elementos en mi sequencia

In [None]:
seq1[0], seq1[5],  seq1[-1]

In [None]:
seq1[0:3]

In [None]:
seq1[0:-1:2]

In [None]:
# Otras operaciones
seq1.remove(1)  # Borrar un elemento que tenga ese valor. Atencion esto opera sobre la misma variable
seq1

In [None]:
del seq1[0]  # Borrar los indices seleccionados 
seq1

In [None]:
seq1.append(1) # agregar un elemento (final de la lista)
seq1

In [None]:
seq1.append([1,1,1,1]) # agregar un elemento (final de la lista)
seq1

In [None]:
print(len(seq1))

**Ejercicio**

Remueve todos las variables de tipo float de nuestra la variable `seq1_copia`

In [None]:
seq1_copia = seq1.copy() # Esto es para que no perdamos la informacion de nuestra variable seq1

In [None]:
del seq1_copia[4:7]

In [None]:
print(seq1_copia)

In [None]:
seq1_copia = seq1.copy()
seq1_copia.remove(1.1)
seq1_copia.remove(2.3)
seq1_copia.remove(3.5)
print(seq1_copia)

**Ejercicio**

Vamos a crear una lista con multiples numeros random. No te preocupes si no entendes que estamos haciendo, ya lo veremos más adelante

In [None]:
# No cambies nada de esta celda
import random
numeros_random = [random.randint(1,10) for x in range(100) ]

Lo que vos vas a tener que hacer en decir cuál es la probabilidad o frecuencia relativa del numero `2`. Para eso deberas saber cuantos elementos hay en la lista y cuantas veces aparecio este numero.<br> *psst!... recorda como contaste las comas antes!*

---

### Tuplas

Las tuplas se diferencian principalmente de las lista es que son `inmutables` es decir que no soportan nuevas asignaciones (es decir no pueden expandirse una vez que han sido declaradas) ni tampoco aceptan modificaciones (item assignment). [Documentacion](https://docs.python.org/es/3.8/tutorial/datastructures.html?highlight=tuples#tuples-and-sequences)

In [None]:
# Tuplas
seq2 = ("a",1, 9.99) 
# Prestar atención como python sabe que algo es una tupla o una lista dependiendo si empieza con parentesis o corchetes.
seq2[2]

In [None]:
seq2.append(5)

In [None]:
seq2[0] = 'b'

### Mapping (o diccionarios)

Los diccionarios consisten en estructuras que contienen pares de una `key` y un `value`. Los elementos **no están ordenados**, con lo cual no se puede acceder por posición ni slicing, sino mediante esta `key`. [Documentación](https://docs.python.org/es/3/tutorial/datastructures.html#dictionaries).

A diferencia de las secuencias, que se indexan mediante un rango numérico, los diccionarios se indexan con claves, que pueden ser cualquier tipo inmutable; las strings y números siempre pueden ser claves. Las tuplas pueden usarse como claves si solamente contienen strings, números o tuplas; si una tupla contiene cualquier objeto mutable directa o indirectamente, no puede usarse como clave (recordemos que un ejemplo de tipo de variable mutables son las listas).

In [None]:
# Diccionarios
mydict = {'key1' : 'valor1',
          'key2' : 55,
          'key3' : 98.5,
          'key4' : seq1,
          68 : "68",
          ('una_tupla','otro_string') : 5
          }

In [None]:
# Podemos observar los items (key,value) en nuestro diccionario
mydict.items()

In [None]:
mydict['key1']

In [None]:
mydict['key4']

In [None]:
mydict[68] #No es la practica mas recomendable pero se puede hacer

In [None]:
mydict[('una_tupla','otro_string')]

**Ejercicio**

Vamos a suponer que trabajamos en un hospital (qué sorpresa!) y decidimos guardar los datos de contacto de nuestros pacientes en una estructura de diccionario. 

In [None]:
paciente_1 = {"direccion" : "Santa Fe 1987, 10C",
              "celular" : 1110101010,
            "telefono_casa" : 47173890,
            "nombre" : "Lionel",
            "apellido" : None
           }
paciente_2 = {"direccion" : "Calle Torero 10, Madrid",
            "celular" : 1119781010,
            "apellido" : 'Riquelme'  
           }

Debes completar el campo de apellido del `paciente_1` con algun valor para la `key` apellido. ¿Qué pasa si ponemos le pedimos a este paciente su apellido antes? y despues de asignarle un valor?

In [None]:
# Explorar el valor aqui


In [None]:
# Asigna un valor y explora aqui


**Ejercicio**

Vemos que el paciente 2 tiene menos datos. Imaginemos que quisieramos saber si tiene un nombre registrado, una opción podría ser usar la key `nombre`, pero qué pasaría si hicieramos esto y no tendría este valor?
Quizas seria bueno explorar la [documentación](https://docs.python.org/es/3/tutorial/datastructures.html#dictionaries), quizas un método de nuestra variable nos resulte útil <br>*(pssst... empieza con 'ge...)*.

In [None]:
#Prueba que pasa si usamos `nombre` como key para el paciente_2


In [None]:
#Utiliza la función que encontraste para que devuelva un nombre en caso que el paciente_2 no lo tenga registrado


Mucha gente no completa los campos de `telefono_casa`. Podemos ver como el `paciente_2` es medio reservado y no lo hizo. Supongamos que tenemos un script que necesita que la variable paciente tenga este campo (aunque no haga nada con ese valor). Estaría bueno crear esta key y asignarle un valor por defecto en caso de que no exista para nuestro paciente. Quizas esto sea un problema común y haya un metodo por defecto que lo haga. *(psst!...empieza con 'setd...')*.

In [None]:
# Veamos que pasa si ahora pedimos esta key


¿Qué pasaría si usaramos el mismo metodo con el mismo valor por defecto para para el `paciente_2`?

---

### Sets
Un objeto de tipo `set` o `conjunto` es una colección no ordenada de distintos objetos hashable. Los casos de uso habituales incluyen comprobar la pertenencia al conjunto de un elemento, eliminar duplicados de una secuencia y realizar operaciones matemáticas como la intersección, la unión, la diferencia o la diferencia simétrica. [Documentación](https://docs.python.org/es/3.8/library/stdtypes.html#set-types-set-frozenset)

In [None]:
# Un set es definido con {}. Automáticamente Python removerá los duplicados
un_set = {1,2,3,1,1} 
un_set

In [None]:
# Tambien podemos transformar objetos de tipo lista o tuple en sets
list_set = set(['una', 'lista','con','strings','con', 'strings'])
list_set # vemos que el orden no se conserva, sino que son ordenados alfabéticamente

In [None]:
tupla_set = set(('una', 'lista','con','strings','con', 'strings'))
tupla_set 

Podemos usar operadores como los que vimos més arriba:

In [None]:
pacientes = {"Oscar", "Jorge", "Mariana", 'Estela'}
'Jorge' in pacientes

**Ejercicio**

Muchas veces tenemos grandes cantitades de datos, pero estos se encuentra repetidos, cuando nos interesa saber si dos conjuntos comparten elementos (por ejemplo valores, o etiquetas) podemos usar las funciones propias de los sets. La siguiente imagen resumen rapidamente cuales son estas.

![operaciones de conjuntos](https://user-images.githubusercontent.com/43391630/94975728-90980780-04e0-11eb-91dc-8266fa7a5d35.png)

In [None]:
casos1 = [random.randint(1,10) for x in range(30)] # lista de numeros random entre 1 y 10
casos2 = [random.randint(3,7) for x in range(30)] # lista de numeros random entre 3 y 7

Imaginemos que queremos saber que numeros tenemos **en comun** entre nuestros variables `casos1` y `casos2`.<br> ¿Cómo lo harias?

 # 3.Condicionales y Bucles (o loops)



**Bucle** o **loop** se refiere a un tipo de evaluacion condicional en el cual nuestro script continuara realizando una tarea hasta que una condicion logica le indique detenerse (generalmente usamos la palabra reservada **while**) o hasta que se agoten los elementos en los cuales el bucle esta iterando (usamos la palabra reservada **for**).



In [None]:
contador = 5
while contador >= 0:
    print(contador)
    contador = contador - 1 # substrae una unida luego de que realiza el print

In [None]:
for valor in [5,4,3,2,1,0]:
    print (valor)

**Codicional** se refier al flow de decisiones que realizara nuestro script segun determinadas condiciones logicas que le pidamos. 

El condicional tiene la siguiente sintáxis:
```
if CONDICIÓN LOGICA:
    haz esto 
elif OTRA CONDICIÓN LOGICA: 
    haz esto otro 
else: 
    sino haz esto 
```

La condicion logica deve devolver un valor verdadero o falso es decir un **BOOLEAN**. <br> 
La **indentación** del código define qué parte se incluye como condicional.

El término "elif" viene de "else if". La condición sólo se evaluará si la condición del "if" no se cumple.


In [None]:
# Ejemplo de un condicional. 
# En este caso el condicional se encuentra dentro de una funcion. Veremos esto mas adelante

def mayor_que_10():
    valor = int(input('Escriba un numero: \n'))
    # Comienza el condicional
    if 10 > valor:
        print('Menor que 10')
    elif 10 == valor:
        print('Igual a 10')
    else:
        print('Mayor que 10')
    return

mayor_que_10()

### Control de flujo
Contamos con 3 keywords que modifican el orden de ejecución dentro de un bucle

**continue**: interrumpe el flujo del bucle y retoma la ejecución en la siguiente iteración <br>
**break**: termina el bucle <br>
**pass**: no tiene efecto, se usa para evitar error cuando lo exige la sintáxis<br>

In [None]:
for valor in range(10,-3,-1):  
    print(valor)

# range es una palabra reservada. 
# En este caso crea algo similar a una lista (se llama generador) que va desde el 10 al -3 substrayendo 1 en cada paso

In [None]:
for valor in range(10,-3,-1):
    if valor > 0:
        pass # no hara nada
        print(valor)
    else:
        print('Despegue!!')
        break # detiene el for. Proba que pasa comentando (pone un #) antes del break
    continue
    print ('Esto no se llegara a imprimir')

**Ejercicio**

Vamos a usar algunos de los conceptos que ya vimos. En este caso vamos a contar con una lista de multiples pacientes, Vamos a generarla sintéticamente. Descomenta la siguiente celda y ejecútala. Veremos qué es lo que estamos haciendo  y cómo funciona más adelante.

In [None]:
# !pip install Faker
import faker

In [None]:
pacientes = []
for i in range(50): 
    paciente = faker.Faker(locale='es_ES').profile()
    pacientes.append(f'{paciente["name"]}-{paciente["sex"]}_{paciente["birthdate"].year}.txt')

La variable `paciente` contiene información de multiples pacientes, mas precisamente su nombre, sexo y año de nacimiento. Te recomendamos que explores esta lista para que te familiarices con el formato. Vamos a asumir que los valores dentro de la lista refieren el nombre de unos archivos con datos clinicos de nuestros pacientes.

A continuación deberas crear un loop que imprima el nombre de archivo de los pacientes que tengan más de 65 años. Si no son mayores que no haga nada.<br>
*(psst!... recorda que podemos leer/indexar una string de derecha a izquierda)*<br>
*(psst!... si yo de vuelta, recorda que podemos transformar una string a un integer con un simple comando)*

---

# 4.Funciones

Ya vimos funciones como `mas_que_10`, la cual programoamos nosotros,  asi como otras que vienen definidas por defecto como `print` o `len`

Una función usualmente tiene como objetivo tomar algun input, aplicar un algoritmo a ese input y devolver un output. Un algoritmo es una serie de pasos o instrucciones definidas con el objetivo de llevar a cabo una tarea.

Para programar nuestra funcion empezamos utilizando la palabra reservada `def` seguida del nombre de nuestra variable y entre parentesís los `argumentos` o inputs que van ser usados en nuestro algoritmo. Para más información revisar la [documentación](https://docs.python.org/es/3/tutorial/controlflow.html#defining-functions)

In [None]:
# Estructura básica de una función

def nombre_funcion(una_variable):  # Usamos el constructor def para 'construir' nuestra función
    otra_variable = una_variable  # Esta función toma un argumento y devuelve el mismo argumento
    return otra_variable

In [None]:
nombre_funcion(5)

La palabra reservada `return` va a hacer que la función devuelva ese output y va a 'terminar' o detener la función. Si bien no es necesario que una función devuelva un output (a veces puede solo printear algo, otras modificar un objeto, etc) es una buena practica. Observa los siguientes comportamientos

In [None]:
def ver_return():
    print('Antes del return')
    if True:
        return
    print('Luego del return')
ver_return()

In [None]:
lista_vacia = []
def agregar_hola(lista):
    lista.append('HOLA!')
agregar_hola(lista_vacia)

In [None]:
lista_vacia

### Definiendo una función

Definamos una función más interesante y útil

In [None]:
def par_inpar(n):
    '''
    Aqui pondriamos una definición de nuestra variable. 
    Si hacemos esto podemos ver el doctstring de nuestra función y sabremos
    (u otra persona que quiera usarla) que hace nuestra función
    
    :param n: str
    :return: str
    '''
    n = int(n) # Transformemos al input en un integer
    if n % 2 == 0:
        return 'Par'
    elif n % 2 != 0:
        return 'Inpar'

In [None]:
# Probemos nuestra función!
tu_input = input('Ingresa un numero: ')  # `input` es una palabra reservada de Python que me permite escribir un input
par_inpar(tu_input)

In [None]:
help(par_inpar)

**Ejercicio**

¿Recordas que teniamos una lista de `pacientes` en el ejercicio anterior? Bueno, creemos una función que tome esta lista como argumento y que devuelva una lista con el nombre de los archivos de pacientes mayores a N edad, donde N sera nuestro segundo argumento. 

In [None]:
def filtrador(lista, edad):
    '''
    Es buena idea documentar nuestras funciones
    '''
    # Escribe tu codigo aqui
    return # Devuelve la lista con pacientes mayores de 65 aqui

Prueba tu función con diferentes edades:

### Librerías o módulos

Los módulos son archivos de Python que contienen funciones y variables. Podemos importar los módulos y acceder a las funciones y variables con el operador "." (punto) o agregándolos a nuestro namespace. Contamos con las siguientes maneras de importar funciones de un módulo:

Importar todo el módulo con el mismo nombre que tiene<br>
```python
import numpy
```

Importar el módulo con un alias más corto (por comodidad)<br>
```python
import numpy as np
```

Importar únicamente un sub-módulo de una libreria<br>
```python
from numpy import random
```

Importar directamente todos los nombres de funciones (en general no recomendado dado que podemos llegar a "pisar" un nombre de variable)<br>
```python
from numpy import *
```

De la misma manera nosotros podemos incorporar funciones de modulos que nosotros mismos hemos programado. Por ejemplo, imaginemos que en nuestro dia a dia usamos usualmente la función `par_inpar` que ya hemos programado. En vez de definirla en cada `script` que escribamos, sería más útil guardarla e importarla cuando la necesitemos. Vamos a ver como seria eso. Para eso usaremos ciertos comandos de Ipython que nos permiten interactuar con la consola. 
Para hacer esto necesitamos comenzar la linea con el simbolo 
```python
!
```

Si el lector desea aprender mas acerca de de los shell commands y Ipython puede consultar el siguiente [link](https://jakevdp.github.io/PythonDataScienceHandbook/01.00-ipython-beyond-normal-python.html)

In [None]:
!cd
!mkdir nuestro_modulo

Ipython nos permite tambien invocar `magic methods`. Un `%` corre el comando solamente en esa linea, `%%` corre el comando para toda la celda.<br>
En este caso usaremos
```python 
%%bash
```
 para no tener que usar `!` en todas las lineas.

In [None]:
%%bash 
cd nuestro_modulo
cat >> nuestro_submodulo.py << EOF
def par_inpar(n):
    '''
    Aqui pondriamos una definición de nuestra variable. 
    Si hacemos esto podemos ver el doctstring de nuestra función y sabremos
    (u otra persona que quiera usarla) que hace nuestra función
    
    :params n: int
    :return: str
    '''
    n = int(n) # Transformemos al input en un integer
    if n % 2 == 0:
        return 'Par'
    elif n % 2 != 0:
        return 'Inpar'
EOF

Si vamos a nuestro file browser podras ver como ahora en la carpeta `nuetro_modulo` podemos ver el Python script llamado `nuestro_submodulo.py`. Si abrimos este archivo veremos que nuestra función `par_inpar` se encuentra adentro.

In [None]:
# Eliminamos la funcion que habiamos programado antes
del par_inpar

In [None]:
#Chequeamos que la función no se encuentra más en nuestro enviroment
par_inpar(10)

In [None]:
# Importamos la funcion en nuestra carpeta `nuestro_modulo`
from nuestro_modulo.nuestro_submodulo import par_inpar
par_inpar(10)

Si bien hay mucho más material acerca del uso de funciones en Python, llevaria demasiado tiempo cubrirlo en este curso. 
Si el lector lo desea, puede continuar por su cuenta explorando el siguiente [enlace](https://realpython.com/python-kwargs-and-args/)


### Instalar librerias externas

Habra ocasiones en las cuales querramos usar librerias creadas por otras personas o organizaciones que no vienen por defecto incluidas en el modulo base de Python. 

Los entornos (como collab) que tienen instalado python, en general, también tienen instalado un software que se llama python-pip. Este nos permite ejecutar el comando `pip` para descargar librerías desde PyPI.
Para mas informacion acerca de qué es y cómo funciona `pip` consultar el siguiente [link](https://ubunlog.com/pip-conceptos-administracion-paquetes/).<br>
*Si usted deseara correr esto en su computadora local, debera instalar PIP luego de haber instalado Python.*

In [None]:
#Ejemplo de pip install
!pip install seaborn==0.9.0

 ### Entornos virtuales

Si no deseamos instalar librerias en nuestra computadora de forma local podemos crear un entorno virtual en el cual instalemos todas estas librerias. Un entorno virtual es como una burbuja, en la cual todo lo que instalemos permanecera ahi, pero no podremos acceder desde afuera. Esto es conveniente cuando:
- No queremos tener posibles conflictos entre diferentes librerias
- Queremos replicar las condiciones de la maquina/server en la cual correremos nuestro proyecto para asegurarnos que corra sin problemas. 

Cómo crear y usar estos [entornos virtuales](https://docs.python.org/es/3/tutorial/venv.html)

# 5.Manipulación de Archivos 

En el punto anterior realizamos operaciones mediante instrucciones a la consola o `shell`. En este caso,  usamos un lenguaje llamado [Bash](https://en.wikipedia.org/wiki/Bash). Si bien es una herramienta útil, Python nos permite realizar las mismas tareas utilizando sus librerias. 

In [None]:
!mkdir archivo_pacientes
for i in pacientes:
    with open (f'./archivo_pacientes/{i}','a') as paciente:
        paciente.write('Aca habría información real')

A continuación utilizaremos las librerías `os` u `shutil` para poder manipular nuestros archivos.

In [None]:
import os  # Importamos las librerias
import shutil

In [None]:
# os.listdir() va a devolvernos todos los files en esa carpeta. Esto es muy similar a nuestra variable `pacientes`
archivos = os.listdir('./archivo_pacientes/')
archivos[0]

In [None]:
# Crear una carpeta nueva
os.mkdir('Carpeta nueva')

In [None]:
os.listdir()

In [None]:
# Remover una carpeta
os.rmdir('Carpeta nueva')
os.listdir()

In [None]:
# mover un file a otro path
shutil.move('./archivo_pacientes/' + archivos[0], 
            './')
           
os.listdir()

**Ejercicio**

En esta oportunidad vamos a usar todos nuestros conocimientos previos.
La idea es crear 3 carpetas, una para pacientes menores de edad, otra para pacientes adultos y otra para pacientes en edad de jubilación.<br>
Luego moveremos los archivos dentro de la carpeta `archivo_pacientes` a sus correspondientes carpetas. <br>

*(pssst!... prueba de modificar la función que programamos antes para que temo un rango de edad en vez de un numero)*

In [None]:
def filtrador_rango (lista, lim_joven, lim_adulto):
    '''
    Filtrando por rango
    :params lista: list
    :params lim_joven: int
    :params lim_adulto: int
    :return: None
    '''
    #Creo las carpetas

    # Dependiendo de la edad los asigno a una carpeta

    print(f'{len(lista)} pacientes fuero reubicados en sus respectivas carpetas')
    return 

In [None]:
filtrador_rango(pacientes, 18, 65)

---
<br>

#  Extra
## Temas que veremos solo si tenemos más tiempo

Para el curso 4 'Deep Learning con Python' trabajaremos con un dataset de imagenes de radiografías de torax llamado [PADCHEST](https://bimcv.cipf.es/bimcv-projects/padchest/#). Al momento de entrenar estos modelos de computer vision es una práctica habitual dividir las imagenes en diferentes carpetas dependiendo de algún atributo de interes. Ahora bien, qué hacemos cuando tenemos que re-organizar miles de archivos? La solución es automatizar esta tarea. Para eso utilizaremos las dos librerias que importamos recien.

La carpeta `data/PADCHEST` tiene dos elementos:
    - `png_files` : Una carpeta con todas las imagenes de este subdataset (el dataset original pesa aproximadamente 1 TB)
    - `PADCHEST_chest_x_ray_images_labels_160K_01.02.19.csv` : Un csv que contiene metadata acerca de todas las imagenes de la base. 
    
Vamos a dividir estas imagenes según la projección de la radiografia (AP/PA/lateral/oblicua, etc.). Para poder hacer esto usaremos la metadata para  asignarle la projección a cada imagen de nuestro dataset. Crearemos las carpetas correspondientes y moveremos las imagenes de nuestra carpeta `png_files` a su carpeta correspondiente.

In [None]:
# Si estas usando este notebook desde Colab deberas habilitar a a Colab a que acceda a Drive
from google.colab import drive
drive.mount('/content/gdrive/',force_remount=True)

In [None]:
!ls

Acceder a `shared with me` en tu Google Drive y con click derecho sobre la carpeta `Python_JIS_2020` seleccionar `Add Shorcut to Drive`

In [None]:
# Chequear donde se guardó la carpeta del curso. Tu ubicación puede ser diferente
PATH='/content/gdrive/My Drive/Hospital Italiano/Python_JIS_2020/PADCHEST/' # Directorio en el cual se encuentran nuestras imagenes. 

In [None]:
import pandas as pd # Veremos mas Pandas en el proximo curso
df=pd.read_csv(PATH + 'padchest_metadata.csv') # Lee el csv con la metadata y lo asigna a una variable
df.head(2) # Nos va a permitir ver las N primeras filas (5 por defecto) de nuestro dataset

In [None]:
df.columns #Devuelve las columnas de nuestro dataset

In [None]:
pd.unique(df.Projection)  
# Unique me permite ver las diferentes categorias/valores que tengo en una columna
# Una forma alternativa de escribirlo es:  df.Projection.unique()

## Atención!!
El archivo con las imagenes se llama `6.zip`. Dado que es un Colab compartido no podemos permitir que todos los usuarios descrompriman las imagenes y manipulen los archivos. Por otro lado el dataset pesa 11 gb por lo que dependiendo de la quota de tu Drive quizas no sea posible descargarlo. De cualquier manera las cells ya estan corridas y te muestran cual sería el output

### Sentite libre de descargarte la base y probar luego en tu computadora local. Si no deseas descargarla puedes continuar al proximo punto.

In [None]:
# PATH_LOCAL = ....  ## El path a donde descargaste los datos
# os.chdir(PATH_LOCAL)
# os.mkdir('png_files')
# !unzip -q 6.zip -d png_files

In [None]:
files_png=os.listdir(PATH_LOCAL + 'png_files/') 
print(f'Numero de archivos en png_files : {len(files_png)}')
# Creamos una lista con todos los nombres de los archivos en mi carpeta `png_files`. Si queres ver esa lista descomenta la linea de abajo
# files_png

Genial, ahora que tenemos los nombres de todos los archivos en nuestra carpeta necesitamos saber cuales son las diferentes projecciones de nuestro dataset para crear las carpetas correspondientes.

In [None]:
for orientacion in df.Projection.unique():
    print('Orientación : ', orientacion)
    try:
        os.mkdir(PATH_LOCAL + orientacion)
    except OSError: # Si la carpeta ya existe python devolvera un tipo de error (OSerror),
        pass        # en ese caso no hara nada (pass)

Si chequeas en el file browser veras que las carpetas han sido creadas!<br>
Ahora movamos las imagenes a sus respectivas carpetas

In [None]:
for orientacion in df.Projection.unique():
    files_orientacion = df[df.Projection == orientacion]['ImageID']  # Guardamos los nombres delas imagenes para cada orientacion.
    files_mover = set(files_orientacion).intersection(set(files_png)) 
    # Como ya vimos, los sets nos permiten realizar operaciones.
    # En este caso, solo nos interesan los archivos que tenemos en nuestro dataset pequeño
    print(f'N de archivos de modalidad {orientacion} a mover : {len(files_mover)}')
    for file in files_mover:   # Movemos cada uno de los archivos. Esto tomara un tiempo
        shutil.move(PATH_LOCAL + 'png_files' + '/' + file,
                    PATH_LOCAL + orientacion + '/' + file)
    if len(files_mover) == 0:
        os.rmdir(PATH_LOCAL + orientacion)
        print('Se removio la carpeta :', orientacion)

## Si no queres descargar la base continua en este punto

Veamos cómo se ven nuestros archivos. Para eso usaremos la libreria `matplotlib` la cual usaremos en el siguiente módulo para plotear graficos. Se puede indagar mas acerca de esta libreria [aqui](https://matplotlib.org/tutorials/index.html)

In [None]:
import matplotlib.image as mpimg  # Importa las librerias
import matplotlib.pyplot as plt

img=mpimg.imread(PATH + '167891152309007801413146488810821721572_zjetfk.png')  # Lee el archivo imagen
imgplot = plt.imshow(img, cmap='gray') # "crea" una figura y representa la imagen en dos ejes (x,y)
plt.show()  # Plotea la figura

# 6. Programación Orientada a Objetos (OOP)

La Programación Orientada a Objetos (POO u OOP por sus siglas en inglés), es un paradigma de programación. En este paradigma los programas se estructuran organizando el código en entidades llamadas objetos. ¿Por qué nos interesa hacer esto?
Estos nos permiten encapsular data, funciones y variables dentro de una misma `clase`, facilitando una interfaz sencilla para operar y permitiendo modificar y reutilizar estas clases. Para una definición mas exhaustiva el lector puede consultar la [documentación](https://docs.python.org/es/3/tutorial/classes.html).

### Elementos principales y terminología

1. Una `clase` es un prototipo de objeto, cómo una especie de plantilla, sobre la cual se construirán nuestros `objetos`. Esta clase va a englobar los `atributos` que comparten en común todos los objetos de esa clase. 

2. Una `instancia` es una manera de referirse a un `objeto` en particular que pertenece a una `clase`. 

3. Los `atributos` o `propiedades` son variables asociadas a los objetos. Los atributos pueden ser de clase (toman el mismo valor para toda la clase) o de instancia (toman un valor diferente para cada instancia). Lo más común de utilizar son los atributos de instancia que reflejan estados de los objetos. Los atributos de clase se utilizan para que todos los objetos compartan por ejemplo, una misma constante, las mismas configuraciones o la misma conexión a una base de datos.Se acceden con un punto.

4. Un `método` es una función, similar a las que vimos anteriormente, contenida dentro de un objeto. En otras palabras, ciertos objetos podrán realizar ciertas funciones.Se acceden con un punto.

5. Podemos decir que una `clase`, es la lógica abstracta de un objeto, es decir un concepto, mientras que el `objeto`, es su materialización. Cuando creamos un `objeto` estamos instanciando una clase. Entonces, un `objeto` es una instancia única con una estructura definida por su clase. Posee de `atributos` variables de clase, de instancia y `métodos`.

6. La herencia es la transferencia de atributos de una clase a otra clase.




### Creemos nuestra primera clase
En este caso, nos interesaria usar lo que ya aprendimos para crear una clase que nos sea útil en algún contexto específico. Supongamos que queremos crear una clase `Paciente` en la cual tendremos diferentes `propiedades` y `metodos`. Para eso empezaremos con algo más sencillo, crearemos una clase general denominada `Persona`.

In [None]:
class Persona(): # la palabra reservada `class` le dice a python que vamos a definir una clase de nombre Persona
    def __init__(self, nombre, apellido, fecha_nacimiento): 
        self.nombre = nombre
        self.apellido = apellido
        self.fecha_nacimiento = fecha_nacimiento

 `__init__` es un metodo reservado (por eso el doble guión bajo). Este método se llama cuando se instancia una clase (es decir se crea un Objeto). Es ahí cuando se inicializan los atributos de la clase con los parametros que nosotros le pasemos. <br>
 El primer parametro siempre es el termino reservado `self` que indica que los atributos y metodos vas a ser propios de el objeto que estamos intanciando. Veamoslo en funcionamiento:

In [None]:
persona_1 = Persona('Joaquin','Menendez','25/03/1991')
persona_1.apellido # Podemos acceder a los atributos del objeto utilizando `.atributo`

### Crear un metodo

Vamos a crear una `metodo` que nos permita saber la edad de esta persona al día de la fecha. Para eso usaremos el modulo `datetime`. Para acceder a mas información acerca de los diferentes formatos posibles puede consultarlo [aquí](https://strftime.org/)



In [None]:
from datetime import datetime # importamos los modulos que vamos a usar
from dateutil.relativedelta import relativedelta

class Persona(): # Vamos a re-escribir nuestra clase
    def __init__(self, nombre, apellido, fecha_nacimiento): 
        self.nombre = nombre
        self.apellido = apellido
        self.fecha_nacimiento = fecha_nacimiento
        
    def edad_hoy(self):
        fecha_nacimiento = datetime.strptime(self.fecha_nacimiento,'%d/%m/%Y')
        fecha_hoy = datetime.today()
        anios = relativedelta(fecha_hoy,fecha_nacimiento)
        return  anios.years

In [None]:
persona_2 = Persona('Joaquin','Menendez','25/03/1991')

¿Qué pasaría si corremos el método `edad_hoy` para `persona_1`?

In [None]:
persona_1.edad_hoy()

Vemos como `persona_1` al ser instanciado o construido con una clase vieja no posee el nuevo `método` que creamos.

In [None]:
persona_2.edad_hoy()

### Heredar atributos de otra clase

Vamos a usar los atributos de nuestra clase `Persona` para construir una nueva clase denominada `Paciente`. Esta clase contara con todos los atributos y méetodos (en este caso solo `edad_hoy`).

In [None]:
# Vamos a trabajar con un solo caso
df_small = df[df.ImageID == '167891152309007801413146488810821721572_zjetfk.png']
df_small

In [None]:
class Paciente(Persona):
    # En caso de que te hayas descargado la base reemplaza la `PATH` por `PATH_LOCAL`
    # PATH = PATH_LOCAL  
    
    # En un caso mas real prefeririamos que esto sea una base de datos y no un directorio local.
    
    def __init__(self, PatientID, **kwargs):  # Vamos a pasar los atributos de la clase madre en forma de kwargs (diccionario)
        self.PatientID = PatientID 
        super().__init__(**kwargs) # agrego el resto de los atributos usando el formato __init__ de la clase madre.
    
    def edad_hoy(self):
        return super().edad_hoy() # Uso el metodo/funcion declarado en la clase madre
    
    def mostrar_imagen(self):  # Este caso es ilustrativo. En la vida real no seria buena idea asignar los valores a un DataFrame local, sino re-leerlo desde una base de datos
        imageID = df_small[df_small.PatientID == self.PatientID].ImageID.values
        projection = df_small[df_small.PatientID == self.PatientID].Projection.values
        try: 
            image_path = f'{PATH}{projection[0]}/{imageID[0]}'
            img = mpimg.imread(image_path)  # Lee el archivo imagen
        except:
            image_path = f'{PATH}{imageID[0]}'
            img = mpimg.imread(image_path)  # Lee el archivo imagen
        
        plt.imshow(img, cmap='gray') # "crea" una figura y representa la imagen en dos ejes (x,y)
        plt.title(f'ID : {self.PatientID}\n({self.apellido}, {self.nombre})') 
        plt.show()  # Plotea la figura

Vamos a seleccionar un sujeto de nuestro dataset y vamos a instanciar un objeto de nuestra nueva clase.

In [None]:
df_small.PatientID

In [None]:
paciente1 = Paciente('142282708820270177808766726066495395635', nombre='Joaquin',apellido='Menendez',fecha_nacimiento='25/03/1990')

In [None]:
type(paciente1) 

Vemos que el tipo no es "prolijo" como cuando lo usamos con otros objetos por defecto en Python. Esto se debe a que nosotros no definimos (todavía) como queremos que la función `type` represente esto. Esto escapa el enfoque de esta introducción, pero pueden consultarlo [aquí.](https://docs.python.org/3/tutorial/classes.html)

Probemos un metodo heredado de nuestra clase `Persona` en nuestra nueva clase

In [None]:
paciente1.edad_hoy()

Ahora veremos si nuestro nuevo metodo tambien funciona.

In [None]:
paciente1.mostrar_imagen()