# Introducción a Python

El objetivo de este primer capítulo es introducir conceptos generales de Python.

Veremos como usar Python para resolver algunos problemas sencillos como calcular estadísticos sumarios. 

## Python

[Python](http://www.python.org/) es:
* un lenguaje de programación moderno
* de propósito general (se suele decir que Python no es el mejor lenguaje para casi nada, pero es suficientemente bueno para casi todo)
* multiparadigma (es posible programar usando distintos _estilos_ de programación incluso combinándolos)
* de alto nivel (es decir cercano al lenguaje humano y lejos del _lenguaje de máquinas_)
* es interpretado (es decir no es necesario _compilarlo_ antes de correrlo)
* es multiplataforma (corre en diversos sistemas operativos)

<a href="https://xkcd.com/353/">
<img src="http://imgs.xkcd.com/comics/python.png" width=400>
</a>

### ¿Por qué es un buen lenguaje de programación científica?

* Es un lenguaje simple: El código es simple de leer, de escribir y de mantener.

* Es gratuito y de [código abierto](https://es.wikipedia.org/wiki/C%C3%B3digo_abierto).

* Está muy bien documentado.

* Es ampliamente usado en la mayoría de las disciplinas científicas

* Tiene una gran comunidad de usuarios (no todos científicos), por lo que es fácil encontrar ayuda, tutoriales, foros, blogs, etc. por ejemplo en [StackOverflow](https://stackoverflow.com/).

* Buena _performance_. Aunque estrictamente es un lenguaje _lento_ (el costo de la simplicidad). Existen formas de acelerarlo.

* Posee un extenso _ecosistema_ de librerías

## Tipos de variables en estadística: Métricas, ordinales y categóricas

Tanto en análisis de datos como en programación hablamos de variables, aunque esto quiere decir cosas ligeramente distintas.

En estadística las variables se suelen clasificar de la siguiente manera (hay otras clasificaciones):

* Métricas o cuantitativas: Son variables con las cuales es posible establecer un orden y computar distancias. Cuando en la escala existe un cero es posible además calcular proporciones, por ejemplo 1 hora es la mitad de 2 horas (por que 0 horas implica la ausencia de tiempo transcurrido). En cambio $40 ^\circ \text{C}$ no es el doble de $20 ^\circ \text{C}$, por que el cero de la escala Celcius es un punto totalmente arbitrario (contrario al cero de la escala Kelvin).
    * Continuas: Se describen usando el conjunto de los reales, algunos ejemplos son la temperatura, altura, peso, etc.
    * Discretas: Se describen usando el conjunto de los enteros, cantidad de hijos, de aviones de una aerolínea, etc.

* Cualitativas: Son el tipo de variables que indican cualidades, o atributos.
    * Categóricas o nominal: Son variables que indican pertenencia a categorías mutuamente excluyentes, como cara o ceca en una moneda. Aún cuando se usen números como 1 y 0 para representar este tipo de variables no se puede establecer orden alguno, "cara" no es más o menos que "ceca", ni "ceca" viene antes que "cara". Las variables categóricas no tienen por que ser dos pueden ser millones, como los colores.
    * Ordinales: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque el intervalo no tiene por que ser uniforme, por ejemplo en una carrera de bicicletas, la distancia entre la primer y segunda competidora no tiene por que ser la misma que entre la segunda y la tercera.
  
  


## Tipos de variables en Python

En programación se le llama variable a un espacio en la memoria de la computadora que almacena un valor determinado y que tiene asociado un identificador (o nombre). Existen distintos "tipos" de variable en Python. Las más comunes que encontraremos son:

* int : que corresponde a los numeros enteros. Por ej 42, 1, -4.
* float : son un aproximación de los números reales por ej 3.14, 1.0, -0.124.
* string : que corresponde a "letras" y "palabras". Se escriben usando comillas dobles "" o simples ''. Por ejemplo 'hola', '42', "s".
* bool : Se corresponde con los booleanos. Solo hay dos, True y False.
* None : El valor nulo, representa a la nada misma. Se utiliza para indicar que hay algo que no tiene asignado ningún valor.

In [1]:
type(42)

int

In [2]:
type(42.0)

float

In [3]:
type("42")

str

In [4]:
type(True)

bool

In [5]:
type(None) # None es el único objeto de tipo NoneType

NoneType

Existen muchos otros "tipos" de variables en Python, incluso usuarios avanzados pueden crear sus propios tipos de variables. Pero por ahora estos nos bastan. 

## Conversión entre tipos de variables

In [6]:
str(42)

'42'

In [7]:
str(None)

'None'

In [8]:
int(42.0)

42

In [9]:
int(3.14)

3

In [10]:
float(42)

42.0

In [11]:
float("42")

42.0

------------------
### Ejercicios

1. Cual es el resultado de convertir un string como "hola" a float? Justifique
1. Y de convertir un Booleano a int? Justifique
------------------

## Función Print

Una particularidad de trabajar con Jupyter es que cada vez que ejecutamos una celda esta devuelve el valor correspondiente a la operación o variable que aparece en la última linea. Esto facilita el trabajar de forma interactiva, algo que quizá se volverá más claro a medida que avancemos. 

In [12]:
"42.0"
True
1

1

Si no estuvieramos trabajando con Jupyter y quisieramos "imprimir" el valor de alguna variable u operación o para "imprimir" un valor que no sea el de la última linea podemos usar la función `print`

In [13]:
print("42.0")
print(True)
1

42.0
True


1

## Operaciones

Tener variables es útil por que con ellas podemos hacer operaciones, por ejemplo operaciones matemáticas.

In [14]:
1 + 1  # esto devuelve un entero

2

In [15]:
1. + 1  # esto devuelve un float

2.0

In [16]:
2 / 1  # Una división siempre devuelve floats

2.0

In [17]:
"42" + 1  # esta operación no tiene sentido y por lo tanto Python devuelve un error!

TypeError: can only concatenate str (not "int") to str

In [None]:
'4' * 4  # esta operación SI tiene sentido en Python, es lo que esperabas?

In [None]:
1 > 2  # acá comparamos variables y obtenemos un booleano

In [18]:
2 == 2  # ojo que el operador "igualdad" es "==" y no "="

True

Tener variables y poder hacer operaciones entre ellas está bueno, pero no nos lleva muy lejos. Puede no ser obvio al principio pero para poder hacer tareas más complejas es necesario poder guardar variables y ponerles nombres. De esa forma podemos una operación por ejemplo `2 + 2` y usarla luego.

Los nombres de las variables en Python pueden contener los caracteres `a-z`, `A-Z`, `0-9` y algunos caracteres especiales como `_`. Los nombres de las variables NO pueden empezar con números. Por convención, los nombres de las variables y funciones comienzan con una letra minúscula, mientras que los nombres de las _clases_ (ver más adelante) comienzan con una letra mayúscula. También es posible usar caracteres Unicode de lenguas humanas como por ejemplo letras griegas "α, β, γ", la "ñ" y "ラ", pero no 😭 

Para asignar una variable en Python se usa el símbolo `=`

In [19]:
a = 2 + 3

Al escribir esto le estamos diciendo a Python tome el valor `2` sumele el valor `3` y guardelo en la variable de nombre `a`. Esto lo podemos comprobar de la siguiente forma.

In [20]:
a

5

No solo es posible usar variables para guardar valores, también podemos operar con ellas!

In [21]:
a > 2

True

In [22]:
a - 1

4

incluso podemos actualizar el valor de las variables, por ejemplo

In [23]:
a = a + 1
a

6

el ejemplo anterior muestra que el signo `=` no es el operador igualdad (que como vimos es `==`).

Si tuvieramos que leer la celda anterior en voz alta diríamos; tome el valor de la variable `a` súmele `1` y guarde el resultado en la variable `a`. Aunque coloquialmente es más probable que digamos algo como "`a` es igual a `a` más  1".

Si tratamos de usar una variable que no ha sido definida previamente obtendremos un mensaje de error:

In [24]:
z

NameError: name 'z' is not defined

Los errores son parte central de la programación y hay que acostumbrarse a cometerlos ya que así es como se avanza en la escritura de un programa. Al producirse errores Python entrega mensajes que son muy informativos y por lo tanto útiles para solucionar el error, por lo que es muy beneficioso aprender a interpretarlos y prestarles **mucha** atención cuando ocurren, salvo que uno tenga como hobby perder el tiempo.  

El proceso de corrección de errores de un programa se llama _debugging_ y es quizá una de las tareas más demandantes al escribir código. Python fue pensado como un lenguaje fácil de leer debido a que en general uno pasa más tiempo leyendo código (para arreglar los errores) que escribiéndolo. Mitad broma, mitad en serio se dice que si el _debugging_ es el proceso por el cual se eliminan errores la _programación_ debe ser el proceso por el cual se introducen los errores.

Nota: en muchos lenguajes de programación (como C/C++ o Fortran) antes de poder asignar valores a variables es necesario declararlas. Declarar variables, quiere decir que tenemos que indicar que nuestro programa usará una variable de nombre _tal_ que será del tipo _cual_. Recién una vez declarada la variable podemos asignarle valores concretos. En Python esto no es necesario, esto es lo que permite que en Python sea legal re-asignar un valor a una variable (técnicamente esto se llama _tipado dinámico_).

In [25]:
a = "42"
a = 0.1
a

0.1

## Medidas de  centralidad

### Media

Uno de los computos más elementales en estadística consisten en calcular la media, también conocida como promedio o valor esperado. Matemáticamente tenemos:

$$E[x] = \int_{-\infty}^{\infty} x d(x) = \frac{1}{n} \sum_{i=1}^n{x_i} = \sum x P(x) $$

El primer término es usado comúnmente en estadística y probabilidad como una notación breve para indicar la media, se lee como el valor esperado de _x_. El segundo término muestra que la media es la integral (área bajo la curva) de una distribución de valores. El tercer término es quizá la forma más familiar y el cuarto término indica que podemos calcular un promedio si sabemos los pesos relativos de cada valor que promediamos.


------------------
### Ejercicio

3. Con los elementos de Python vistos hasta el momento calcule la media para el conjunto de valores 1,2,3,4,5,6

------------------

El codigo que acabamos de escribir no difiere mucho de usar una calculadora, primero tenemos que ingresar los numeros _a mano_ y además tenemos que saber exactamente la cantidad de números ingresados para usar como divisor. Usando un lenguaje de programación podemos hacer algo bastante más cómodo. Pero antes tenemos que aprender un par de conceptos nuevos.

### Listas

Las listas son *contenedores*, algo así como un recipiente donde depositar objetos diversos. En una lista podemos alojar tantos valores como la memoria de nuestra computadora lo permita. Las listas son muy usadas en Python y gran parte de la programación en Python implica crear y manipular listas.

La sintaxis para crear listas en Python es *\[..., ..., ...\]*:

In [26]:
lista = [] # crea una lista vacia
lista

[]

In [27]:
num = [1, 2, 3, 4, 5, 6]
num

[1, 2, 3, 4, 5, 6]

In [28]:
type(num)

list

Las listas no solo permiten contener objetos, además podemos realizar varias operaciones con ellas. Por ejemplo podemos preguntar cuantos valores contiene una lista usando la función `len()`.

In [29]:
len(lista)

0

In [30]:
len(num)

6

Y podemos sumar todos los valores de una lista usando la función `sum()`

In [31]:
sum(num)

21

Ahora podemos calcular la media como:

In [32]:
media = sum(num) / len(num)
media

3.5

------------------

### Ejercicios

4 . Los siguientes métodos son aplicables a listas. Elija 2, y para cada uno de ellos explique su funcionamiento y ejemplifique. Recuerde que puede utilizar `?` para consultar la documentación. En ese caso tendrá que colocar el tipo `list` y el nombre del método, por ejemplo `list.append?`.

    append, clear, copy, count, extend, index, insert, pop, remove, reverse, sort

------------------

## Funciones

Como vimos anteriormente usando listas y las funciones `sum` y `len` podemos automatizar los cálculos de las medias. La principal ventaja del ejemplo es que si cambiamos el contenido de la lista `num` podremos calcular una media sin necesidad de hacer ningún otro cambio. Si bien esto es muy útil, todavía podemos hacer algo incluso mejor.

Es común al escribir código que necesitemos repetir una operación muchas veces. Una solución simple sería copiar y pegar el código cada vez que lo necesitemos. El problema con esta aproximación es que es tediosa, y es facil cometer errores, piensen que operaciones más complejas podrían requerir de cientos de lineas de código no una sola como el ejemplo de la media. Una forma de resolver este problema es crear una _función_ que calcule la media y _llamarla_ cada vez que la necesitemos. En Python crear funciones es muy simple. Veamos:

In [33]:
def calcular_media(valores):
    media = sum(valores) / len(valores)
    return media

En la primer linea podemos ver que para definir una función necesitamos la palabra reservada `def` (una palabra que tiene significado especial para Python) luego el nombre de la función y entre paréntesis los nombres de los argumentos de la función y cerramos la linea con dos puntos. La siguientes linea contienen las operaciones que realiza la función, potencialmente podrían ser decenas de lineas. Por último tenemos otra palabra reservada `return` seguida del valor que devuelve la función. Esta linea es opcional ya que es posible definir funciones que no devuelvan valor alguno (ya veremos ejemplos).

Es importante notar un detalle todo el contenido de la función está escrito usando una sangría de 4 espacios, la sangría es obligatoria ya que le indica a Python cual es el cuerpo de la función, mientras que los 4 espacios es convención. Podrían ser 2, 3, 8, etc, lo importante es respetar la misma cantidad.

una vez definida una función se la puede _llamar_ usando la sintaxis `nombre_función()` más los argumentos requeridos por la función, en nuestro caso una lista con los valores a los cuales queremos calcular la media.

In [34]:
calcular_media(num)

3.5

Una detalle importante a notar es que el nombre de la variable que le pasamos a nuestra función no tiene nada que ver con el nombre del argumento de la función. Es decir nosotros le pasamos `num` a la función e internamente `calcular_media` le llama `valores`. Técnicamente decimo que `valores` es una variable local (respecto de nuestra función), `valores` solo existe dentro de la función `calcular_media`. Fuera de esa función `valores` podría no existir o refererise a otro valor.

In [35]:
calcular_media([1, 3, 4]), valores # dentro de la función `valores` refiere a una lista, afuera no existe

NameError: name 'valores' is not defined

------------------

### Ejercicio

5. Modifique la función `calcular_media` para que imprima la variable `valores`
6. Modifique la función `calcular_media` para que acepte una lista de booleanos

------------------

Otra convención en Python es escribir las funciones incluyendo un _docstring_. Que no es más que una porción de texto que Python ignora, pero que es útil para los humanos ya que contiene una descripción de la función sus argumentos y sus salidas. Los docstring se escriben usando comillas triples `"""` esto permite que el docstring se desarrolle en varias lineas. El estilo exacto y la cantidad de información de los docstring varia, lo importante es tratar de mantener una linea al menos dentro de un mismo proyecto. Un ejemplo de docstring sería:

In [36]:
def calcular_media(valores):
    """
    Calcula la media partir de una lista.

    Parametros
    ----------
    valores : lista
        lista con los valores a promediar

    Resultado
    ----------
    res : float
        La media de los valores contenidos en `valores`
    """
    valores = sum(valores) / len(valores)
    return valores

El docstring no solo puede ser leido directamente del código, si no que puede ser usado por Python y por varias herramientas externas. Por ejemplo la función `help()` de Python ofrece ayuda al usuario "leyendo el docstring". Por ejemplo si quisieramos ver que hace la función `len()`

In [37]:
help(len)

Help on built-in function len in module builtins:

len(obj, /)
    Return the number of items in a container.



Esto no solo sirve para funciones que ya vienen con Python, si no que el mismo mecanismo es usado para funciones definidas por los usuarios.

In [38]:
help(calcular_media)

Help on function calcular_media in module __main__:

calcular_media(valores)
    Calcula la media partir de una lista.
    
    Parametros
    ----------
    valores : lista
        lista con los valores a promediar
    
    Resultado
    ----------
    res : float
        La media de los valores contenidos en `valores`



Jupyter (lo que estamos usando para mostrar este documento y ejecutar el código), también permite acceder al docstring usando `shift + TAB`

In [39]:
calcular_media  # seleccioná esta celda y presioná shift + tab

<function __main__.calcular_media(valores)>

Dentro de Jupyter también se puede acceder a la ayuda escribiendo `?` o  `??` luego de la función y presionado `enter`. Podés decir cual es la diferencia entre usar una u otra forma?

Todo muy bien hasta ahora, pero ¿Qué pasaría si inadvertidamente le pasáramos una lista vacía?

In [40]:
calcular_media([])

ZeroDivisionError: division by zero

La función `calcular_media` falla por que la división por 0 no está definida y Python nos lo indica amablemente.

In [41]:
num = []  # ahora num está vacia
media = sum(num) / len(num)
media

ZeroDivisionError: division by zero

## Errores y excepciones



In [42]:
def calcular_media2(a):
    """
    Calcula la media partir de una lista.
    
    Parametros
    ----------
    a : lista
        lista que contiene los valores a promediar
    
    Resultado
    ----------
    res : float
        La media de los valores contenidos en a.
        Devuelve una advertencia si a está vacía.
    """
    try:
        res = sum(a) / len(a)
        return res
    except ZeroDivisionError:
        print('por favor pase una lista que no esté vacía')

In [43]:
calcular_media2([])

por favor pase una lista que no esté vacía


Ahora la función en vez de fallar devuelve un mensaje.
La novedad es que usamos el bloque `try-except`. Lo que hace esto es intentar correr lo que está dentro de cuerpo del `try`, si llegara a ocurrir un error del tipo `ZeroDivisionError` entonces se ejecuta lo que sea que esté dentro de `except` en este caso un mensaje, pero podría ser cualquier cosa. Si hubieramos escrito solo `except:` entonces el bloque `except` se ejecutaría sin importar el tipo de error, esto si bien es posible no se recomienda ya que puede llegar a ocultar _bugs_. Por ejemplo `sum()` (y también`len()`) devuelven un error si por ejemplo lo usáramos con un entero en vez de una lista.

In [44]:
calcular_media2(1)

TypeError: 'int' object is not iterable

### Mediana

La media es una buena descripción si los datos que estamos midiendo son más o menos similares, pero puede ofrecer una visión muy distorsionada si los datos no son muy similares entre si. Un ejemplo clásico son los ingresos, mientras algunas personas pueden ganar millones otras pueden tener ingresos de unos pocos pesos.

La mediana es el número que separa un conjunto de datos en una mitad superior y otra inferior. Como veremos más adelante es una medida más robusta que la media a valores extremos.

### Indexado

Para calcular la mediana necesitamos algunos conceptos nuevos. Una característica de las listas de Python es que es posible acceder a los elementos contenidos en ellas mediante índices. Los índices deben ser enteros, empiezan en 0 y terminan `len() - 1`, pero como veremos también pueden ser negativos.

In [45]:
lista = [5, 4, 3, 2, 1]
lista[0]  # el cero-ésimo elemento de la lista

5

In [46]:
lista[2]

3

In [47]:
lista[5] # este índice no existe en este caso y Python nos lo indica con un error

IndexError: list index out of range

In [48]:
lista[-1]  # devuelve el último elemento, que devolverá -2 y -6?

1

No solo es posible acceder a elementos individuales de una lista, también se puede acceder a rebanadas (`slices`).

In [49]:
lista[1:]  # del elemento 1 al final

[4, 3, 2, 1]

In [50]:
lista[1:4]  # del elemento 1 al 4

[4, 3, 2]

In [51]:
lista[::2]  # del primer elemento al último "de a 2"

[5, 3, 1]

In [52]:
lista[::-1]  # del primer elemento al último "de a -1", invierte el orden!

[1, 2, 3, 4, 5]

In [53]:
lista[:]  # un caso trivial, del primer al último elemento (equivale a no usar un slice!)

[5, 4, 3, 2, 1]

### Control de flujo

Ya estamos un poco más cerca de calcular la mediana, pero nos falta aprender lo que se conoce como control de flujo. Es común que al escribir un programa necesitemos ejecutar una acción de forma condicional, algo del estilo si pasa A entonces X si no entonces Y. Esto se consigue en Python con el bloque `if-else`.

In [54]:
if 2 > 1: # esto es cierto
    print('hola')
else:
    print('chau')

hola


si la condición a la derecha de `if` evalua como verdadero se ejecuta el cuerpo dentro de `if`, de lo contrario el bloque `else`. Veamos el siguiente ejemplo.

In [55]:
if 1 > 2: # esto es falso
    print('hola')
else:
    print('chau')

chau


El bloque `else` es opcional

In [56]:
if True: # esto es cierto
    print('hola')

hola


Es posible revisar más de una condición, en el siguiente ejemplo debido a que la expresión a la derecha de `if` evalua como falso se evalua la siguiente condición, que en este caso evalua como verdadera.

In [57]:
if 1 > 2: # esto es falso
    print('hola')
elif 2 > 1: # esto es cierto, solo se ejecuta si if evalua falso
    print('hello')
else:
    print('chau')

hello


El bloque `if-else` es algo similar al bloque `try-except`, pero este último está restringido a manejar posibles errores. En cambio el bloque `if-else` sirve para tomar decisiones que no tiene que ver con errores si no con el funcionamiento _normal_ de un programa. 

Las lista vacias, otros contenedores vacíos (que veremos luego), el numero 0, evaluan como `False`. Listas (u otros contenedores) con elementos, números distintos de 0 evaluan como `True`. 

In [58]:
if []:  # esto es falso
    print('hola')

In [59]:
if [7]:  # esto es verdadero
    print('hola')

hola


Todavía faltan un par de detalles, pero los vamos a ver directamente en la función. Es común al aprender una lenguaje encontrarse con codigo que contiene elementos desconocidos o "frases" que no sabiamos que eran posibles o legales.

In [60]:
def mediana(lista):
    """
    ejercicio escribir docstring!
    """
    lista_ordenada = sorted(lista)
    lista_len = len(lista_ordenada)
    idx = int((lista_len - 1) / 2)

    if lista_len % 2:
        return lista_ordenada[idx]
    else:
        return (lista_ordenada[idx] + lista_ordenada[idx + 1]) / 2

Esta es una función bastante más compleja que `calcular_media()`. La estudiemos linea por linea.

1. La primer linea (luego del docstring) ordena de menor a mayor los elementos dentro de "lista".
2. La segunda computa la longitud de `lista`.
3. La tercera calcula un número y se asegura que sea un entero, para que sea un índice válido. 
4. Esta linea evalua `True` solo si `lista_len` es impar. Podés darte cuenta por qué? (tip: probá ese bloque de código en una celda separada). 
5. Si `lista_len` es par entonces se ejecutará el bloque `else`. La razón de tener este bloque es que si la cantidad de elementos es par NO es posible obtener el valor "del medio", entonces la mediana la computamos como un promedio de los "dos valores medios".

In [61]:
mediana([1, 2, 3, 4, 5])

3

------------------

### Ejercicio

7. Modifique la función `calcular_media2` para que en vez de usar un `try-except` use un `if` a fin de evitar un error cuando se pase una lista de valores vacia.

------------------

###  Varianza

Mide la dispersión de un conjunto de valores. Es cero para un conjunto de valores idénticos.

$$V(x) = E[(x - \mu)^2] = \int_{-\infty}^{\infty} (x-\mu)^2 d(x) = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2$$

Donde $\mu$ es la media de $x$. La desviación estándard se calcula como la raíz cuadrada de la varianza y tiene la ventaja de estar en la misma escala de los datos.

Para poder calcular la varianza usando Python tenemos todos los elementos necesarios. Veamos un posible algoritmo:

In [62]:
def varianza(valores):
    """
    ejercicio escribir docstring!
    """
    media = calcular_media2(valores)
    diff_sq = []
    for i in valores:
        diff_sq.append((media - i) ** 2)
    return calcular_media2(diff_sq)

In [63]:
varianza([0, 1, 2.72, 3.14])

1.623275

------------------

### Ejercicio

8. Escribir el docstring de la función `varianza`
9. Una formula alternativa para la varianza es $V(x) = E[x^2] - E[x]^2$. Es decir, la media del cuadrado de $x$ menos el cuadrado de la media de $x$. Escriba una función que calcule la varianza usando esta formula. En la practica este método [no se recomienda](https://www.johndcook.com/blog/2008/09/26/comparing-three-methods-of-computing-standard-deviation/), pero eso no es relevante para el ejercicio.

------------------

### Rango

Al trabajar con Python es común repetir una _frase_ como la siguiente

In [64]:
d = []
for i in [0, 1, 2, 3, 4, 5, 6, 7, 8]:
    d.append(i ** 2)
d

[0, 1, 4, 9, 16, 25, 36, 49, 64]

Este patrón en donde iteramos a lo largo de una lista de enteros es tan común en Python (y otros lenguajes) que existe varias funciones que facilitan esta tarea. Una de ellas es `range`. 

`range` usa la sintaxis [start:stop:step] a fin de generar enteros desde `start`, hasta `stop` (sin incluirlo) y opcionalente de a `step` pasos (por defecto 1). `start` es también opcional en cuyo caso empezará en 0. Como pueden ver la sintaxis es similar a lo que ya vimos con la rebanadas de una lista. La diferencia es que las rebanadas operan sobre una lista existente y la función de `range` es la de generar un objeto que _devuelve_ enteros. 

In [65]:
d = []
for i in range(0, 9):
    d.append(i ** 2)
d

[0, 1, 4, 9, 16, 25, 36, 49, 64]

`range` es un objeto que contiene las reglas para devolver los valores requeridos, pero no _contiene_ a los valores. Esto es un _truco_ que permite ocupar menos memoria. Se requiere menos memoria para especificar la regla, "devuelva todos los enteros de 0 a 1 millón", que para escribir un millón de enteros.

En la siguiente celda vemos una diferencia entre el objeto `range` y una lista generada a partir de convertir `range` usando el comando `list`.

In [66]:
range(9), list(range(9))

(range(0, 9), [0, 1, 2, 3, 4, 5, 6, 7, 8])

------------------

### Ejercicio

10. Defina un objeto range, por ejemplo `r = range(9)` y luego use `r.<tab> para inspeccionarlo. Alternativamente prube usar dir(r)
------------------

### Listas por comprensión

Otro patrón común en Python es el siguiente:

* Creamos una lista vacía.
* Iteramos a largo de algún _iterable_ como un lista o un _rango_.
* Guardamos valores en la lista originalmente vacía.

Este patrón es tan común que Python ofrece una versión alternativa. Esta versión alternativa se llama _list comprehension_ (o _listcomps_), en castellano listas por comprensión. Veamos un ejemplo. Si tenemos:

```python
d = []
for i in range(9):
    d.append(i**2)
```

podemos escribirlo como 

In [67]:
d = [i ** 2 for i in range(9)]

En palabras podríamos leer esta expresión como, "la lista d es la lista de los elementos i al cuadrado para i en en rango de 0 a 9" o ligeramente distinto "tome la variable i elevela al cuadrado y repita para todos los valores de i en el rango de 0 a 9". 

El nombre "... por comprensión" se debe a que la sintáxis sigue la logica de la definición de conjuntos matemáticos por [comprensión](https://es.wikipedia.org/wiki/Conjunto#Notaci%C3%B3n) (en oposición a la definición por extensión).

La principal razón por la cual las listas por comprensión son preferedias por sobre un `for-loop` es que las primeras son más explícitas ya que solo sirven para crear listas, mientras que un `for-loop` se puede usar con muchos fines.

Usando listas por comprensión podemos calcular la varianza de la siguietne forma.

In [68]:
def varianza(valores):
    media = calcular_media2(valores)
    diff_sq = [(media - i) ** 2 for i in valores]
    return calcular_media2(diff_sq)

Las listas por comprensión suelen ser ligeramente más rápidas de ejecutar que un `for-loop`. Esta diferencia no suele ser muy relevante en la práctica. Pero nos da una excusa para usar una de la _magics_ de jupyter.

Hagamos un breve experimento para comparar velocidades. Un problema al comparar tiempos de dos o más algoritmos/implementaciones es que hay variaciones externas que pueden afectar los tiempos de ejecución (una notificación, tareas de mantenimiento del sistema operativo, etc). Por eso conviene ejecutar el código varias veces y tomas un promedio y desviación standard. Las magics `timeit` hacen precisamente eso.

In [69]:
valores = range(10000)

In [70]:
%timeit [i ** 2 for i in valores]  #  un "%" se aplica solo a una linea

1.77 ms ± 20.5 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


In [71]:
%%timeit  #  dos "%" se aplcia a toda la celda
diff_sq = []
for i in valores:
    diff_sq.append(i ** 2)

1.97 ms ± 122 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


Efectivamente vemos que hay una diferencia.

```python
* [something for item in iterable]                               # list comprehension                   
* [something for item in iterable if condition]                  # list comprehension with if           
* [something if condition else otherthing for item in iterable]  # list comprehension with if and else  
```

## Cadenas

Como ya vimos una _cadena_ es un tipo de variable que almacena texto. En principio uno podría pensar que las variables tipo cadena o texto en general no tiene nada que ver con la estadística, pero esa apreciación es errada. Hay varias razones por las cuales se usan cadenas. Las cadenas pueden aparacer como rótulos en los datos, indicando los valores de filas o columnas (en una base de datos, planilla de cálculo, etc), o pueden ser el propio objeto de estudio. Por ejemplo podemos estar interesados en estudiar la distribución de nombres de personas a lo largo del tiempo. O secuencias biológicas (como proteinas o ADN). Existe además una disciplina llamada Procesamiento del Lenguaje Natural (NLP por su sigla en inglés) que nos puede ayudar a entender una respuesta social frente a un evento analizando tweets o generar métodos de tradución automática de texto. En todos estos casos se hace necesario trabajar con cadenas en algún punto del proceso. 

A continuación veremos algunos de las opciones que ofrece Python para manipular cadenas.

Las cadenas deben definirse usando comillas dobles `" "` o simples `' '`.

In [72]:
s = "Hola mundo"
type(s)

str

Las cadenas tienen algunas similitudes con las listas. Por ejemplo es posible determinar la longitud de una cadena, es decir el número de caracteres que la componen.

In [73]:
len(s)

10

Es posible usar enteros para indexar cadenas.

In [74]:
s[0]

'H'

Si quisieramos obtener el último elemento de una cadena podemos hacer.

In [75]:
s[-1]

'o'

Además es posible obtener rebanadas (slices), mediante la sintaxis, _[desde:hasta]_

In [76]:
s[0:4]

'Hola'

In [77]:
s[5:10]

'mundo'

Es posible omitir el _desde_, Python asumirá que es desde el principio. De la misma forma es posible omitir el _hasta_, Python asumirá que es hasta el final.

In [78]:
s[:4]

'Hola'

In [79]:
s[5:]

'mundo'

In [80]:
s[:] # esto es lo mismo que s

'Hola mundo'

Además es posible definir el _paso_ de las rebanadas (slices), usando la sintaxis  _[desde:hasta:paso]_

In [81]:
s[::1]  # esto es lo mismo que s o s[:]

'Hola mundo'

In [82]:
s[::3]

'Hauo'

En Python es posible sumar cadenas.

In [83]:
r = '!'
s + r 

'Hola mundo!'

Se dice que el operador `+` está sobrecargado (overloaded) ya que además de su definición matemática original aplicable a números es posible aplicarlo a cadenas, resultando en la concatenación de las mismas.

También es posible multiplicar cadenas por enteros.

In [84]:
s + r*3

'Hola mundo!!!'

------------------

### Ejercicio

11. La distancia de Hamming entre dos cadenas de igual longitud se define como el número de posiciones con caracteres diferentes. Por ejemplo la distancia de Hamming para lechu**z**a y lechu**g**a es 1. Escriba una función que calcule esta distancia.
------------------

### Métodos de cadenas

Con lo que hemos visto podemos crear una función para determinar si una palabra es palíndromo

In [85]:
def es_palindromo(palabra):
    return palabra == palabra[::-1]

es_palindromo('somos')

True

Ahora veamos como generalizar esta función para más de una palabra, por ej "luz azul"

In [86]:
es_palindromo('luz azul')

False

Las cadenas en Python tienen muchos métodos, por ejemplo `split` devuelve una lista de strings por defecto la lista es generada "separando" un strings cada vez que se encuentra un espacio en blanco.

In [87]:
aforismo = 'A más cómo, menos por qué'
aforismo.split()

['A', 'más', 'cómo,', 'menos', 'por', 'qué']

Este comportamiento lo podemos cambiar pasando como argumento el caracter que queremos usar como separador.

In [88]:
aforismo.split(',')

['A más cómo', ' menos por qué']

Otro método es `lower` que tiene como efecto devolver una nueva cadena donde todos los caracteres son minúsculas

In [89]:
'LuZ AzUl'.lower()

'luz azul'

otro método es replace que nos permite reeplazar caracteres, incluso podemos reemplazar un espacio en blanco por nada.

In [90]:
'Luz azul'.replace(' ', '')

'Luzazul'

Combinando estos dos últimos métodos podemos crear una versión más versatil de `es_palindromo`.

In [91]:
def es_palindromo(palabra):
    nueva_palabra = palabra.lower().replace(' ', '')  # es posible concatenar métodos
    return nueva_palabra == nueva_palabra[::-1]

es_palindromo('Luz azul')

True

Las cadenas poseen muchos otros métodos, como por ejemplo

In [92]:
s.upper()  # Devuelve una copia de la cadena original, pero en mayúsculas

'HOLA MUNDO'

In [93]:
s.count('o')  # cuenta la cantidad de veces que una subcadena aparece en una cadena

2

In [94]:
s.index('o')  # devuelve el índice en el cual una subcadena aparece (por primera vez)

1

Para seguir explorando otras funciones aplicables a cadenas podés usar la sugerencia que ofrece Jupyter al presionar _tab_.

In [95]:
# s.

####  Formateado de cadenas

En muchas ocasiones es necesario dar algún formato específico a cadenas, por ejemplo al imprimir resultados en pantalla o guardar datos en un archivo. Algunos de los casos más usados son:

In [96]:
val = 42
"valor = {:.3f} unidades".format(val)

'valor = 42.000 unidades'

In [97]:
"{:.3f}, {:03d}, {}, {:>10}".format(3.1415, 42, 'abc', 'xyz')

'3.142, 042, abc,        xyz'

A partir de Python 3.6 se incorporó una nueva forma de formatear cadenas, las `f-strings`. Qué es la más usada y recomendada actualmente.

In [98]:
f"valor = {val:.3f} unidades"

'valor = 42.000 unidades'

Como pueden ver las f-strings son similares a `.format()`, solo que un poco más directas ya que permiten pasar variables directamente dentro de la cadena. Incluso podemos realizar operaciones con la variable dentro de la cadena.

In [99]:
f"valor = {(val**2)/3:.3f} unidades"

'valor = 588.000 unidades'

Podríamos querer que la función `es_palindromo` nos devuelva un mensaje más amigable que True o False. Una opción que la función no devuelva ningún valor si no que imprima un mensaje, por ejemplo

In [100]:
def es_palindromo(palabra):
    nueva_palabra = palabra.lower().replace(' ', '')
    if nueva_palabra == nueva_palabra[::-1]:
        print(f'{palabra} es un palíndromo')
    else:
        print(f'{palabra} no es un palíndromo')
        
es_palindromo('Luz azul')

Luz azul es un palíndromo


In [101]:
def histograma(cadena):
    visto = []
    cadena_nueva = cadena.lower().replace(' ', '')
    for c in cadena_nueva:
        if c not in visto:
            print(f'{c} aparece {cadena_nueva.count(c)} veces')
            visto.append(c)

In [102]:
cadena="Aquella solitaria vaca cubana."
histograma(cadena)

a aparece 8 veces
q aparece 1 veces
u aparece 2 veces
e aparece 1 veces
l aparece 3 veces
s aparece 1 veces
o aparece 1 veces
i aparece 2 veces
t aparece 1 veces
r aparece 1 veces
v aparece 1 veces
c aparece 2 veces
b aparece 1 veces
n aparece 1 veces
. aparece 1 veces


Podemos mejorar algunos aspectos de esta función, por ejemplo unificar caracteres con y sin tilde. y eliminar signos de puntuación no solo espacios en blanco. Para ello vamos a usar el método `maketrans` que nos permite crear una tabla de correspondencia entre el primer y segundo argumento. El tercer argumento indica los caracteres que sean reemplazados por nada. Otro truco de la siguiente función es que usa "vez" y "veces" según corresponda (queda como ejercicio explicar como se logra esto).

In [103]:
def histograma(cadena):
    visto = []
    trans = str.maketrans('áéíóúü','aeiouu', ':,. ')
    cadena_nueva = cadena.lower().translate(trans)
    for c in cadena_nueva:
        if c not in visto:
            cantidad = cadena_nueva.count(c)
            d = 'vez' if cantidad == 1  else 'veces'
            print(f'{c} aparece {cantidad} {d}')
            visto.append(c)
            

histograma(cadena)

a aparece 8 veces
q aparece 1 vez
u aparece 2 veces
e aparece 1 vez
l aparece 3 veces
s aparece 1 vez
o aparece 1 vez
i aparece 2 veces
t aparece 1 vez
r aparece 1 vez
v aparece 1 vez
c aparece 2 veces
b aparece 1 vez
n aparece 1 vez


### Listas

A continuación vamos a extender lo que ya vimos de listas anteriormente. Como ya vimos las listas y las cadenas comparten varias características, como la posibilidad de indexarlas y de tomar rebanadas. La principal diferencia es que las listas pueden contener elementos de distintos tipos, como enteros, cadenas e incluso otras listas.


In [104]:
lista = [1, 'a', 1.0, [42, 7]]
lista

[1, 'a', 1.0, [42, 7]]

Una lista que contiene a una o más listas es llamada _anidada_. Otro ejemplo de lista anidada podría ser:

In [105]:
m = [[0, 1], [2, 3]]
m

[[0, 1], [2, 3]]

Dado que la lista _m_ es una lista de listas es necesario usar dos indices para acceder a cada entero almacenado en _m_. Veamos.


In [106]:
m[1] # el segundo elemento de la lista m es otra lista.

[2, 3]

In [107]:
m[1][0]  # el primer elemento de la segunda lista

2

###  Métodos de las listas

Python provee de varios _métodos_ que permiten operar sobre listas como el _método_ _append_ que permite agregar un elemento al final de una lista.

In [108]:
l = [] # crea una lista vacía
l

[]

In [109]:
l.append(10)
l.append(9)
l.append(8)

In [110]:
l

[10, 9, 8]

O el método _extend_ que permite agregar los elementos de una lista al final de otra lista

In [111]:
lista.extend(l)
lista

[1, 'a', 1.0, [42, 7], 10, 9, 8]

Ordenar elementos de una lista suele ser una tarea común en programación. En Python encontramos el método _sort_ que ordena los elementos de una lista.

In [112]:
lista = [1, 10, 100, 1000]
lista.sort(reverse=True)
lista

[1000, 100, 10, 1]

Otro método comunmente usado es _pop_ que devuelve un valor de una lista y lo elimina. Si no se usa ningún argumento, por defecto devolverá el último valor de la lista.

In [113]:
lista.pop()

1

In [114]:
lista # ahora lista no contiene el elemento 1

[1000, 100, 10]

Algo similar al método _pop_ es el comando _del_

In [115]:
del lista[0]
lista # el elemento con indice 0, es decir, el número 1000 ya no está en la lista

[100, 10]

También es posible eliminar elementos, indicando el elemento que se desea borrar y no el índice.

In [116]:
lista.remove(10) # se borró el número 4
lista

[100]

### Tuplas

Las tuplas son como las listas, pero son inmutables, es decir una vez creadas no pueden ser modificadas. 

En Python, las tuplas son creadas usando la sintaxis _(..., ..., ...)_ o _...,...,..._

In [117]:
tupla = (10, 20)
tupla, type(tupla)

((10, 20), tuple)

In [118]:
tupla = 10, 20
tupla, type(tupla)

((10, 20), tuple)

Es posible usar una tupla para asignar más de una variable al mismo tiempo.

In [119]:
x, y = tupla
x, y

(10, 20)

Si intentamos asignar un nuevo valor a un elemento de una tupla obtenemos un error:

In [120]:
tupla[0] = 42

TypeError: 'tuple' object does not support item assignment

Aveces suele ser necesario, intercambiar los valores de dos variables. Usando la asignación convencional se requiere de una variable temporaria. 

In [None]:
a, b = 1, 2
temp = a
a = b
b = temp

a, b

Una version más simple es usar tuplas

In [None]:
a, b = 1, 2
a, b = b, a
a, b

El número de variables a la izquierda debe coincidir con el número de valores a la derecha.

In [None]:
a, b = 1, 2, 3

Dado que las tuplas y las listas son tan parecidas es común que surga la pregunta ¿Cúando es conveniente usar una y cuando la otra?

Al ser las tuplas inmutables, son más eficientes (en términos de memoria y procesador) que la listas. Por lo que si algún problema puede resolverse tanto con listas como por tuplas, entonces las tuplas se prefieren si la eficiencia es importante.

Una diferencia que puede resultar algo más sutil es la siguiente. Si bien las listas pueden contener elementos de distinto tipo (heterogéneas) su uso más común es cuando todos los elementos son del mismo tipo (homogéneas). Por otro lado es más común que las tuplas sean heterogéneas. En general en una tupla las posiciones tienen significado, mientras que las listas no. Por ejemplo para representar la localización geográfica de sensores podríamos usar una lista de tuplas, la longitud de la lista sería equivalente a la cantidad de sensores desplegados y usaríamos una tupla de tres elementos para indicar la latitud, longitud y altitud. En este ejemplo se puede ver que el ordenamiento de los sensores en la lista podría ser arbitrario, pero en cambio las posiciones en la tupla tienen un significado algo más preciso (ya sea por convención con nuestros pares o por que podríamos tener alguna función que espera un orden particular). Otro ejemplo es usar una lista de tuplas para guardar los nombres de nuestros contactos (una tupla por contacto), donde el primer elemento de la tupla sería el nombre y el segundo el apellido.

## Diccionarios

Los diccionarios son parecidos a las listas y a las tuplas, excepto que cada elemento es un par clave-valor. Otra diferencia es que los elementos de un diccionario no están ordenados. Es por ello que en vez de usar índices accedemos a un diccionario usando _claves_.

La sintaxis de los diccionarios es 
_{clave1 : valor1, clave2 : valor2, ...}_:

In [121]:
parametros = {"parametro1" : 1.0,
              "parametro2" : 2.0,
              "parametro3" : 3.0,}

parametros, type(parametros)

({'parametro1': 1.0, 'parametro2': 2.0, 'parametro3': 3.0}, dict)

In [122]:
parametros["parametro2"]

2.0

Si necesitamos agregar una nueva entrada basta con

In [123]:
parametros["parametro4"] = "D"
parametros

{'parametro1': 1.0, 'parametro2': 2.0, 'parametro3': 3.0, 'parametro4': 'D'}

In [124]:
def histograma(cadena):
    dic = dict()
    trans = str.maketrans('áéíóúü','aeiouu', ':,. ')
    cadena_nueva = cadena.lower().translate(trans)
    
    for c in cadena_nueva:
        if c not in dic:
            dic[c] = 1
        else:
            dic[c] += 1
        
            
    return dic

dic = histograma(cadena)
dic

{'a': 8,
 'q': 1,
 'u': 2,
 'e': 1,
 'l': 3,
 's': 1,
 'o': 1,
 'i': 2,
 't': 1,
 'r': 1,
 'v': 1,
 'c': 2,
 'b': 1,
 'n': 1}

In [125]:
for k, v in dic.items():
    d = 'vez' if v == 1  else 'veces'
    print(f'{k} aparece {v} {d}')

a aparece 8 veces
q aparece 1 vez
u aparece 2 veces
e aparece 1 vez
l aparece 3 veces
s aparece 1 vez
o aparece 1 vez
i aparece 2 veces
t aparece 1 vez
r aparece 1 vez
v aparece 1 vez
c aparece 2 veces
b aparece 1 vez
n aparece 1 vez


In [126]:
histograma(cadena)

{'a': 8,
 'q': 1,
 'u': 2,
 'e': 1,
 'l': 3,
 's': 1,
 'o': 1,
 'i': 2,
 't': 1,
 'r': 1,
 'v': 1,
 'c': 2,
 'b': 1,
 'n': 1}

-------------
### Ejercicio

12. El dueño de un rotisería reportó que el salario promedio en su negocio es de alrededor de 90000 pesos. Usando la variable `sueldos`. a) indique si esto es correcto, b) La variable sueldos incluye el salario del dueño que es de 270000 pesos, calcule el salario medio de todos los empleados sin incluir al dueño. c) Calcule la mediana. Explique los resultados.

        sueldos = [54000, 56000, 59000, 64000, 64000, 66000, 270000]


13. `range` (rango) además de ser una palabra reservada de Python es un termino usado en estadística. Se calcula como la diferencia entre el valor más grande y el más pequeño de un conjunto de datos. Implemente una función que lo calcule. Qué opina del rango como medida de dispersión de los datos comparado con la varianza?


14. Los diccionarios tienen un método `get` que toma una clave y un valor predeterminado. Si la clave aparece
en el diccionario, `get` devuelve el valor correspondiente, de lo contrario, devuelve el valor predeterminado.
Use `get` para escribir una versión más concisa de `histograma`. Debería poder eliminar la declaración `if`.


15. Implemente el algoritmo babilonico, descripto en la notebook anterior para el cálculo de la raiz cuadrada.
 
**NOTA:** en general, es "peligroso" operar con igualdad entre flotantes ya que la representación computacional de los mismos es un valor aproximado. 
Es decir, valores como $1/3$ o $\sqrt{2}$ no se pueden representar de manera exacta con un flotante (_float_). 
Por lo tanto, en vez de comparar `x == y`, el enfoque más conveniente es comparar el valor absoluto de la diferencia con un valor de magnitud. 
    $$\text{if } abs(y-x) < epsilon: \text{break}$$
donde $epsilon$ es un valor (por ejemplo $0.0000001$) que determina cuándo los valores que se están comparando son "tan parecidos" que deberían considerarse como el "mismo" para el problema.
 
-------------

## Bibliotecas o librerías

En los ejemplos anteriores hemos visto como calcular la media, mediana y la varianza. Vimos, además, que es posible usar listas para almacenar y operar con valores y además es posible _encapsular_ código dentro de funciones y así reutilizarlo. El principal motivo de estos ejemplos fue motivar el aprendizaje de Python. En la práctica el cálculo de las funciones como la media o la varianza son tan comunes que resulta muy conveniente poder acceder a estas funciones sin necesidad de que debamos escribirlas nosotros. Es por esto que en Python (y otros lenguajes) existen las _bibliotecas_, que permiten extender el lenguaje. En el fondo estás bibliotecas (llamadas también _librerías_) no son otra cosa que un conjunto de funciones del estilo que aprendimos a escribir en este capítulo. En general las bibliotecas contienen funciones optimizadas, es decir funciones que corren rápido o que reducen la posibilidad de errores numéricos o que soporta diversidad de entradas. Por lo que la ganancia al usarlas no es solo que nos ahorran tiempo si no que en general nos ahorran dolores de cabeza!

Uno de los puntos fuertes de Python es su extenso _ecosistema_. Algunas de las librerías más usadas en ciencia, y en particular análisis de datos son:


* [Numpy:](https://numpy.org/) Cálculo numerico y algebra lineal.
* [Scipy:](https://scipy.org/) Funciones comunmente usadas en ciencias.
* [Matplotlib:](https://matplotlib.org/) Gráficas científicas.
* [Seaborn:](https://seaborn.pydata.org/) Gráficas cientificas _atractivas_.
* [Jupyter:](https://jupyter.org/) Computación interactiva.
* [Pandas:](https://pandas.pydata.org/) Procesamiento de datos.
* [Scikit-learn:](https://scikit-learn.org/stable/) Machine Learning.
* [Statsmodels:](https://www.statsmodels.org/stable/index.html) Estadística _"clásica"_.
* [PyMC:](https://www.pymc.io/welcome.html) Estadística Bayesiana.
* [SymPy:](https://www.sympy.org/en/index.html) Matemática simbólica.
* [Sage:](https://www.sagemath.org/) Es un entorno matemática basado en Python y varias de las bibliotecas arriba mencionadas.
* _agregá tu paquete favorito acá_

En general las librerías se construyen sobre otras librerías. En el siguiente esquema se ve parte del ecosistema de Python ordenado (radialmente). Donde un nivel se construye sobre los inferiores.

<img src='imagenes/Python_Stack.png' width=500>

Además de estas bibliotecas _externas_ Python se distribuye con algunas bibliotecas _estándard_, por ejemplo `math` tiene varias funciones matemáticas. Para poder usarla necesitamos importarla de la siguiente forma.

In [127]:
import math

Ahora que la importamos podemos usarla por ejemplo para calcular un logaritmo (base e).

In [128]:
math.log(10)

2.302585092994046

Qué otras funciones están disponibles dentro de `math`? Una forma de averiguarlo es usando la ayuda que nos ofrece jupyter. Recordá que basta escribir `math.` seguido de `Tab` para que Jupyter nos haga recomendaciones!

## Para seguir leyendo

Hasta este momento hemos visto algunos de los elementos básicos de Python. Python es un lenguaje muy rico y expresivo que cuenta con muchas otras características útiles que hemos omitido y que son necesarias para lograr un manejo fluido de este lenguaje. Algunos de los elementos omitidos son lecto-escritura de archivos, `set`(conjuntos), programación orientada a objetos, decoradores, generadores.

Los elementos vistos hasta ahora son aquellos que consideramos más importantes para el resto de este curso. Para quienes quieran profundizar en los topicos vistos o aprender nuevos conceptos sugerimos los siguientes recursos. 

* [Think Python](http://greenteapress.com/wp/think-python/) Muy buen libro introductorio de Python.
* [Automate the Boring Stuff with Python](https://automatetheboringstuff.com/#toc) Libro introductorio de Python que enseña a escribir programas para automatizar tareas cotidianas y tediosas.
* [Think Stats](https://greenteapress.com/wp/think-stats-2e/) Una introducción a probabilidad y estadística para personas familiarizadas con Python.
* [Fluent Python](https://www.oreilly.com/library/view/fluent-python-2nd/9781492056348/) Este no es un libro para principiantes. Es un libro avanzado recomendado para quienes ya tienen manejo de Python.
* [Python](https://www.python.org/) La página oficial de Python

## Apéndice 

### Nombres reservados

Existen algunas palabras en Python que tienen un significado predefinido y no pueden ser usadas como nombres de variables. Estas palabras claves (_keywords_) son:

    False, None, True, and, as, assert, async, await, break, class, continue, def, del, elif, else, except, 
    finally, for, from, global, if, import, in, is, lambda, nonlocal, not, or, pass, raise, return,
    try, while, with, yield
    
No tiene demasiado sentido recitarlas hasta memorizarlas es mejor ir aprendiéndolas con el uso. Ante la duda se puede revisar esta lista. De todas formas la mayoría de los entornos de programación (como las notebooks de Jupyter) resaltan estas palabras reservadas con algún color en especial. Por ejemplo Jupyter lo hace en verde y negrita.

### Funciones pre-definidas

    abs()          copyright()    getattr()      list()         range()        vars()         
    all()          credits()      globals()      locals()       repr()         zip()          
    any()          delattr()      hasattr()      map()          reversed()     
    ascii()        dict()         hash()         max()          round()        
    bin()          dir()          help()         memoryview()   set()          
    bool()         display()      hex()          min()          setattr()      
    breakpoint()   divmod()       id()           next()         slice()        
    bytearray()    enumerate()    input()        object()       sorted()       
    bytes()        eval()         int()          oct()          staticmethod() 
    callable()     exec()         isinstance()   open()         str()          
    chr()          filter()       issubclass()   ord()          sum()          
    classmethod()  float()        iter()         pow()          super()        
    compile()      format()       len()          print()        tuple()        
    complex()      frozenset()    license()      property()     type()