# Introducción a Python

[Python](http://www.python.org/) es:
* un lenguaje de programación moderno
* de propósito general (se suele decir que Python no es el mejor lenguaje para casi nada, pero es suficientemente bueno para casi todo)
* multiparadigma (es posible programar usando distintos _estilos_ de programación incluso combinándolos)
* de alto nivel (es decir cercano al lenguaje humano y lejos del _lenguaje de máquinas_)
* es interpretado (es decir no es necesario _compilarlo_ antes de correrlo)
* es multiplataforma (corre en diversos sistemas operativos)


### ¿Por qué es un buen lenguaje de programación científica?

* Es un lenguaje simple: El código es simple de leer, de escribir y de mantener.

* Es gratuito y es una herramienta de [código abierto](https://es.wikipedia.org/wiki/C%C3%B3digo_abierto).

* Está muy bien documentado.

* Es ampliamente usado en la mayoría de las disciplinas científicas

* Tiene una gran comunidad de usuarios (no todos científicos), por lo que es fácil encontrar ayuda, tutoriales, foros, blogs, etc. por ejemplo en [StackOverflow](stackoverflow.com).

* Buena _performance_. Aunque estrictamente es un lenguaje _lento_ (el costo de la simplicidad). Existen formas de acelerarlo.

* Posee un extenso _ecosistema_ de librerías

<br>
    <a href="https://www.youtube.com/watch?v=5GlNDD7qbP4">
    <img src='imagenes/Python_Stack.png' width=500 >
    </a>

<br>

* [Numpy:](http://numpy.scipy.org)  Cálculo numerico y algebra lineal
* [Scipy:](http://www.scipy.org) -  Funciones comunmente usadas en ciencias
* [Matplotlib:](http://www.matplotlib.org) - Gráficas científicas
* [Seaborn:](http://web.stanford.edu/~mwaskom/software/seaborn/) - Gráficas cientificas _atractivas_.
* [Jupyter:](http://jupyter.org/) - Computación interactiva
* [Pandas:](http://pandas.pydata.org/) - Procesamiento de datos
* [Scikit-learn:](http://scikit-learn.org/) - Machine Learning 
* [Statsmodels:](http://statsmodels.sourceforge.net/) Estadística _"clásica"_
* [PyMC3:](http://pymc-devs.github.io/pymc3/) - Estadística Bayesiana
* [SymPy](http://www.sympy.org/en/index.html) - Matemática simbólica
* [Sage](http://sagemath.org/) - Es un entorno matemática basado en Python y varias de las librerías arriba mencionadas
* _agregá tu paquete favorito acá_

#### Ahora si, veamos los elementos básicos de la programación en Python!

### Valores y Tipos
Un valor es uno de los "componentes" más básicos con los que trabaja un programa como un caracter o un número. Como ejemplos de valores se pueden considerar $2$, $42.0$, $'c'$, $"Hola!"$. 

Estos valores son de diferentes tipos: $2$ es un entero, $42.0$ es un número de punto flotante y $"Hola!"$ es un string (cadena de caracteres).
En caso de tener dudas respecto al tipo de cada valor, se puede consultar usando el comando _type_

In [20]:
type(2)

int

In [21]:
type(42.0)

float

In [22]:
type('Hello, World!')

str

In [23]:
1,000,000 # para enteros grandes, no se debe agregar comas ni puntos- Más adelante veremos tuplas

(1, 0, 0)

In [24]:
type(02) # ceros a la izquierda

SyntaxError: invalid token (<ipython-input-24-38da4a590f0b>, line 1)

## Variables

En programación se le llama **variable** a un espacio en la memoria de la computadora que almacena un **valor** determinado y que tiene asociado un identificador (o nombre). 
Es este indentificador el que nos permite referirnos a ese valor y manipularlo. 
Dicho de forma más simple una variable es "eso" donde guardamos información para luego usar y que es posible referenciar usando un nombre que definimos a nuestro gusto. 
Es importante elegir nombres representativos a las variables ya que esto puede ayudar bastante a enteder el programa que se está desarrollando.

Los nombres de las variables NO pueden empezar con números. Python 3 (pero no 2) permite usar caracteres como letras griegas, caracteres acentuados, la ñ, etc. Por convención, los nombres de las variables y funciones comienzan con una letra minúscula, mientras que los nombres de las _clases_ (se verán más adelante en el curso) comienzan con una letra mayúscula.

Por lo general, en Python se usa guion bajo ($_$) para separar palabras en los nombres de variables, por ejemplo "contador_general" o "monto_acumulado_pesos". Se recomienda no definir nombres muy largos (no más de 32 caracteres). En el siguiente [link](https://www.python.org/dev/peps/pep-0008/#naming-conventions) se pueden consultar distintos criterios para definir nombres de varibales en Python.

#### Nombres reservados

Existen algunas palabras en Python que tienen un significado predefinido y no pueden ser usadas como nombres de variables. Estas palabras claves (_keywords_) son:

    False, None, True, and, as, assert, break, class, continue, def, del, elif, else, except, 
    finally, for, from, global, if, import, in, is, lambda, nonlocal, not, or, pass, raise, return,
    try, while, with, yield
    
No tiene demasiado sentido recitarlas hasta memorizarlas, lo mejor es ir aprendiéndolas con el uso. Ante la duda se puede revisar esta lista. De todas formas la mayoría de los entornos de programación (como las notebooks de Jupyter) resaltan estas palabras reservadas con algún color en especial. Por ejemplo Jupyter lo hace en verde y negrita. Otras partes especiales del código (que ya iremos aprendiendo), también son resaltadas. El resaltar distintas porciones de código con distintos colores ayuda la lectura, comprensión y modificación del código. 

Si intentamos asignar un valor a una palabra reservada obtendremos un error (excepto algunas excepciones como `range`).

In [None]:
import = 1

#### Asignaciones

Para poder decirle a Python que queremos generar una nueva variable basta con escribir el nombre de la variable seguido del operador "=" y luego el valor de la variable. Al hacer esto decimos que estamos **asignando una variable**.

In [25]:
x = 2.0
y = 'hola'
x, y

(2.0, 'hola')

Es importante destacar que en Python el signo `=` no indica igualdad, sino que se usa para asignar variables. Las siguientes lineas no tendrían sentido si el signo `=` implicara igualdad.

In [26]:
x = x + 1 # x NO es igual a x más 1!
x

3.0

Si tuvieramos que leer la celda anterior en voz alta diríamos; "_tome el valor de la variable `x` 
súmele `1` y guarde el resultado en la variable `x`_". Es decir, SIEMPRE en una operación de asignación, primero se resuelve el término de la derecha.

Como esta operación es muy común Python ofrece una versión abreviada.

In [27]:
x += 1
x

4.0

In [28]:
x-= 1
x

3.0

#### Comentarios
Los comentarios son necesarios para documentar algunos aspectos del código que no son obvios. Es decir, es razonable pensar que quien esté leyendo el código puede determinar, **cómo** funciona el mismo; sin embargo, en ciertas ocasiones, puede no saber **porqué** lo hace. Por ejemplo, 
Este comentario es redundante e innecesario para el código:

In [29]:
vel = 5 # asiga 5 a vel

En cambio el siguiente contiene información del dominio del problema que figura en el código:

In [30]:
vel = 5 # velocidad en metros/segundos

Una buena definición de nombres de variables puede reducir la necesidad de ciertos comentarios, sin embargo, como se mencionó anteriormente, definir nombres largos hace que las expresiones sean difíciles de leer.

In [31]:
x, y  # todo lo escrito luego del signo # es un comentario.
# Los comentario están destinados a ser leidos por humanos, por lo tanto Python los ignora.

(3.0, 'hola')

#### Tipos de variables

En muchos lenguajes de programación (como C/C++ o Fortran) antes de poder asignar valores a variables es necesario declararlas. Esto quiere decir que tenemos que indicar que nuestro porgrama usará una variable de nombre _tal_ que será del tipo _cual_. Recién una vez declarada la variable podemos asignarle valores concretos.

En cambio en Python las variables no se declaran, simplemente se les asigna valores usando el signo `=` (como vimos anteriormente). La variable _x_ usada más arriba no existía hasta que le asignamos un valor (sin necesidad de declararla previamente). Esto suele ser una de las ventajas de Python, ya que simplifica la escritura de código, al tiempo que es una de las razones por las cuales Python es más lento que lenguajes como C/C++ o Fortran. Aun cuando no es necesario declarar variables es importante saber que existen distintos tipos de variables.

En nuestro ejemplo `x` es una variable de tipo _flotante_ (float) mientras que `y` es una cadena (string).

In [32]:
type(x), type(y)

(float, str)

Al ser Python un lenguaje dinámico también es posible cambiar el _tipo_ de una variable durante la ejecucion de un programa. En el siguiente ejemplo la variable $y$ contiene primero una cadena (_string_) y luego un entero (_int_), en muchos lenguajes de programación esto resultaría en un error, pero no en Python.

In [33]:
y = 42
y, type(y)

(42, int)

Existen muchos tipos de variables predefinidos. Es incluso posible definir nuestros propios tipos de variables con sus propiedades (lo veremos más adelante en el curso). Por ahora veamos algunos de los tipos más comunes de variables:

In [34]:
# enteros
x = 1
type(x)

int

Si un número tiene un punto (equivalente a una coma en español) es un número decimal (aun cuando la parte decimal sea 0), en la jerga computacional se le suele decir a estos números *[flotantes](https://es.wikipedia.org/wiki/Coma_flotante)*. El nombre hace referencia a la forma en que se almacenan internamente los números reales en las computadoras (ver más adelante).

In [35]:
y = 1.0
type(y)

float

Otro tipo común son los *booleanos*, existen solo dos tipos de booleanos.

In [36]:
b1 = True
b2 = False

type(b1), type(b2)

(bool, bool)

Las cadenas (*strings*) son otro tipo de variables y Python ofrece muchas opciones para manipular cadenas, esta es una de las razones de su popularidad en bioinformática. En el siguiente ejemplo es importante notar que la variable `s` almacena al caracter que representa al número 1 y no el número entero 1. ¿Que pasaría si a la variable `s` le sumamos un entero? ¿Y si la multiplicamos por un entero?

In [37]:
s = '1'  
type(s)

str

Un tipo especial de variable que suele aparecer frecuentemente es *NoneType*, solo existe un objeto que sea de este tipo y es *None*.

In [38]:
z = None
type(None)

NoneType

### Operadores

Los operadores son símbolos especiales que representan _operaciones_ sobre variables.

#### Operadores aritméticos

Las operaciones aritméticas básicas son:

* adición: +
* sustracción: -
* multiplicación: *
* división: /
* división entera: //
* potencia: **
* módulo (resto de división): %

La mayoría de los operadores matemáticos en Python funcionan como uno esperaría, excepto por la división. En Python 2 al dividir dos enteros se obtiene siempre otro entero. Este comportamiento se ha modificado en Python 3, donde se obtiene siempre flotantes. Si estás usando Python 2 asegurate de incluir la siguiente linea en tus programas `from __future__ import division`.

In [39]:
1 + 2

3

In [40]:
1 - 2

-1

In [41]:
1 * 2

2

In [42]:
1 / 2 # Python 3 - división flotante

0.5

In [43]:
1//2 # en Python 3 - división entera

0

In [44]:
2**2

4

In [45]:
2**0.5

1.4142135623730951

In [46]:
7 % 4

3

El orden en que se ejecutan las operaciones aritméticas sigue las reglas de precedencia estándar de la matemática. Ante la duda, o para aumentar la claridad de una expresión, es posible usar paréntesis para agrupar operaciones

In [47]:
2 - 3 * 4

-10

In [48]:
2 - (3 * 4)

-10

In [49]:
(2 - 3) * 4

-4

####  Booleanos

 <img src="imagenes/raining_esp.jpg" width="550">

#### Operadores booleanos

En el álgebra Booleana, en vez de operar con valores numéricos se opera con los valores _verdadero_ (`True`) y _falso_ (`False`). En el ejemplo anterior se podrían ver como los caminos "SI" y "NO" que salen de los elementos de decisión del diagrama de flujo. 
En programación esto es útil para realizar ejecuciones condicionales, es decir de acuerdo a determinadas condiciones, se opta por distintos flujos de ejecución.

In [50]:
not False

True

In [51]:
True and False

False

In [52]:
True or False

True

In [53]:
True and not False

True

#### Operadores de comparación

In [54]:
2 > 1  # mayor que

True

In [55]:
2 < 2  # menor que

False

In [56]:
3 >= 2  # mayor o igual que

True

In [57]:
0 == 0  # igualdad

True

In [58]:
42 != 7  # distinto de

True

In [59]:
'z' > 'a'  # comparación entre cadenas

True

In [60]:
x = 42
x > 0 and x < 100

True

In [61]:
x < 0 and x < 100

False

### Input por teclado

En ciertas ocasiones es necesario que el usuario del programa ingrese valores de entrada al programa.
Python proporciona una función nativa (_bult-in function_) llamada _input_ que detiene el programa y espera a que el usuario ingrese algo. Cuando el usuario presiona "Return" o "Enter", el programa se reanuda y la función devuelve lo que el usuario escribió como una cadena.

In [66]:
text = input()

 Hola


In [67]:
text

'Hola'

### Errores

Los errores son parte central de la programación y hay que acostumbrarse a cometerlos ya que así es como se avanza en la escritura de un programa. Al producirse errores  Python entrega mensajes que son muy informativos y por lo tanto útiles para solucionar el error, por lo que es muy beneficioso aprender a interpretarlos y prestarles mucha atención cuando ocurren salvo, claro está, que uno tenga como _hobby_ el perder tiempo.  

In [68]:
# Por ejemplo, si tratamos de usar una variable que no ha sido definida previamente obtendremos un mensaje de error:
ñ

NameError: name 'ñ' is not defined

Cuando un error sintáctico o en tiempo de ejecución ocurre, el mensaje contiene mucha información del error, incluso en algunos casos puede llegar a ser "demasiada". Es por esto que los aspectos más importantes a identificar del error son:

- Qué tipo de error surgió
- En dónde surgió

Los errores de sintaxis son generalmente fáciles de encontrar, pero también hay que tener ciertos cuidados. 
Los errores de espacios en blanco pueden ser complicados porque los espacios y los _tabs_ son invisibles y naturalmente estamos acostumbrados a ignorarlos.

In [None]:
x = 5
 y = 6

El proceso de corrección de errores de un programa se llama _debugging_ y es quizá una de las tareas más demandantes al escribir código. Python fue pensado como un lenguaje fácil de leer debido a que en general uno pasa más tiempo leyendo código (para arreglar los errores) que escribiéndolo. Mitad broma, mitad en serio, se dice que si el _debugging_ es el proceso por el cual se eliminan errores la _programación_ debe ser el proceso por el cual se introducen los errores.

#### Módulos
Un módulo es un archivo que contiene un conjunto de funciones relacionadas entre sí. 
Por ejempo, Python provee el módulo [_random_](https://docs.python.org/3.7/library/random.html) que contiene un conjunto de funciones que permiten genera números aleatorios. Para hacer uso de dicho módulo el mismo se debe importar.

In [1]:
import random

Para su uso se debe usar el nombre del modulo seguido de un punto "." y el nombre de la función. 

In [2]:
ran= random.randint(1,5) # genera un número aleatorio entre 1 y 5
ran

5

In [3]:
choice =random.choice([1,5,"Juan","Pedro",20])# elige de manera aleatoria entre un conjunto de elementos
choice

20

## Adivina el número
Hasta ahora vimos una parte de la sintaxis básica de Python. Estamos en condiciones de empezar a desarrollar scripts que nos asistan en distintas tareas. Empezaremos por un juego simple

In [4]:
import random 
num_secreto = random.randint(1, 20)
print('Pensé en un número entre 1 y 20.') 
print('Adivina.')
print('*************.')
num_sugerido = int(input()) # se solicita el número a adivinar al usuario

# qué se debería hacer con el número ingresado???

if num_sugerido < num_secreto:
    print('El número que sugerís es muy bajo.')
    
if num_sugerido > num_secreto:
    print('El número sugerís es muy alto.')  

Pensé en un número entre 1 y 20.
Adivina.
*************.


 5


El número que sugerís es muy bajo.


### Selección (Condicional)
Para poder generar programas que realicen determinadas tareas, casi siempre es imprescindible tener la posibilidad de verificar condiciones y en base a esto cambiar el comportamiento del programa. 
Las sentencias condicionales proporcionan esta característica en los lenguajes de programación.
A continuación se brinda un ejemplo sencillo del uso de dichas sentencias en Python: 

In [5]:
x = 2
if x > 0: # "x > 0" es la condición
    print('x es positivo') # esta sentencia es el cuerpo

x es positivo


La expresión booleana después de la palabra reservada **if** se denomina _condición_.
Si la misma es verdadera (_True_), se ejecuta la sentencia que se encuentra dentro del bloque (en este caso, la sentencia identada); en otro caso (_False_), no pasa nada.

Dentro del _cuerpo_ de la condición, es decir, abajo de los dos puntos que finalizan la condición, se pueden colocar un conjunto de sentencias. No hay límite en cantidad, sin embargo al menos debe contener una sentencia. 
En ciertas ocasiones es necesario tener un _cuerpo_ sin sentencias (generalmente, cuando se posterga la programación de la condición); en ese caso, se puede utilizar la sentencia _pass_ que no hace nada.

In [6]:
if x < 0:
    pass # TODO: se deben manejar valores negativos

**Importante:** Python usa la identación como delimitador de bloques de sentencias! Lo que equivale a  "{" y "}" en Java o C

#### Condicional con ejecución alternativa

In [7]:
x=4
if x % 2 == 0:
    print('x es par')
else:
    print('x es impar')

x es par


#### Condicional encadendo

In [8]:
y=2
if x < y:
    print('x es menor que y')
elif x > y:
    print('x es mayor que y')
else:
    print('x e y son iguales')

x es mayor que y


In [9]:
# ejemplo del número adivinado
import random # es necesario utilizar una librería que permita generar nros aleatorios
num_secreto = random.randint(1, 20) # se genera un número random entre 1 y 20
print('Pensé en un número entre 1 y 20.') 
print('Adivina.')
print('*************.')
num_sugerido = int(input()) # se solicita el número a adivinar al usuario

# qué se debería hacer con el número ingresado???

if num_sugerido < num_secreto:
    print('El número que sugerís es muy bajo.')    
elif num_sugerido > num_secreto:
    print('El número sugerís es muy alto.')  
else: 
    print('Adivinaste!!')  # Porque??

Pensé en un número entre 1 y 20.
Adivina.
*************.


 10


Adivinaste!!


**elif** es una abreviación de "else if". 
No hay límites en la cantidad de sentencias **elif**. 
En caso en que se deba incorporar una sentencia **else**, debe ser al final, pero no es obligación que haya una. 

#### Condicional anidado

In [10]:
if x == y:
    print('x e y son iguales')
else:
    if x < y:
        print('x es menor que y')
    else:
        print('x es mayor que y')

x es mayor que y


Pensando en el juego de adivinar el número:
Sería justo brindarle cierta cantidad de intentos para que el usuario tenga más chances de atinar.

In [11]:
# código para 3 intentos
import random 
num_secreto = random.randint(1, 20) 
adivino=False # variable booleana para saber cuando adivina
print('Pensé en un número entre 1 y 20.') 
print('Adivina.')
print('*************.')
num_sugerido = int(input())
if num_sugerido < num_secreto:
    print('El número que sugerís es muy bajo.')    
elif num_sugerido > num_secreto:
    print('El número sugerís es muy alto.')  
else: 
    print('Adivinaste!!')
    adivino=True

if not adivino: # preguto si no adivinó, le sigo dando chances.
    print('*************.')
    num_sugerido = int(input())
    if num_sugerido < num_secreto:
        print('El número que sugerís es muy bajo.')    
    elif num_sugerido > num_secreto:
        print('El número sugerís es muy alto.')  
    else: 
        print('Adivinaste!!')
        adivino=True
        
if not adivino: # preguto si no adivinó, le sigo dando chances.
    print('*************.')
    num_sugerido = int(input())
    if num_sugerido < num_secreto:
        print('El número que sugerís es muy bajo.')    
    elif num_sugerido > num_secreto:
        print('El número sugerís es muy alto.')  
    else: 
        print('Adivinaste!!')
        adivino=True

Pensé en un número entre 1 y 20.
Adivina.
*************.


 18


Adivinaste!!


- ¿Qué pasa si quiero brindar más intentos al usuario?

In [12]:
# preguntar al usuario si puede adivinar en 6 chances

import random 
num_secreto = random.randint(1, 20) 
print('Pensé en un número entre 1 y 20.') 

intentos=1
while intentos < 7: # sentencia que indica iteración
    print('Adivina.')
    num_sugerido = int(input())    
    if num_sugerido < num_secreto:
        print('El número que sugerís es muy bajo.')
    elif num_sugerido > num_secreto:
        print('El número sugerís es muy alto.')   
    else:
        break # Esta "rama" se da si el usuario adivinó        
    print('*************.')
    intentos+=1
    
if num_sugerido == num_secreto:
    print('Muy bien! Adivinaste el número en ' + str(intentos) + ' intentos!')
else:
    print('Nope. El número que pensé fue ' + str(num_secreto))

Pensé en un número entre 1 y 20.
Adivina.


 18


El número sugerís es muy alto.
*************.
Adivina.


 15


El número sugerís es muy alto.
*************.
Adivina.


 10


El número sugerís es muy alto.
*************.
Adivina.


 5


El número sugerís es muy alto.
*************.
Adivina.


 2


El número sugerís es muy alto.
*************.
Adivina.


 1


Muy bien! Adivinaste el número en 6 intentos!


## Iteraciones
Una de las caracterísitcas más relevantes de las computadoras es que pueden realizar tareas repetitivas sin equivocarse, habilidad en la que los humanos no se destacan. 
En el contexto de la programación, la repetición es también llamada _iteración_

#### Sentencia _while_

La sentencia _while_ posee el siguiente flujo de ejecución:
1. Determinar si la condición es verdadera o falsa
2. Si es falsa, abandonar el bloque _while_ y continuar con la ejecución de la siguiente sentencia.
3. Si la condición es verdadera, ejecutar el cuerpo y posteriormente volver al paso 1.

In [13]:
def countdown(n):
    while n > 0:
        print(n)
        n = n - 1    

In [14]:
countdown(3)

3
2
1


Este tipo de flujo se denomina _loop_ ya que en el tercer paso, el flujo de ejecución vuelve al principio. Es por este motivo que, por lo general, es necesario que dentro del cuerpo de la sentencia haya algún cambio que haga que las iteraciones se terminen en algún momento. Caso contrario, si el loop nunca termina se denomina _loop infinito_.

#### Sentencia _for each_
Esta es una de las mayores facilidades provistas por Python a diferencia de otros lenguajes. La sentencia **for** es bastante amplia y en este lenguaje puede ser usada de distintas formas. La más básica es la siguiente:

In [15]:
for i in range(4): # range(4) -> [0,1,2,3]     
    print(i)

0
1
2
3


In [16]:
for n in [5, 2, 3]:
    countdown(n)
    print("--------") # separador "visual"

5
4
3
2
1
--------
2
1
--------
3
2
1
--------


In [17]:
print("Año inicio Guerras Mundiales")
for ord,nom in enumerate([1914,1939,2022]):
    print(str(ord + 1) + "° " + str(nom))

Año inicio Guerras Mundiales
1° 1914
2° 1939
3° 2022


#### Sentencia _break_
En ciertas ocasiones el punto de finalización del loop puede conocerse dentro del cuerpo del _loop_.
En ese caso, se puede hacer uso de la sentencia _break_ para realizar un "salto" fuera del loop. 
Por ejemplo, supongamos que se le pide al usuario que ingrese datos y de acuerdo a lo que ingrese se determina si se sigue iterando o se termina el loop. Se podría realizar lo siguiente:

Volvamos a ver el juego de adivinar el número incorporando alguna de las características mencionadas anteriormente

In [18]:
import random 
num_secreto = random.randint(1, 20) 
print('Pensé en un número entre 1 y 20.') 

intentos=1
for intentos in range(1,7): # range(1,7) -> [1,2,3,4,5,6]
    print('Adivina.')
    num_sugerido = int(input())    
    if num_sugerido < num_secreto:
        print('El número que sugerís es muy bajo.')
    elif num_sugerido > num_secreto:
        print('El número sugerís es muy alto.')   
    else:
        break # Esta "rama" se da si el usuario adivinó        
    print('*************.')
    # intentos+=1 -> ya no hace falta
    
if num_sugerido == num_secreto:
    print('Muy bien! Adivinaste el número en ' + str(intentos) + ' intentos!')
else:
    print('Nope. El número que pensé fue ' + str(num_secreto))

Pensé en un número entre 1 y 20.
Adivina.


 15


El número sugerís es muy alto.
*************.
Adivina.


 8


El número que sugerís es muy bajo.
*************.
Adivina.


 10


El número que sugerís es muy bajo.
*************.
Adivina.


 12


El número que sugerís es muy bajo.
*************.
Adivina.


 13


El número que sugerís es muy bajo.
*************.
Adivina.


 14


Muy bien! Adivinaste el número en 6 intentos!


### Problem solving

> Si tenés 8 horas para cortar un árbol, mejor pasá 6 horas afilando el hacha.

Antes de sentarnos a programar conviene tener una idea al menos aproximada del problema que queremos resolver, esto nos ahorrará tiempo y blabalbalba


Supongamos que nuestro problema consiste en calcular el promedio (o media) de un conjunto de números. En lenguaje matemático esto se expresa como:

$$E[x] = \frac{1}{n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2, + x_3 \cdots x_n}{n}$$

Entonces vemos que el problema "calcular un promedio" se resuelve sumando los números que queremos promediar y dividiendo por la cantidad total de números a promediar.

Con lo que ya sabemos de Python podemos calcular una media como:

In [48]:
media = (1 + 2 + 3 + 4 + 5 + 6) / 6
media

3.5

El código que acabamos de escribir no difiere mucho de usar una calculadora, primero tenemos que ingresar los números _a mano_ y además tenemos que saber exactamente la cantidad total de números.

Usando un lenguaje de programación podemos hacer algo bastante más cómodo. Pero antes tenemos que aprender un par de conceptos nuevos que veremos en lo que sigue del curso.

In [49]:
# también se puede usar una lista
lista_numeros= [1,2,3,4,5,6]
suma=0
for num in lista_numeros:
    suma += num # suma= suma + num
suma/6

3.5

### Listas

Las listas son _contenedores_, algo así como una bolsa donde podemos meter tantos valores como la memoria de nuestra computadora lo permita. Las listas son muy usadas en Python y gran parte de la programación en Python implica crear y manipular listas.

La sintaxis para crear listas en Python es _[..., ..., ...]_:

In [50]:
lista = []  # crea una lista vacia
lista

[]

In [51]:
num = [1, 2, 3, 4, 5, 6]
num, type(num)

([1, 2, 3, 4, 5, 6], list)

In [52]:
# los operadores * y + están sobrecargados para listas
l_mult = [21] * 3 
l_sum = [21] + [23] 
print(l_mult)
print(l_sum)

[21, 21, 21]
[21, 23]


Las listas son mucho más que un simple _contenedor_, por ejemplo podemos averiguar cuantos valores contiene una lista usando la función `len()`

In [53]:
len(lista)

0

In [54]:
len(num)

6

También podemos eliminar un valor de la lista:

In [55]:
del num[2]
num

[1, 2, 4, 5, 6]

In [56]:
del num[2]
num

[1, 2, 5, 6]

Se puede consultar si un elemento se encuentra en la lista:

In [57]:
1 in num

True

In [58]:
"Hola" in num

False

#### Métodos
Un método es lo mismo que una función exceptos que es "llamado desde" un valor.
Cada tipo de datos posee un conjunto exclusivo de métodos. 
Más adelante en el curso veremos un poco en profundida de "donde vienen" y el "porque" de estas construcciones.

In [59]:
num.index(6) # En este caso, se dice que "index" es un método de listas. "num" es una lista

3

In [60]:
num.append(7)
num

[1, 2, 5, 6, 7]

In [61]:
num.insert(2,3)
num.insert(2,3)
num

[1, 2, 3, 3, 5, 6, 7]

In [62]:
num.remove(3) # eliminia la primer ocurrencia 
num

[1, 2, 3, 5, 6, 7]

Y podemos sumar todos los valores de una lista usando la función `sum()`

In [63]:
sum(num)

24

El problema del cálculo de la media se podría simplificar usando estas nuevas características

In [64]:
l_num= [1,2,3,4,5,6]
sum(l_num)/len(l_num)

3.5

Esta nueva forma de calcular medias tiene la ventaja que es más automática que la anterior, cada vez que cambiemos los valores contenidos en la lista `num` podremos correr la celda anterior y obtener el valor de la media. Pero podríamos hacer algo incluso mejor.

Es común, al escribir código, que necesitemos repetir una operación muchas veces, una solución simple es copiar y pegar el código cada vez que lo necesitemos. Pero esta aproximación tiene varios problemas:
* es tediosa
* es fácil cometer errores
* No funciona demasiado bien si el código son cientos de líneas.

Una mejor forma de reutilizar código es crear una _función_ que calcule la media. En programación una función es simplemente una secuencia de sentencias que ejecutan una tarea determinada. Las funciones tienen nombres de forma tal que podamos _llamarlas_ cuando lo necesitemos.

En Python crear funciones es muy simple. Veamos:

In [65]:
def calcular_media(números):
    res = sum(números) / len(números)
    return res

#### Invocaciones
En cierta forma,ya hemos usado funciones, es decir hemos estado invocando ciertas funciones que provee Python. Un claro ejemplo es:

## Funciones

Analicemos la celda anterior línea por línea:

* En la primer linea
    * Usamos la palabra reservada **def**, esta es la forma en la que le indicamos a Python que estamos definiendo una función.
    * luego el nombre de la función, podemos elegir el nombre que deseemos, las reglas son básicamente las mismas que para nombrar variables. Por convención la funciones empiezan con minúscula y se suele usar `_` para separar palabras.
    * Entre paréntesis se indican los **argumentos** de las funciones. Los argumentos suelen varias entre 0 y unas pocas decenas. En este caso tenemos un solo argumento `números` que será una lista con los números a promediar.
    * Cerramos la linea con dos puntos.
* La siguiente linea contiene el cálculo de la media como ya lo habíamos definido. En nuestro caso todo el cálculo se hace en una sola línea pero es posible escribir funciones que contengan decenas o centenas de líneas. 
* Por último tenemos otra palabra reservada `return` seguida del valor que devuelve la función. Esta linea es opcional ya que es posible definir funciones que no devuelven valor alguno (ya veremos ejemplos).

Es importante notar un detalle todo el _contenido_ de la función está escrito usando una sangría de 4 espacios, la sangría es obligatoria ya que le indica a Python cual es el _cuerpo_ de la función, mientras que usar 4 espacios es convención. Podrían ser 2, 3, 8, etc, lo importante es respetar la misma cantidad. 

#### Invocación
Una vez definida una función se la puede _llamar_ usando su nombre y pasando los argumentos necesarios.

In [66]:
calcular_media(l_num)

3.5

In [67]:
# Ya hemos estado invocando funciones anteriormente
type(42)

int

En la celda anterior, el nombre de la función es "type". La expresión entre los paréntesis se denomina _argumento_. El resultado de esta función es informar el tipo de la expresión dentro de los paréntesis.

#### Argumentos
Algunas de las funciones requieren argumentos, incluso algunas necesitan de más de uno.
Dentro de cada función, los argumentos son asignados a variables llamadas parámetros. Por ejemplo, a continuación definimos una función que toma un único argumento:

In [68]:
def saludo (nombre):
    aux= "Hola " + nombre 
    print(aux) # dentro de la función, "nombre" es un parámetro y "aux" una variable local

In [69]:
saludo("Juan") # "Juan" es un argumento

Hola Juan


Las expresiones o sentencias en el lugar de los argumentos son evaluadas antes de que la función sea invocada. 

In [70]:
saludo ("Juan" + " Manuel")

Hola Juan Manuel


Las variables definidas dentro de cada función y los parámetros son locales a la misma, es decir, sólo existen dentro de la función donde fueron definidos.

Una detalle importante a notar es que el nombre de la variable que le pasamos a nuestra función no tiene nada que ver con el nombre del argumento de la función. Es decir nosotros le pasamos `num` a la función e internamente `calcular_media` le llama `números`. Técnicamente decimos que `números` es una variable local (respecto de nuestra función), es decir `números` solo existe dentro de la función `calcular_media`. Fuera de esa función `números` podría no existir o referirse a otro valor.

In [71]:
números = 2
calcular_media([4, 2, 3]), números # dentro de la función `números` contiene una lista, fuera el valor `6`

(3.0, 2)

Otra convención en Python es escribir las funciones incluyendo un _docstring_. Un _docstring_ es una porción de texto que Python ignora, pero que es útil para los humanos ya que explica que hace una función y que tipo de variables espera la función como argumentos y que es lo que devuelve.

Los docstring se escriben usando comillas triples `"""` esto permite que el _cadena_ de texto puedar ocupar varias lineas. El estilo exacto de los docstring varía, lo importante es tratar de mantener una misma línea al menos dentro de un mismo proyecto. Un ejemplo de docstring sería:

In [72]:
def calcular_media(números):
    """
    Calcula la media partir de una lista.

    Parámetros
    ----------
    números : lista
        contiene los valores a promediar

    Resultado
    ----------
    res : float
        La media de los valores contenidos en `números`
    """
    res = sum(a) / len(a)
    return res

El docstring no solo puede ser leido directamente del código, si no que puede ser usado por Python y por varias herramientas externas. Por ejemplo la función `help()` de Python ofrece ayuda al usuario "leyendo el docstring". Por ejemplo si quisieramos ver que hace la función `len()`

In [73]:
help(len) 

Help on built-in function len in module builtins:

len(obj, /)
    Return the number of items in a container.



Esto no solo sirve para funciones que ya vienen con Python, si no que el mismo mecanismo es usado para funciones definidas por los usuarios.

In [74]:
help(calcular_media)

Help on function calcular_media in module __main__:

calcular_media(números)
    Calcula la media partir de una lista.
    
    Parámetros
    ----------
    números : lista
        contiene los valores a promediar
    
    Resultado
    ----------
    res : float
        La media de los valores contenidos en `números`



Jupyter (lo que estamos usando para mostrar este documento y ejecutar el código), también permite acceder al docstring usando `shift + TAB`

In [75]:
calcular_media  # seleccioná esta celda y presioná shift + tab

<function __main__.calcular_media(números)>

Dentro de Jupyter también se puede acceder a la ayuda escribiendo `?` o  `??` luego de la función y presionado `enter`. Podés decir cual es la diferencia entre usar una u otra forma?

Todo muy bien hasta ahora, pero ¿Qué pasaría si inadvertidamente le pasáramos una lista vacía?

In [76]:
calcular_media([])

NameError: name 'a' is not defined

La función falla por que la división por 0 no está definida y Python nos lo indica amablemente.

In [77]:
num = []  # ahora num está vacia
media = sum(num) / len(num)
media

ZeroDivisionError: division by zero

In [84]:
def calcular_media2(a):
    """
    Calcula la media partir de una lista.
    
    Parametros
    ----------
    a : lista
        lista que contiene los valores a promediar
    
    Resultado
    ----------
    res : float
        La media de los valores contenidos en a.
        Devuelve una advertencia si a está vacía.
    """
    try:
        res = sum(a) / len(a)
        return res
    except ZeroDivisionError:
        print('por favor pase una lista que no esté vacía')

In [85]:
calcular_media2([])

por favor pase una lista que no esté vacía


Ahora la función en vez de fallar devuelve un mensaje.
La novedad es que usamos el bloque `try-except`. Lo que hace esto es intentar correr lo que está dentro de cuerpo de `try`, si llegara a ocurrir un error del tipo `ZeroDivisionError` entonces se ejecuta lo que sea que esté dentro de `except` en este caso un mensaje, pero podría ser cualquier cosa. Si hubieramos escrito solo `except:` entonces el bloque `except` se ejecutaría sin importar el tipo de error, esto si bien es posible no se recomienda ya que puede llegar a ocultar _bugs_. Por ejemplo `sum()` (y también`len()`) devuelven un error si por ejemplo lo usáramos con un entero en vez de una lista.

In [86]:
calcular_media2(1)

TypeError: 'int' object is not iterable

Implementa la función "calcular_media2" para que sea más robusta

### ¿Porqué usar funciones?
Al analizar la definición de funciones, es posible pensar en que se puede programar sin hacer uso de las mismas. Sin embargo, existen numerosas razones que justifican su uso:

- Definir nuevas funciones permite nombrar conjunto de sentencias agrupadas con un propósito, esto hace al programa más facil de leer y _debuggear_.
- Las funciones reducen el tamaño de los programas eliminando repeticiones de un mismo grupo de sentencias. Además, en caso de haber un error, sólo debe ser enmendado en un único lugar. 
- Dividir el programa en funciones permite corregir errores por partes y finalmente ensamblar todas las partes correctas en un único programa. Sin mencionar la facilidad para _testeo_.
- Aquellas funciones bien diseñadas y documentadas pueden ser utilizadas por distintos programas. Una vez que se escribe y se corrige una función, la misma puede ser _reutilizada_ en distintas ocasiones.   

### mediana

La media es una buena descripción si los datos que estamos midiendo son más o menos similares, pero puede ofrecer una visión muy distorsionada si los datos no son muy simialres entre si, por ejemplo como puede suceder con los ingresos, algunas personas apenas ganan unos pesos al menos y otras pueden llegar a ganar millones por mes.

La mediana es el número que separa un conjunto de datos en una mitad superior y otra inferior. Es muy utilizada en ciertos contextos ya que es una medida más robusta que la media cuando en el problema se dan valores extremos.

Para calcular la mediana necesitamos algunos conceptos nuevos. Una caracterísitca de las listas de Python es que es posible acceder a los elementos contenidos en ellas mediante indices. Los índices deben ser enteros, empiezan en 0 y terminan `len() - 1` y pueden ser negativos.

In [87]:
lista = [5, 4, 3, 2, 1]
lista[0]  # el cero-ésimo elemento de la lista

5

In [88]:
lista[2]

3

In [89]:
lista[5] # este índice no existe en este caso y Python nos lo indica con un error

IndexError: list index out of range

In [90]:
lista[-1]  # devuelve el último elemento, que devolverá -2 y -6?

1

No solo es posible acceder a elementos individuales de una lista, también se puede acceder a rebanadas (`slices`).

In [91]:
lista[1:]  # del elemento 1 al final

[4, 3, 2, 1]

In [92]:
lista[1:4]  # del elemento 1 al 4

[4, 3, 2]

In [93]:
lista[::2]  # del primer elemento al último "saltando de a 2"

[5, 3, 1]

In [94]:
lista[::-1]  # del primer elemento al último "de a -1", invierte el orden!

[1, 2, 3, 4, 5]

In [95]:
lista[:]  # un caso trivial, del primer al último elemento (equivale a no usar un slice!)

[5, 4, 3, 2, 1]

Todavía faltan un par de detalles, pero los vamos a ver directamente en la función. Es común al aprender una lenguaje encontrarse con codigo que contiene elementos desconocidos o "frases" que no sabiamos posibles/legales.

In [96]:
def mediana(lista):
    """
    ejercicio escribir docstring!
    """
    lista_ordenada = sorted(lista)
    lista_len = len(lista_ordenada)
    idx = int((lista_len - 1) / 2)

    if lista_len % 2:
        return lista_ordenada[idx]
    else:
        return (lista_ordenada[idx] + lista_ordenada[idx + 1]) / 2

Esta es una función bastante más compleja que `calcular_media()`. Veamos línea por línea que es lo que hace.

1. La primer línea (luego del docstring) ordena de menor a mayor los elementos dentro de "lista"
2. La segunda computa la longitud de `lista`
3. La tercera calcula un índice, usando el operador 
4. Esta línea evalua `True` solo si `lista_len` es impar. Podés darte cuenta por qué? (tip: probá ese bloque de código en una celda separada). 
5. Si `lista_len` es par entonces se ejecutará el bloque `else`. La razón de tener este bloque es que si la cantidad de elementos es par NO es posible obtener el valor "del medio", entonces la mediana la computamos como un promedio de los "dos valores medios".

In [97]:
mediana([1, 2, 3, 4, 5])

3

###  Varianza

Mide la dispersión de un conjunto de valores. Es cero para un conjunto de valores idénticos.

$$V(x) =  \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2$$

Donde $\mu$ es la media de $x$

Para poder calcular la varianza usando Python tenemos todos los elementos necesarios. Veamos un posible algoritmo:

In [98]:
def varianza(valores):
    """
    ejercicio escribir docstring!
    """
    media = calcular_media2(valores)
    var = []
    for i in valores:
        var.append((media - i) ** 2)
    return calcular_media2(var)

In [99]:
varianza([0, 1, 2.72, 3.14])

1.623275

Al trabajar con Python es común repetir una _frase_ como la siguiente

In [100]:
d = []
for i in [0, 1, 2, 3, 4, 5, 6, 7, 8]:
    d.append(i ** 2)
d

[0, 1, 4, 9, 16, 25, 36, 49, 64]

Este Patrón en donde iteramos a lo largo de una lista de enteros es tan común en Python (y otros lenguajes) que existe varias funciones que facilitan esta tarea. Una de ellas es `range`. 

`range` usa la sintaxis [start:stop:step] a fin de generar enteros desde `start`, hasta `stop` (sin incluirlo) y opcionalente de a `step` pasos (por defecto 1). `start` es también opcional en cuyo caso empezará en 0. Como pueden ver la sintaxis es similar a lo que ya vimos con la rebanadas de una lista. La diferencia es que las rebanadas operan sobre una lista existente y la función de `range` es la de generar un objeto que _contiene_ enteros. 

In [101]:
d = []
for i in range(0, 9):
    d.append(i ** 2)
d

[0, 1, 4, 9, 16, 25, 36, 49, 64]

En Python2 `range` devolvía una lista, en Python3 `range` es un objeto que contiene las reglas para devolver valores, pero no los valores en si. Esto es un truco que permite ocupar menos memoria. Se requiere menos memoria para especificar la regla, "devuelva todos los enteros de 0 a 1 millón", que para escribir un millón de enteros.

En el siguiente vemor una diferencia entre el objeto `range` y una lista generada a partir de convertir `range` usando el comando `list`.

In [102]:
range(9), list(range(9))

(range(0, 9), [0, 1, 2, 3, 4, 5, 6, 7, 8])

Como veníamos diciendo al trabajar con Python es común repetir una _frase_ como la siguiente:

* Creamos una lista vacía
* Iteramos a largo de algún _iterable_ como un lista o un _rango_.
* Guardamos valores en la lista originalmente vacía.

Este patrón es tan común que Python ofrece una versión alternativa, la cual es considerada por la mayoría de los _Pythonistas_ como más simple y clara. Esta versión alternativa se llama _list comprehension_, o comprensión por listas. Y luce de la siguiente forma

In [103]:
d = [i ** 2 for i in range(9)]

En palabras podríamos leerla como, "tome la variable i elevela al cuadrado y repita para todos los valores de i en el rango de 0 a 9". Usando _list compreherions_ podemos calcular la varianza de la siguietne forma.

In [104]:
def varianza(valores):
    """
    ejercicio escribir docstring!
    """
    media = calcular_media2(valores)
    var = [(media - i) ** 2 for i in valores]
    return calcular_media2(var)

## Ejercicios


1. Construye un programa que permita al usuario ingresar valores de calificaciones y calcule el promedio total.
* Construye un programa que encuentre el menor de una secuencia de números ingresada por el usuario. El programa debe permitir el ingreso de números hasta que el usuario ingrese un -1
* Escribe un script que determine si una secuencia de números ingresada por el usuario es un número capicúa.
* Diseña la función fecha_valida que devuelve $True$ si la fecha es válida y $False$ en caso contrario. Para comprobar la validez de una fecha debes verificar que el mes esté comprendido entre 1 y 12 y que el día lo esté entre 1 y el número de días que corresponde al mes. Por ejemplo, la fecha 31/4/2000 no es válida, ya que abril tiene 30 días. Como es de suponerse, se debe tener especial cuidado con el mes de febrero.
* Escribe una función que reciba dos números como parámetros, y devuelva cuántos múltiplos del primero hay, que sean menores que el segundo.
* Define una función que reciba como parámetro un carácter ASCII y determine si el mismo es una letra del alfabeto, un dígito, un signo de puntuación u “otro”. Realice el script principal y la correspondiente invocación a la función.
* Escribe un programa que permita crear dos listas de enteros y que a continuación elimine de la primera lista los enteros de la segunda lista. Si hay elementos de la segunda lista que no están en la primera, los debe pasar por alto.
* Dada una lista de números enteros y un entero k, escribir un script que devuelva tres listas, una con los menores, otra con los mayores y otra con los iguales a k.
* Desarrolla una función que reciba una lista de enteros y permita “empaquetar” las repeticiones consecutivas de valores en dicha lista mediante una lista $[<valor>, <cantidad-de-valores>]$. Para esto se construye una nueva lista que contenga las nuevas tuplas generadas. Por ejemplo, si la lista inicial es $[1,1,1,3,5,1,1,3,3]$, la función debe retornar [[1,3],[3,1],[5,1],[1,2],[3,2]]. Realice el script principal y la correspondiente invocación a la función.

### Problema

Defina una función que aproxime la raíz cuadrada de un número usando el método de Newton descripto a continuación. 
#### Método de Newton 
Supongamos que queremos averiguar la raíz cuadrada de $a$. 
Si se empieza con cualquier estimativo ($x$), se puede computar una mejor aproximación con la siguiente fórmula: 
$$y = \dfrac{x + a/x}{2}$$
por ejemplo, si $a$ es 4 y $x$ es 3, 



In [105]:
a = 4
x = 3
y = (x + a/x) / 2
y

2.1666666666666665

el resultado está cerca de la respuesta correcta ($\sqrt{4} = 2$). Si repetimos el proceso ajustando el nuevo estimativo,

In [106]:
x = y
y = (x + a/x) / 2
y

2.0064102564102564

en general, es dificil saber cuantos pasos se requieren para obtener el valor exacto, lo que si sabemos es que cuando el aproximado ($x$) coincida con el resultado anterior ($y$), se ha encontrado el valor. 

**Defina una función que a partir de un valor estimado aproxime la raíz cuadrada de un número usando el método de Newton. 
Además del resultado obtenido, la función deberá informar también la cantidad de pasos que requirió para llegar al resultado.**

**NOTA:** en general, es "peligroso" operar con igualdad entre flotantes ya que la representación computacional de los mismos es un valor aproximado. 
Es decir, valores como $1/3$ o $\sqrt{2}$ no se pueden representar de manera exacta con un flotante (_float_). 
Por lo tanto, en vez de comparar $x==y$, el enfoque más conveniente es comparar el valor absoluto de la diferencia con un valor de magnitud. 
    $$if abs(y-x) < epsilon: break$$
donde $epsilon$ es un valor (por ejemplo $0.0000001$) que determina cuándo los valores que se están comparando son "tan parecidos" que deberían considerarse como el "mismo" para el problema.