# Introducción a la programación científica en Python

## Computación en ciencias

Históricamente la ciencia se ha dividido en experimentalista y teórica (o empirismo y racionalismo). Consecuentemente, una gran número de estudios en filosofía de la ciencia se han dedicado al estudio de la inter-relación de estos dos modos de hacer ciencia. Durante las últimas pocas décadas la computación ha emergido como una importante parte de la ciencia, y al hacerlo a desestabilizado esta visión binaria de la ciencia.

La simulación computacional se ha establecido como una [Tercer práctica científica](http://press.uchicago.edu/ucp/books/book/chicago/S/bo9003670.html), que se relaciona con la teoría pero que _no es solo teoría_ ya que puede involucrar elementos de más de una teoría o elementos que no son parte de ninguna teoría como aproximaciones, conocimiento empírico, intuición e incluso _ficciones científicas_ ([ver](http://press.uchicago.edu/ucp/books/book/chicago/S/bo9003670.html)) y al mismo tiempo tiene características en común con los experimentos. Las simulaciones suelen ser usadas cuando los datos experimentales u observacionales son escasos (_la simulación hace de experimento_) o en casos en que un conjunto de datos no puede ser entendido dado las teorías existentes (_la simulación hace de teoría_).

Las computadoras además han permitido el almacenamiento, procesamiento y análisis de grandes cantidades de datos, en algo que podría llamarse _observación computacional_ (aunque se suele preferir términos como _ciencia de datos_).

Hoy en día, un creciente número de publicaciones científicas incluyen experimentos, cálculos numéricos, simulaciones o modelos computacionales. Además, casi todas las ramas de la ciencia tienen una versión computacional:

* [Matemática Computacional](https://en.wikipedia.org/wiki/Computational_mathematics)  
* [Estadística computacional](https://en.wikipedia.org/wiki/Computational_statistics)  
* [Física computacional](https://en.wikipedia.org/wiki/Computational_physics)
* [Química computacional](https://en.wikipedia.org/wiki/Computational_chemistry)
* [Quimioinformática](https://en.wikipedia.org/wiki/Cheminformatics)
* [Geoinformatica](https://en.wikipedia.org/wiki/Geoinformatics)
* [Biología computacional](https://en.wikipedia.org/wiki/Computational_biology)
* [Bioinformática](https://en.wikipedia.org/wiki/Bioinformatics)
* [Linguistica computacional](https://en.wikipedia.org/wiki/Computational_linguistics)
* [Sociología computacional](https://en.wikipedia.org/wiki/Computational_sociology)

## Investigación reproducible

Los datos científicos y los análisis realizados sobre dichos datos, son cada vez más complejos. Muchas veces usar descripciones al estilo de _materiales y métodos_ se torna complicado tanto para quien explica como para quien intenta entender. La premisa de la investigación reproducible consiste en que las publicaciones científicas deberían no solo publicar resultados, si no además datos (en crudo y procesados) y el código usado para hacer los análisis, simulaciones y/o modelos. Esto facilitaría la verificación de los resultados, reduciendo la posibilidad de fraude, de que errores honestos pasen inadvertidos y facilitaria el realizar nuevas pruebas (no pensadas por los autores originales) o generar nuevas ideas sobre los datos y resultados publicados.

Es importante notar que en mucha de la literatura los términos replicación y reproducibilidad se usan de forma intercambiable y para confundir aún más las cosas entre los autores que suelen marcar diferencias entre estos términos algunos llaman replicación a los que otros llaman reproducibilidad.

Hablando especificando de disciplinas computacionales podemos decir que:

* Replicación: La autora de un artículo científico, que involucra cálculos numéricos debería ser capaz de correr de forma repetida simulaciones y análisis y obtener siempre los mismos (o equivalentes) resultados. Otro científico también debería ser capaz de realizar los mismos cálculos y obtener los mismos (o equivalentes) resultados, dada la información provista en una publicación.

* Reproducibilidad: Usando una implementación independiente del método o usando un método diferente se deberían poder obtener el mismo resultado que en la publicación original. Si hubiese diferencias entre resultados deberían explicarse por diferencias del método (por ej un método es más sensible que otro).

Todavía no existen guías bien establecidas de como administrar/distribuir el código fuente y los datos generados. Por ejemplo es relativamente raro que el código fuente de una simulación se haga público. De hecho es común que el código fuente sea considerado como una ventaja competitiva y no se haga público por esa misma razón.

Sin embargo, esta visión ha comenzado a ser cuestionada, algunas científicas y revistas científicas han llamado a una mayor transparencia en las ciencias computacionales. Algunas revistas han comenzado a requerir que los autores hagan público el código y/o los datos, ya sea depositandolos en un repositorio público o bajo pedido expreso de terceros.

En resumen. Es deseable que cualquier estudio científico sea reproducible y replicable.

Para alcanzar estos objetivos es necesario:

* Tener registro de que código y cual versión fueron usados para generar datos y figuras.

* Tener resitro del entorno informático usado y de las versiones de todos los programas externos usados.

* Asegurarse que todas las figuras, códigos y notas estén resguardados de forma segura y que puedan ser accedidos incluso años después de haber sido generados/usados.

* Idealmente el codigo debería ser publicado en linea (por ejemplo en github[https://github.com]), Esto facilita que sea preservado y accedido por otros científicos.

## Python

[Python](http://www.python.org/) es:
* un lenguaje de programación moderno
* de propósito general (esto quiere decir algo así como que no es el mejor lenguaje para casi nada, pero es suficientemente bueno para casi todo)
* orientado a objetos (pero soporta otros paradigmas)
* de alto nivel (es decir cercano al lenguaje humano y lejos del lenguaje de máquinas)
* es interpretado (es decir no es necesario compilarlo antes de correrlo)
* es multiplataforma (corre en muchos sistemas operativos)

<img src="http://imgs.xkcd.com/comics/python.png">

## ¿Por qué es un buen lenguaje de programacion científica?

Python is simultaneously powerful, flexible and easy to learn and use (in general, these qualities are traded off for a given programming language). Anything that can be coded in C, FORTRAN, or Java can be done in Python, almost always in fewer lines of code, and with fewer debugging headaches. Its standard library is extremely rich, including modules for string manipulation, regular expressions, file compression, mathematics, profiling and debugging (to name only a few). Unnecessary language constructs, such as `END` statements and brackets are absent, making the code terse, efficient, and easy to read. Finally, Python is object-oriented, which is an important programming paradigm particularly well-suited to scientific programming, which allows data structures to be abstracted in a natural way.

* Es un lenguaje simple: Simple de leer, de escribir y de mantener.

* Es de código abierto y gratuito!

* Muy bien documentado.

* Es ampliamente usado en la mayoría de las disciplinas científicas

* Tiene una gran comunidad de usuarios (no todos científicos), por lo que es facil encontrar ayuda, tutoriales, blogs, etc. por ejemplo en [StackOverflow](stackoverflow.com).

* Buena performance. Aunque estrictamente es un lenguaje _lento_ (el costo de la simplicidad). Existen formas de acelerarlo

* Posee un extenso ecosistemas de librerías (llamadas también bibliotecas o módulos)
    * [Numpy:](http://numpy.scipy.org)  Cálculo numerico y algebra lineal
    * [Scipy:](http://www.scipy.org) -  Funciones comunmente usada en ciencias
    * [Matplotlib:](http://www.matplotlib.org) - Gráficas cientificas
    * [Seaborn:](http://web.stanford.edu/~mwaskom/software/seaborn/) - Gráficas cientificas atractivas
    * [Ipython:](http://ipython.org/) - Computacion interactiva
    * [Pandas:](http://pandas.pydata.org/) - Procesamiento de datos
    * [PyMC3:](http://pymc-devs.github.io/pymc3/) - Estadística Bayesiana
    * [Scikit-learn:](http://scikit-learn.org/) - Machine Learning 
    * [Statsmodels:](http://statsmodels.sourceforge.net/) Estadística "clásica"
    * _agrega tu paquete favorito acá_  

## Notebooks de IPython

Los programas de Python (al igual que sucede con otras lenguajes) suelen ser guardados en archivos de texto donde, en general, cada linea de texto corresponde a una orden en particular. En el caso particular de Python estos archivos, por convención, tiene extensión _.py_. Esta forma de almacenar (y ejecturar) programas es ideal para programas extensos, como por ejemplo simulaciones o que no necesitan ser ejecutados _interactivamente_ como un driver de una impresora. En el caso de la computación cientifica suele ser conveniente poder ejecutar programas de forma _interactiva_ (como por ejemplo al explorar un conjunto de datos). Otra caracterísitca deseable es poder combinar el código con texto, gráficas, imágenes, formulas matemáticas, tablas, etc. Por lo que un formato de texto plano puede no ser la mejor forma de almacenar código científico. Es por eso que existe Jupyter. 

El archivo que estás leyendo, es una notebook de Jupyter. En vez de ser un texto plano, la información es almacenada como un archivo [JSON](http://es.wikipedia.org/wiki/JSON). 

### IPython  

[IPython](http://ipython.org/)  is a command shell for interactive computing. It was originnaly developed for the Python programing language (and hence the name), but now supports multiple programming languages. Including for example Julia. Furthermore IPython allows to easily combines Python code with Cython, R, Octave, Bash, Perl or Ruby. Recently the [Jupyter-Project](http://jupyter.org/) has been proposed as the next step in the development of IPython.

### IPython notebook  

[IPython notebook](http://ipython.org/notebook.html) is what you are reading right now and is an HTML-javascript-based environment. An IPython notebook is a [JSON](https://en.wikipedia.org/wiki/JSON) document containing an ordered list of input/output cells which can contain code, text, mathematical formulas, plots and rich media. It is based on the IPython shell and provides an interactive environment to coding and to document all calculations facilitating reproducible research.

Some of the most important features of IPython notebooks are:

* Tab completion
* Support for Markdown 
* Support for Mathjax
* Magic functions
* Enhanced introspection
* Support for rich media
* Access to the system shell

#### Tab completion 

Tab completion works for python commands (including imported libraries), variable names, objects' atributes and file/directory names. If there is more than one option a list of possible completions is offered.

#### Support for Markdown

[Markdown](http://daringfireball.net/projects/markdown/) is a popular markup language that is a superset of HTML. If you pay attention to the toolbar you will see that some of the cells are marked as code_ and others as _markdown_ (like this one). Just doble click on any of the _markdown cells_ and you will see that they are writted using markdown.

#### Mathjax  

Mathjax is a javascript implementation of $LaTeX$ that allows equations to be embedded into HTML.

$$
\int_{a}^{b} f(x)\, dx \approx \frac{1}{2} \sum_{k=1}^{N} \left( x_{k} - x_{k-1} \right) \left( f(x_{k}) + f(x_{k-1}) \right)
$$

#### Magic functions  

IPython has a set of predefined _magic functions_ that you can call with a command line style syntax. 

There are two types of magics

* line magics: these are commands prepended by one **%** character and whose arguments only extend to the end of the current line.
* cell magics: They are call using **%%**, and they receive as argument both the current line where they are declared and the whole cell. Cell magics can only be used as the first line in a cell, and as a general principle you can only use one cell magic per cell.
    
As an example the  **%lsmagic** lists all the available magics.

In [4]:
%lsmagic

Available line magics:
%alias  %alias_magic  %autocall  %automagic  %autosave  %bookmark  %cat  %cd  %clear  %colors  %config  %connect_info  %cp  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %install_default_config  %install_ext  %install_profiles  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %man  %matplotlib  %mkdir  %more  %mv  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %popd  %pprint  %precision  %profile  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%debug  %%file  %%html  %%javascript  %%latex  %%

Sometimes it is necessary to measure the execution time of a code that can be used for magic **timeit**. This magic exists for cells and lines.

In [5]:
%timeit range(0, 100)

1000000 loops, best of 3: 736 ns per loop


In [6]:
As already told IPython allows mixing python code with other languages like bash

SyntaxError: invalid syntax (<ipython-input-6-cf9a7a96c93c>, line 1)

In [None]:
%%bash
for i in {3..1}; do
    echo $i
done
echo "hello from $BASH"

In [None]:
# Provides a quick reference to IPython
%quickref

#### Enhanced introspection

If you need information about any command you could get it by adding a _?_ after the name of the command. If you need even more information, including acces to the source code you could try adding _??_. The commands could be from the Python standard library function, IPython magics, or commands from any imported library.

In [None]:
range?

In [None]:
%timeit??

In [None]:
?

#### Support for rich media
IPython use the web browser as a GUI, hence it can easily display images, videos, etc.

One way to include media files in a notebook is to use pure HTML, another way is to use the IPython's rich display system as follows.

In [None]:
from IPython.display import Image, YouTubeVideo

In [None]:
Image(filename='img/logo.png')

In [None]:
YouTubeVideo('zJM4EBuL82o')

## Introducción a Python

Sintaxis Python lo que se debe hacer y lo que se sugiere hacer (PEP8)

### Variables

En programación se le llama variable a un espacio en la memoria de la computadora que almacena un valor determinado y que tiene asociado un nombre (o identificador). Es este indentificador el que nos permite referirnos a ese valor y manipularlo. Los nombres de las variables en Python pueden contener los caracteres _a-z_, _A-Z_, _0-9_ y algunos caracteres especiales como `_`. Los nombres de variables normales deben comenzar con una letra. Por convención, los nombres de las variables comienzan con una letra minúscula, mientras que los nombres de las _clases_ comienzan con una letra mayúscula (la explicación de que es una _clase_ quedará para más adelante).

#### Asignaciones

En Python el operador para asignar valores a variables es el signo _=_.

In [2]:
x = 2.0
y = 'hola'
x, y

(2.0, 'hola')

Es importante destacar que en Python el signo _=_ no es equivalente al signo _igual_ en matemáticas. Esto se demuestra en el siguiente ejemplo.

In [14]:
x = x + 1
x

3.0

Si tratamos de usar una variable que no ha sido definida previamente obtendremos un mensaje de error

In [23]:
z

NameError: name 'z' is not defined

Los mensajes que entrega Python al producirse errores son muy útiles para poder correjirlos, por lo que es muy buena idea leerlos atentamente (al menos cuando uno no tiene demasiado interés en perder tiempo).  

El proceso de correccion de errores de un programa se llama _debugging_ y es quizá la tarea que más tiempo demanda al programar. De hecho Python fue pensado como un lenguaje facil de leer debido a que uno pasa más tiempo leyendo código que escribiendolo!

#### Nombres reservados

Existen algunas palabras en Python que tienen un significado predefinido y no pueden ser usadas como nombres de variables. Estas palabras claves (_keywords_) son:

    and, as, assert, break, class, continue, def, del, elif, else, except, 
    exec, finally, for, from, global, if, import, in, is, lambda, not, or,
    pass, print, raise, return, try, while, with, yield

#### Tipos de variables

Python es un lenguage de escritura dinámica esto quiere decir que las variables no se declaran, simplemente se les asigna valores. La variable _x_ usada mas arriba no existía hasta que le asignamos un valor. Por el contrario, en muchos lenguajes de programación (como C/C++ o Fortran) antes de poder asignar valores a variables es necesario declararlas. Declararlas quiere decir que tenémos que indicar el _tipo_ de una variable.

En nuestro ejemplo _x_ es una variable de tiplo _flotante_ (float) mientras que _y_ es una cadena (string)

In [15]:
type(x), type(y)

(float, str)

Al ser un lenguaje dinámico también es posible cambiar el tipo de una variable durante la ejecucion de un programa

In [20]:
y = 42
y, type(y)

(42, int)

Existen muchos tipos de variables, algunos de los tipos más comunmente usados son:

In [20]:
# enteros
x = 1
type(x)

int

In [21]:
# flotantes
y = 1.0
type(x)

float

In [22]:
# booleanos
b1 = True
b2 = False

type(b1)

bool

In [24]:
# números complejos: note que se usa `j` para especificar la parte imaginaria
z = 1.0j
type(z)

complex

In [25]:
# cadenas
s = '1'
type(s)

str

### Operadores

#### Operadores matemáticos

La mayoría de los operadores matemáticos en Python funcionan como uno esperaría:

In [28]:
1 + 2, 1 - 2, 1 * 2, 1 / 2, 2**2, 2**0.5

(3, -1, 2, 0, 4, 1.4142135623730951)

En el ejemplo anterior $\frac{1}{2}$, devuelve 0 en vez de 0.5. Esto es así por que en Python la division de enteros devuelve enteros (en las versiones de python 2.x pero no para Python 3.x). Esto no es lo que se espera normalmente en computacion científica. Una forma de solucionarlo es asegurarse que al menos uno de los números sea decimal (float).

In [29]:
1/2.

0.5

Otra solución (quizá la más simple para evitar que los errores puedan pasar inadvertidos) es invocar la siguiente expresión al inicio de todos nuestros programas.

In [1]:
from __future__ import division

In [2]:
1/2

0.5

#### Operadores booleanos

En el algebra Booleana, en vez de operar con valores numericos se opera con los valores _verdadero_ (True) y _falso_ (False). Los principales operadores son _and_, _or_ y _not_

In [32]:
True and False

False

In [33]:
not False

True

In [3]:
True and not False

True

In [34]:
True or False

True

#### Operadores de comparación

In [4]:
2 > 1 # mayor que

True

In [5]:
2 < 2 # menor que

False

In [7]:
3 >= 2 # mayor o igual que

True

In [8]:
0 == 0 # igualdad

True

In [52]:
42 != 7 # distinto de

True

In [20]:
'z' > 'a' # comparación entre cadenas

True

### Cadenas

Como ya vimos una _cadena_ es un tipo de variable que almacena texto. Las cadenas deber definirse usando comillas dobles _" "_ o simples _' '_.

In [85]:
s = "Hola mundo"
type(s)

str

Es posible determinar la longitud de una cadena, es decir el número de caracteres que la componen.

In [86]:
len(s)

10

Es posible tomar _rebanadas_ (_slices_) de una cadena. Por ejemplo, si queremos obtener el primer elemento de una cadena hacemos.

In [87]:
s[0]

'H'

Es importante notar que Python comienza a indexar por el número _0_ y no por el número _1_. Si quisieramos obtener el último elemento de una cadena podemos hacer.

In [88]:
s[-1]

'o'

Además es posible obtener rangos, mediante la sintaxis, _[desde:hasta]_

In [89]:
s[0:4]

'Hola'

In [90]:
s[5:10]

'mundo'

Es posible omitir el _desde_, Python asumirá que es desde el principio. De la misma forma es posible omitir el _hasta_, Python asumirá que es hasta el final.

In [91]:
s[:4]

'Hola'

In [92]:
s[5:]

'mundo'

In [93]:
s[:]

'Hola mundo'

Además es posible definir el _paso_ de las rebanadas (slices), usando la sintaxis  _[desde:hasta:paso]_

In [75]:
s[::1]

'hola mundo'

In [76]:
s[::3]

'hauo'

En Python es posible sumar cadenas.

In [77]:
r = '!'
s + r 

'hola mundo!'

y multiplicar cadenas (pero solo de longitud 1).

In [78]:
s + r*3

'hola mundo!!!'

Existen muchas funciones que pueden aplicarse a cadenas, como por ej

In [94]:
s.upper()

'HOLA MUNDO'

In [95]:
s.count('o')

2

In [100]:
s.index('a')

3

Podés explorar otras funciones aplicables a cadenas usando la sugerencias que ofrece Jupyter al presionar _tab_.

#### Formateado de cadenas
En muchas ocasiones es necesario dar algun formato específico a cadenas, por ej al imprimir resultados en pantalla o guardar datos en un archivo. Algunos de los casos más usados son:

In [105]:
"valor = %.3f unidades" % 42.0

'valor = 42.000 unidades'

In [60]:
"%.3f, %03d, %s" % (3.1415, 42, 'abc')

'3.142, 042, abc'

### Listas

Las listas y las cadenas comparten varias caracteristicas, como la posibilidad de indexarlas y de tomar rebanadas. La principal diferencia es que las listas pueden contener elementos de distintos tipos, como enteros, cadenas e incluso otras listas.

Las listas son muy usada en Python y gran parte de la programación en Python implica crear y manipular listas.

La sintaxis para crear listas en Python es _[..., ..., ...]_:

In [54]:
lista = [] # crea una lista vacia
lista

[]

In [55]:
lista = [1, 2, 3, 4]
lista, type(lista)

([1, 2, 3, 4], list)

In [33]:
lista_r = range(1, 10, 2)
lista_r

[1, 3, 5, 7, 9]

Podemos usar las mismas técnicas de "rebanado" que usamos en el caso de cadenas para acceder a los elementos almacenados en las listas:

In [2]:
lista[2]

3

In [109]:
lista[1:]

[2, 3, 4]

In [108]:
lista[::2]

[1, 3]

Como se dijo anterioremente, no es requisito que los elementos en una lista sean del mismo tipo.

In [7]:
lista_h = [1, 'a', 1.0, [42, 7]]
lista_h

[1, 'a', 1.0, [42, 7]]

Las listas como la anterior son llamadas anidadas por que contienen una lista adentro. Otro ejemplo de lista anidada podría ser.

In [8]:
m = [[0, 1], [2, 3]]
m

[[0, 1], [2, 3]]

Dado que la lista _m_ es una lista de listas es necesario usar dos indices para acceder a cada entero almacenado en _m_. Veamos.


In [9]:
m[1] # el segundo elemento de la lista m es otra lista.

[2, 3]

In [10]:
m[1][0]

2

#### Métodos de las listas

Python provee de varios métodos que permiten operar sobre listas como el método _append_ que permite agregar un elemento al final de una lista.

In [56]:
l = [] # crea una lista vacía
l

[]

In [57]:
l.append(10)
l.append(9)
l.append(8)

In [58]:
l

[10, 9, 8]

O el método _extend_ que permite agregar los elementos de una lista al final de otra lista

In [59]:
lista.extend(l)
lista

[1, 2, 3, 4, 10, 9, 8]

También podemos encontrar el método _sort_ que ordena los elementos de una lista.

In [60]:
lista.sort()
lista

[1, 2, 3, 4, 8, 9, 10]

Otro método comunmente usado es _pop_ que devuelve un valor de una lista y lo elimina. Si no se usa ningún argumento, por defecto devolverá el último valor de la lista.

In [61]:
lista.pop()

10

In [62]:
lista # ahora lista no contiene el elemento 10

[1, 2, 3, 4, 8, 9]

Algo similar al método _pop_ es el comando _del_

In [64]:
del lista[4]
lista # el elemento con indice 4, es decir, el número 8 ya no está en la lista

[1, 2, 3, 4, 9]

También es posible eliminar elementos, indicando el elemento que se desea borrar y no el índice.

In [65]:
lista.remove(4) # se borró el número 4
lista

[1, 2, 3, 9]

### Tuplas

Las tuplas son como las listas, pero son inmutables, es decir una vez creadas no pueden ser modificadas

En Python, las tuplas son creadas usando la sintaxis _(..., ..., ...)_ o _...,...,..._

In [66]:
tupla = (10, 20)
tupla, type(tupla)

((10, 20), tuple)

In [71]:
tupla = 10, 20
tupla, type(tupla)

((10, 20), tuple)

Es posible usar una tupla para asignar más de una variable al mismo tiempo.

In [67]:
x, y = tupla
x, y

(10, 20)

Si intentamos asignar un nuevo valor a un elemento de una tupla obtenemos un error:

In [68]:
tupla[0] = 42

TypeError: 'tuple' object does not support item assignment

In [70]:
a = ()
type(a)

tuple

Aveces suele ser necesario, intercambiar los valores de dos variables. Usando la asignaciçon convencional se requiere de una variable temporaria.

In [74]:
a, b = 1, 2
temp = a
a = b
b = temp

a, b

(2, 1)

Una version más simple es usar tuplas

In [76]:
a, b = 1, 2
a, b = b, a
a, b

(2, 1)

El número de variables a la izquierda debe coincidir con el número de valores a la derecha.

In [77]:
a, b = 1, 2, 3

ValueError: too many values to unpack

Dado que las tuplas y las listas son tan parecidas es común que surga la pregunta ¿Cuando es conveniente usar una y cuando la otra?

Al ser las tuplas inmutables, son más eficientes (en términos de memoria y procesador) que la listas. Por lo que si algún problema puede resolverse tanto con listas como por tuplas, entonces las tuplas se prefieren si la eficiencia es importante.

Una diferencia que puede resultar algo más sutil es la siguiente. Si bien las listas pueden contener elementos de distinto tipo (heterogéneas) su uso más común es cuando todos los elementos son del mismo tipo (homogéneas). Por otro lado es más comun que las tuplas sean heterogéneas. En general en un tupla las posiciones tienen significado, mientras que las listas no. Por ejemplo para representar un gas de partículas podríamos usar una lista de tuplas, la longitud de la lista sería equivalente a la cantidad de partículas de gas y usariamos una tupla de tres elementos (por cada partícula) para indicar las coordenadas x, y, z. En este ejemplo se puede ver que dado que las partículas son indistinguibles entre si, el ordenamiento de los elementos de la lista es arbitrario mientras que en la tupla, las posiciones tienen un significado algo más preciso. Otro ejemplo sería usar una lista de tuplas para guardar los nombres de nuestros contactos (una tupla por contacto), donde el primer elemento de la tupla sería el nombre y el segundo el apellido.

### Diccionarios

Los diccionarios son parecidos a las listas y a las tuplas, excepto que cada elemento es un par clave-valor y que los elementos de un diccionario no están ordenados. Es por ello que en vez de usar índices accedemos a un diccionario usando _claves_.

La sintaxsis de los diccionarios es `{clave1 : valor1, clave2 : valor2, ...}`:

In [91]:
parametros = {"parametro1" : 1.0,
          "parametro2" : 2.0,
          "parametro3" : 3.0,}

parametros, type(parametros)

({'parametro1': 1.0, 'parametro2': 2.0, 'parametro3': 3.0}, dict)

In [92]:
parametros["parametro2"]

2.0

Si necesitamos agregar una nueva entrada basta con

In [90]:
parametros["parametro4"] = "D"
parametros

{'parametro1': 1.0, 'parametro2': 2.0, 'parametro3': 3.0, 'parametro4': 'D'}

### Conjuntos

Los conjuntos (_sets_) en Python están inspirados en los conjuntos matemáticos y proveen de una estructura de datos para almacenar un conjunto no-ordenado de elementos no-repetidos.

In [43]:
mi_set = {4, 5, 5, 7, 8}
mi_set

{4, 5, 7, 8}

también es posible definir un set de la siguiente forma:

In [46]:
set_0 = set()
set_0

set()

In [47]:
set_0.add(-5)
set_0

{-5}

Con los _sets_ de Python es posible realizar operaciones de conjuntos (como en matemática)

In [48]:
mi_set | set_0 # unión de conjuntos

{-5, 4, 5, 7, 8}

In [49]:
mi_set & set_0 # intersección

set()

In [51]:
mi_set - {4} # diferencia entre conjuntos

{5, 7, 8}

Un uso común en Python, para los sets, es el de obtener elementos únicos a partir de una lista

In [52]:
lista = [1, 2, 3, 3, 4, 5, 5 ,5]
set(lista)

{1, 2, 3, 4, 5}

### Bucles

Gran parte de la programación involucra poder iterar sobre una secuencia, por ejemplo leer un texto de a una linea por vez, operar sobre cada elemento de una lista o repetir una misma tarea una cierta cantidad de veces. Una forma de hacer eso es usando el bucle for (_for loop_).

In [121]:
for i in [0, 1, 2]:
    print(i)

0
1
2


In [122]:
for i in range(3):
    print(i)

0
1
2


In [124]:
for caracter in 'hola mundo':
    print(caracter)

h
o
l
a
 
m
u
n
d
o


También es posible iterar sobre los valores de un diccionario, para ello se aplica el método _items_ a un diccionario.

In [109]:
for clave, valor in parametros.items():
    print(clave + " = " + str(valor))

parametro1 = 1.0
parametro3 = 3.0
parametro2 = 2.0


Algunas veces es útil iterar sobre una lista y obtener los índices y los valores de una lista en simultaneo. Para ello se usa la función _enumerate_:

In [110]:
for idx, x in enumerate(range(-3, 3)):
    print(idx, x)

(0, -3)
(1, -2)
(2, -1)
(3, 0)
(4, 1)
(5, 2)


En muchos casos se hace necesario iterar sobre un par de listas en simultaneo. La forma preferida es usando _zip_. La funcion zip toma dos (o más) secuencias (lista, tuplas, etc) y devuelve una lista de tuplas, donde cada tupla contiene el i-ésimo elemento de cada una de las secuencias usadas como argumentos.

In [119]:
numeros = [1, 2, 3]
letras = ['a', 'b', 'c']
zip(numeros, letras)

[(1, 'a'), (2, 'b'), (3, 'c')]

In [120]:
for numero, letra in zip(numeros, letras):
    print numero, letra

1 a
2 b
3 c


El otro bucle usado en Python (aunque con mucha menos frecuencia) es el bucle while (_while loop_). Mientras que el bucle _for_ corre _n_ cantidad de veces, el bucle _while_ lo hace hasta que una cierta condicion se cumpla.

In [128]:
lista = []
while len(lista) < 4:
    lista.append('a')
lista

['a', 'a', 'a', 'a']

### Control de flujo

Otra característica de la programación es la necesidad de hacer evaluaciones y en función de los resultados realizar distintas acciones. Para ello en Python se usan las palabras clave _if_, _elif_ y _else_:

In [131]:
if True:
    print('hola')

verdadero


In [133]:
if False:
    print('hola')

In [135]:
if 2 > 3:
    print('hola')
else:
    print('chau')

chau


In [145]:
for i in range(11):
    if i % 2 == 0: # numeros pares
        print(i)

0
2
4
6
8
10


In [155]:
for i in range(10):
    if i % 2 == 0:  # si es par
        print(i, i)
    elif i % 3 == 0:  # si es impar y multiplo de 3
        print(i, i**2)
    else:  # el resto
        print(i, 'a')

(0, 0)
(1, 'a')
(2, 2)
(3, 9)
(4, 4)
(5, 'a')
(6, 6)
(7, 'a')
(8, 8)
(9, 81)


## Funciones

En Python una función es definida usando la palabra clave `def`, seguida de un nombre para la función, una variable entre paréntesis `()`, y el símbolo de dos puntos `:`. El siguiente código, con un nivel adicional de indentación, es el cuerpo de la función.

In [54]:
def func0():   
    print("prueba")

In [55]:
func0()

prueba


Si bien no es obligatorio es recomendable que cada función vaya acompañada de un _docstring_. Un docstring es una descripción del funcionamiento de una función, incluida una descripción de los argumentos que soporta la función. El _docstring_ es una cadena delimitada por comillas triples que se agrega directamente después de la definición de la función y antes del código de la funcion.

In [11]:
def func1(s):
    """
    Imprime la cadena 's' y dice cuántos caracteres tiene
    """
    
    print(s + " tiene " + str(len(s)) + " caracteres")

No es necesario ver el código fuente para tener acceso al _docstring_

In [12]:
help(func1)

Help on function func1 in module __main__:

func1(s)
    Imprime la cadena 's' y dice cuántos caracteres tiene



In [13]:
func1?

In [14]:
func1("prueba")

prueba tiene 6 caracteres


Es común que necesitemos escribir funciones que no solo ejecuten alguna tarea si no que devuelvan valores. Por ejemplo una función que calcula el cuadrado de un número. Para ello la función debe incluir la palabra clave _return_:

In [15]:
def cuadrado(x):
    """
    Calcula el cuadrado de x.
    """
    return x**2

In [16]:
cuadrado(4)

16

Una funcion puede devolver más de un valor. Para ellos se hace uso de tuplas:

In [17]:
def potencias(x):
    """
    Calcula las potencias, 2, 3 y 4 de x.
    """
    return x**2, x**3, x**4

In [18]:
potencias(3)

(9, 27, 81)

Como vimos antes, es posible usar tuplas para asignar valores a más de una variable al mismo tiempo.

In [19]:
x2, x3, x4 = potencias(3)

print(x3)

27


En la definición de una función, podemos asignar valores por defecto a los argumentos de la función:

In [22]:
def potencia(x, p=2, debug=False):
    if debug:
        print("evaluando mifunc para x = " + str(x) + " usando el exponente p = " + str(p))
    return x**p

Si no suministramos un valor para el argumento _debug_ ni para el argumento _p_ al llamar a la función _potencia_ se considera el valor definido por defecto:

In [21]:
potencia(5)

25

In [23]:
potencia(5, debug=True)

evaluando mifunc para x = 5 usando el exponente p = 2


25

Si listamos explícitamente el nombre de los argumentos al llamar a una función, ellos no necesitan estar en el mismo orden usando en la definición de la función. Esto es llamado argumentos *de palabra clave* (keyword), y son a menudo muy útiles en funciones que requieren muchos argumentos opcionales.

In [24]:
mifunc(p=3, debug=True, x=7)

evaluando mifunc para x = 7 usando el exponente p = 3


343

## List comprehension

Es una forma conveniente de crear listas en general se usa como reemplazo de la siguiente expresión:

In [56]:
potencias = []
for i in range(-3, 4):
    potencias.append(i**2)
potencias

[9, 4, 1, 0, 1, 4, 9]

In [57]:
potencias = [i**2 for i in range(-3,4)]
potencias

[9, 4, 1, 0, 1, 4, 9]

En general la sintaxis es [_elemento_ for _elemento_ in _Lista_ if _Condición_]

In [58]:
[i**2 for i in range(-3,4) if i%2 == 0]

[4, 0, 4]

La sintaxis de las _list comprehension_ están tomadas de la notación matemática usada en teoría de conjuntos y al principio puede parecer extraña pero en muchas situaciones (como la descripta anteriormente) es considerada la forma preferida y más clara (o forma más _pythonica_).

## Clases

Las clases son una característica clave de la programación orientada a objetos (uno de los paradigmas de programación). Una clase es una estructura para representar un objeto y las operaciones que pueden ser realizadas sobre el objeto. 

En Python una clase puede contener *atributos* (variables) y *métodos* (funciones).

En Python una clase es definida casi como una función, pero usando la palabra clave `class`, y la definición de la clase usualmente contiene algunas definiciones de métodos (una función en una clase).

* Cada método de una clase debería tener un argumento `self` como su primer argumento. Este objeto es una autoreferencia.

* Algunos nombres de métodos de clases tienen un significado especial, por ejemplo:

 * `__init__`: El nombre del método que es invocado cuando el objeto es creado por primera vez.
 * `__str__` : Un método que es invocado cuando se necesita una simple representación de cadena de la clase, como por ejemplo cuando se imprime.
 * Existen muchas más, ver http://docs.python.org/2/reference/datamodel.html#special-method-names

In [59]:
class Punto:
    """
    Clase simple para representar un punto en un sistema de coordenadas cartesiano.
    """
    
    def __init__(self, x, y):
        """
        Crea un nuevo punto en x, y.
        """
        self.x = x
        self.y = y
        
    def traslada(self, dx, dy):
        """
        Traslada el punto en dx y dy en las direcciones x e y respectivamente.
        """
        self.x += dx
        self.y += dy
        
    def __str__(self):
        return("Punto en [%f, %f]" % (self.x, self.y))

Para crear una nueva instancia de una clase:

In [60]:
p1 = Punto(0, 0) # eso invoca el método __init__ en la cláse Punto

print(p1)         # esto invoca el método __str__ 

Punto en [0.000000, 0.000000]


Para invocar un método en la instancia de clase `p`:

In [61]:
p2 = Punto(1, 1)

p1.traslada(0.25, 1.5)

print(p1)
print(p2)

Punto en [0.250000, 1.500000]
Punto en [1.000000, 1.000000]


Note que llamar a métodos de clases puede modificar el estado de esa instancia de clase particular, pero no afecta otras instancias de la clase o alguna otra variable global.

Esto es una de las cosas buenas de un diseño orientado al objeto: código como las funciones y variables relacionadas son agrupadas en entidades separadas e independientes. 

## Modulos y Librerías

La funcionalidad de Python puede ser extendida utilizando librerías o módulos. A grandes rasgos la diferencia entre librería y módulo es que un módulo es un programa de Python y una librería es una colección de modulos. Python viene preinstalado con La Librería Estandard que es una colección de módulos para diversas tareas. Algunos de ellos son:

* `math` (funciones matemáticas)
* `os` (interfaz con el sistema operativo)
* `sys` (parámetros y funciones específicas del sistema)
* `shutil` (operaciones con archivos)
* `subprocess` (comunicación entre procesos)


Para usar un módulo en Python hay que importalo usando el comando _import_. Por ejemplo, para importar el módulo _math_, que contiene muchas funciones matemáticas, usamos:

In [1]:
import math

De esta forma ahora tenemos disponible las funciones contenidas en _math_.

In [3]:
x = math.cos(2 * math.pi)

print(x)

1.0


Alternativamente, podemos elegir importar funciones individuales. Esto puede ser util si solo vamos a usar un grupo reducido de funciones (además de que nos ahorra tener que escribir el nombre del módulo como prefijo).

In [4]:
from math import cos, pi

x = cos(2 * pi)

print(x)

1.0


Como una tercera alternativa, podemos importar todo el contenido de una libreria usando _import *_:

In [5]:
from math import *

x = cos(2 * pi)
x

1.0

Esta forma de proceder puede parecerconveniente, pero en programas largos que incluyen muchos módulos es a menudo una mala idea por que puede conducir a confusiones provocadas por colisiones de nombres.

Luego que se ha cargado un módulo, Ipython nos permite inspeccionarlo usando las siguientes opciones:
* ponemos el cursor al final del nombre del módulo y presionamos _shift + tab_.
* ponemos el cursor al final del nombre del módulo y agregamos 1 o 2 signos de interrogación _?_.
* agregamos un punto al final del nombre del módulo y presionamos tab.

In [12]:
import math

math

Alternativamente podemos usar la función _help_ para obtener una descripción de cada las funciones contenidas en una librería. Esto funciona para todo un módulo o para una función en particular.

In [15]:
help(math.ceil)

Help on built-in function ceil in module math:

ceil(...)
    ceil(x)
    
    Return the ceiling of x as a float.
    This is the smallest integral value >= x.



Si deseamos escribir nuestro propio módulo basta con escribir un archivo en Python y guardalo con extensión _.py_. Para importarlo usamos el comando _import_, como ya vimos.

Así como las funciones y clases permiten encapsular y reusar codigo aumentando la legibilidad de los programas y reduciendo la probabilidad de cometer errores es posible crear nuestros própios modulos. Dicho esto podemos decir entonces que los módulos de Python son construcciones de programación modular de más alto nivel, donde podemos colectar variables relacionadas, funciones y clases. 

## Excepciones

Los errores y como solucionarlo son parte integral de la programación. Como dijo Edsger W. Dijkstra "Si el _debugging_ es el proceso de remover errores, entonces la programación es el proceso de agregar errores".

Hay errores como los de syntaxis o semántica que deben ser eliminados de un programa a fin de que el programa funcione adecuadamente. Hay otro tipo de errores que no pueden ser eliminados pero si anticipados. Por ejemplo si tuvieramos un programa que requiere que un usaurio ingrese números, pero el usuario ingresa una letras. En ese caso el programa debera ser capaz de lidiar con el error (en vez de simplemente dejar de funcionar), por ej reportando al usuario un mensaje de error.

leer más http://docs.quantifiedcode.com/python-code-patterns/correctness/no_exception_type_specified.html?highlight=except

https://docs.python.org/2/library/exceptions.html

In [39]:
valores = [2, 'casa', 10., '10']
for i in valores:
    try:
        print int(i)**2
    except ValueError:
        print "Usted no ha ingresado un número "

4
Usted no ha ingresado un número 
100
100


Para obtener información sobre un error, podemos hacer lo siguiente

In [43]:
for i in valores:
    try:
        print int(i)**2
    except ValueError, e:
        print "Usted no ha ingresado un número\n%s" % e

4
Usted no ha ingresado un número
invalid literal for int() with base 10: 'casa'
100
100


In [46]:
valores = [0, 'casa', 10., '10']
for i in valores:
    try:
        print 5 / i
    except ZeroDivisionError as e:
        print "ZeroDivisionError"
    except Exception as e:
        print "Exception"

ZeroDivisionError
Exception
0.5
Exception


## Lectura adicional

* [Documentación oficial Python](https://docs.python.org/2/index.html) (en Inglés)
* [Material en español](https://wiki.python.org/moin/SpanishLanguage). La mayor parte del material corresponde a traducciones del ingles. (No en todos los casos completa).
* [http://www.python.org/dev/peps/pep-0008](http://www.python.org/dev/peps/pep-0008) - Guía de estilo para la programación en Python. (en inglés).
* [http://www.greenteapress.com/thinkpython/](http://www.greenteapress.com/thinkpython/) - Un libro gratuito sobre Python.

Esta notebook está basada en:

* [http://github.com/jrjohansson/scientific-python-lectures](http://github.com/jrjohansson/scientific-python-lectures).


* [http://github.com/gfrubi/clases-python-cientifico](http://github.com/gfrubi/clases-python-cientifico).




In [1]:
import sys
import IPython
print("Este notebook fue creada con: Python %s e IPython %s." % (sys.version, IPython.__version__))

Este notebook fue creada con: Python 2.7.9 (default, Apr  2 2015, 15:33:21) 
[GCC 4.9.2] e IPython 3.1.0.
