# Introducción a Python para ciencias e ingenierías (notebook 3)


Ing. Martín Gaitán 


Twitter: `@tin_nqn_`


** Registrá tu asistencia a esta clase **

### http://goo.gl/forms/olbkNwX700


**Links útiles**

Repositorio del curso:

### http://bit.ly/cursopy

Python "temporal" online: 

### http://try.jupyter.org

- Descarga de [Python "Anaconda"](http://continuum.io/downloads#py34)
- Resumen de [sintaxis markdown](https://github.com/jupyter/strata-sv-2015-tutorial/blob/master/resources/Working%20With%20Markdown%20Cells.ipynb)


--------





## Módulos y paquetes


Buenísimo estos *notebooks* pero ¿qué pasa si quiero reusar código? 

Hay que crear **módulos**. 

Por ejemplo, creemos un un módulo para guardar la función que encuentra raices de segundo grado.

Podemos abrir cualquier editor (incluído el que trae el propio jupyter), o alternativamente podemos preceder la celda con la "función magic" (que aporta Jupyter y se denotan por empezar con `%` o `%%`), en este caso `%%writefile`

El resultado es dejar el un archivo llamado `cuadratica.py` con el código de nuestra función en el mismo directorio donde tenemos el notebook (el archivo .ipynb)

In [None]:
%%writefile cuadratica.py     

def raices(a, b=0, c=0):
    """dados los coeficientes, encuentra los valores de x tal que ax^2 + bx + c = 0"""

    discriminante = (b**2 - 4*a*c)**0.5
    x1 = (-b + discriminante)/(2*a)
    x2 = (-b - discriminante)/(2*a)
    return (x1, x2)
    
       

Lo hemos guardado en un archivo `cuadratica.py` en el directorio donde estamos corriendo esta consola (notebook), entonces directamente podemos **importar** ese modulo. 

In [None]:
import cuadratica

Esto nos crea un *"espacio de nombres"* llamado `cuadratica`, dentro del cual está la función que definimos 

In [None]:
cuadratica.raices?

In [None]:
cuadratica.raices(3, 2, -1)

In [None]:
cuadratica.raices(3, 2, 1)

Importar un modulo es importar un "espacio de nombres", donde todo lo que el modulo contenga (funciones, clases, constantes, etc.) se accederá como un atributo del modulo de la forma  `modulo.<objeto>`

Cuando el nombre del espacio de nombres es muy largo, podemos ponerle un alias


In [None]:
import cuadratica as cuad   # igual que la primera forma pero poniendole un alias (mas breve). 

cuad.raices?

Si **sólo queremos alguna unidad de código y no todo el módulo**, entonces podemos hacer una importación selectiva

In [None]:
from cuadratica import raices  # sólo importa el "objeto" que indequemos y lo deja 
                               # en el espacio de nombres desde el que estamos importando

In [None]:
raices?

Si, como sucede en general, el módulo definiera más de una unidad de código (una función, clase, constantes, etc.) podemos usar una tupla para importar varias cosas cosas al espacio de nombres actual. Por ejemplo:

      from cuadratica import raices, integral, diferencial 
 
Por último, si queremos importar todo pero no usar el prefijo, podemos usar el `*`. **Esto no es recomendado**
    
    from cuadratica import *

### Ejercicios

1. Cree un módulo `circunferencia.py` que defina una constante `PI` y una función `area(r)` que calcula el área para una circunferencia de radio `r`. 

2. Desde una celda de la sesión intereactiva, importe todo el módulo como un alias `circle` y verifique `circle.PI` y `circle.area()`. Luego importe utilizando la forma `from circunferencia import ...` que importe también la función y la constante

3. verifique que circle.area y area son el mismo objeto

#### Paquetes: módulos de módulos

Cuando tenemos muchos módulos que están relacionados es bueno armar un **paquete**. Un paquete de modulos es un simple directorio con un módulo especial llamado `__init__.py` (que puede estar vacio) y tantos modulos y subpaquetes como queramos. 


Los paquetes se usan igual que un módulo. Por ejemplo, supongamos que tenemos una estructura

    paquete/
       __init__.py
       modulo.py

Puedo importar la `funcion_loca` definida en `modulo.py` así 

    from paquete.modulo import funcion_loca 


In [None]:
%mkdir paquete             # creamos un directorio  "paquete"

In [None]:
%%writefile paquete/__init__.py          # el archivo __init__.py  vacio
 

In [None]:
%%writefile paquete/modulo.py

def funcion_loca(w=300,h=200):
    _                                      =   (
                                        255,
                                      lambda
                               V       ,B,c
                             :c   and Y(V*V+B,B,  c
                               -1)if(abs(V)<6)else
               (              2+c-4*abs(V)**-.4)/i
                 )  ;v,      x=w,h; C = range(-1,v*x 
                  +1);import  struct; P = struct.pack;M, \
            j  =b'<QIIHHHH',open('M.bmp','wb').write; k= v,x,1,24
    for X in C or'Mandelbrot maker. Adapted to PY3 by @tin_nqn_':
        j(b'BM' + P(M, v*x*3+26, 26, 12,*k)) if X==-1 else 0; i,\
            Y=_;j(P(b'BBB',*(lambda T: map(int, (T*80+T**9
                  *i-950*T  **99,T*70-880*T**18 + 701*
                 T  **9     ,T*i**(1-T**45*2))))(sum(
               [              Y(0,(A%3/3.+X%v+(X/v+
                               A/3/3.-x/2)/1j)*2.5
                             /x   -2.7,i)**2 for  \
                               A       in C
                                      [:9]])
                                        /9)
                                       )   )

In [None]:
from paquete.modulo import funcion_loca
funcion_loca()

# podes ver el resultado creando una celda tipo Markdown con el contenido:
#
# ![](files/M.bmp)

#### Ejercicio:

1. Cree un paquete `geometria` que contenga el modulo `circunferencia` creado anterioriomente y otro análogo que se llame `rectangulo` que contenga tambien una función `area`, con el cálculo correspondiente. 

2. Verifique 

    * `import geometria`, 
    * `from geometria import rectangulo`, 
    * `from geometria.circunferencia import pi, area`
    * `from geometria.rectangulo import area as area_rect`


## Biblioteca estándar: las baterías puestas de Python

Sin entrar en detalles, ya utilizamos algunos módulos que trae python, por ejemplo cuando importamos el módulo `math` para usar las funciones matemáticas y constantes que define
    
    import math


Hay muchísimas más funcionalidades que vienen incorporadas al lenguaje y están estandarizadas para que funcionen (salvo casos específicos) de la misma manera en cualquier implementación de Python y sistema operativo. Es lo que se conoce como la [biblioteca estándar de python](http://docs.python.org/3/library/) y es muy abarcativa y potente. 

Además de funciones matemáticas, manejo de algunos formatos de archivos más específicos que el "texto plano", protocolos de internet, otras *clases* de números y estructuras de datos,  etc. 


### CSV

[CSV](https://es.wikipedia.org/wiki/CSV) (Comma Separated Values) es un formato de archivo abierto (un archivo de texto) para datos compartir datos estructurados tipo tabla. 

Es muy simple y básica pero muy usado para intercambiar información estructurada entre distintos programas. Por ejemplo, desde Excel o Libreoffice Calc se pueden guardar (y abrir) archivos CSV. y python también sabe. 

Ver [documentación](https://docs.python.org/3/library/csv.html)


In [None]:
%cat data/near_critical_oil.csv

In [None]:
import csv

with open('data/near_critical_oil.csv') as csv_file:
    reader = csv.reader(csv_file)
    
    critical_oil = [line for line in reader]   #o list(reader)
critical_oil

Para escribir creamos un objeto writer y usa

In [None]:
datos = [('Nombre', 'Peso'), ('Juan', 92), ('La "Mole" Moli', 121), ('Martín', '5 kilos de más')]

with open('pesos.csv', 'w') as pesos_csv:
    writer = csv.writer(pesos_csv)
    writer.writerows(datos)

In [None]:
%cat pesos.csv

### Ejercicios:

1. Dado un archivo CSV `circuitos.csv` (en la siguiente celda), leerlo utilizando `csv.DictReader` en vez de `csv.reader` y devolver todas las filas en una lista. Notar que el delimitador es `;` en vez de coma. 

2. Genere un archivo csv donde la primera columna es la serie de enteros 1 a 10 inclusive, la segunda columna el logaritmo natural para el numero correspondiente de la primera columna, y una tercera que el logaritmo en base 10. 

        [(i, math.log(i), math.log10(i)) for i in range(1, 11)]


In [None]:
%%writefile circuitos.csv
long;lat;CODIGO DE ESTABLECIMIENTO;NOMBRE ESTABLECIMIENTO;DOMICILIO;CIRCUITO;DESDE MESA;HASTA MESA;TOTAL MESAS;Dirección Normalizada
-58.372807778869245;-34.622409314430783;4369;ESC N°3 BERNARDINO RIVADAVIA;BOLIVAR 1235;1;19;28;10;BOLIVAR 1235
-58.384400577996836;-34.593569986274616;4593;COL. NAC.Nº2 D F SARMIENTO;LIBERTAD 1257;6;115;136;22;LIBERTAD 1257
-58.373914555842283;-34.602665313935738;4409;ESC N°13 GRAL SAN MARTIN;SAN MARTIN 458;9;192;206;15;SAN MARTIN 458
-58.383791453750931;-34.601733848426591;5330;ESC N°7 PTE ROCA;LIBERTAD 581;10;225;234;10;LIBERTAD 581
-58.388829352224974;-34.605387432219594;9026;UMSA UNIV DE MUSEO SOCIAL ARG;SARMIENTO 1565;10;252;259;8;SARMIENTO 1565
-58.373317952774258;-34.611859568515861;5118;ESC POLITECNICA Nº5 M BELGRANO;BOLIVAR 346;14;367;371;5;BOLIVAR 346
-58.373438804697628;-34.610990941996334;8716;COLEGIO NACIONAL BUENOS AIRES;BOLIVAR 263;14;372;381;10;BOLIVAR 263

### Números aleatorios

Todas las funciones relacionadas a la aleatoriedad están en el módulo `random`. 

Ver [documentación](https://docs.python.org/3/library/random.html)

In [None]:
import random

# la función más básica
random.random()                      # float aleatorio, 0.0 <= x < 1.0

In [None]:
random.randrange(10)           # análogo a range() devuelve un numero aleatorio de la serie

In [None]:
random.choice([0.3, 10, 'A'])     # elige un elemento al azar de una secuencia no vacía

In [None]:
random.sample(l, k=3)      # elige k elementos de la poblacion dada 

In [None]:
l = list(range(10))
random.shuffle(l)       # "desordena" una lista (inline)
l 

También tiene muchas funciones de probabilidad

In [None]:
[method for method in dir(random) if method.endswith('variate')]

#### Ejercicio

1. Crear un generador de 1000 números aleatorios pertecientes a una curva de probabilidad normal con media 1 y variancia 0.25. 

2. Verificar que la media y la variancia son cercanas a las esperadas (Tip: investigar las funciones del módulo `statistics`)


## Serialización 

A veces queremos **serializar un objeto** cualquiera para poder recuperarlo más adelante. Si sólo nos interesa persistir y recuperar información **a nivel Python** podemos usar le módulo [`pickle`](https://docs.python.org/3.4/library/pickle.html). 

In [None]:
información = ['puede', 'ser', {'casi': [], 'cualquier': 100, 'cosa': ('!',)}]

import pickle

pickle.dumps(información)

In [None]:
# en sentido contrario
pickle.loads(_)

In [None]:
# O bien guardar directamente a un archivo

pickle.dump(información, open('datos.pkl', 'wb'))

In [None]:
pickle.load(open('datos.pkl', 'rb'))

Siempre que la clase **sea serializable** (es decir, que se base en otras clases serializables), pickle permite serializar instancias de clases arbitrarias. 

In [None]:
class A:
    "una clase que no hace absolutamente nada"
    pass

a = A()

a_serializado = pickle.dumps(a)
a_serializado

In [None]:
type(a_serializado)    # la serializados es como datos binarios "crudos"

In [None]:
b= pickle.loads(_)

El objeto reconstruído tiene *el mismo estado* (es identico) al original, pero no es en sí el mismo objeto

In [None]:
b is a

Un detalle importante: para poder deseralizar un objeto arbitrario, su clase debe existir en el espacio de nombres

In [None]:
del A    # borramos la clase A del espacio de nombres global
pickle.loads(a_serializado)

**pickle** es un tipo de serialización específica para Python. Una alternativa más genérica que muchos otros lenguajes soportan (y es muy típica para compartir datos a traves de "APIs" en la web) es el formato [JSON](https://es.wikipedia.org/wiki/JSON), que funciona igual, pero genera una serialización en formato texto y más legible por humanos

In [None]:
import json

json.dumps(información)

## Ejecutando otros "programas" desde jupyter y python

Jupyter permite llamar a programas subyacentes preciendo el comando con un signo de exclamación 

In [None]:
# !notepad   en windows
!gedit    # abre el programa gedit en linux  

Incluso podemos capturar la salida del comando y obtener una lista de textos

In [None]:
mole = !cat pesos.csv | grep "Mole"    
mole

Si queremos hacer esto en "Python puro", por ejemplo porque queremos que una función ejecute un programa 

debemos usar el módulo `subprocess`

In [None]:
import subprocess

subprocess.call(['gedit'])

In [None]:
subprocess.check_output(['echo', 'hola python, soy echo'])    # se ejecuta en el "kernel" (ver consola)

## Más estructuras de datos!



El módulo [`collections`](https://docs.python.org/3.4/library/collections.html)  tiene muchas otras clases complementarias a las listas, tuplas, diccionarios y conjuntos que ya vimos, útiles para propósitos específicos 

In [None]:
from collections import Counter, OrderedDict, namedtuple  #hay más!

OrderedDict es... un diccionario que sí queda ordenado

In [None]:
OrderedDict.__doc__    # para http://twitter.com/Obvio

In [None]:
d = OrderedDict()
d['item_1'] = 1
d['item_2'] = '1 millon'
d['item_3'] = None
for par in d.items():
    print(par)


`Counter` recibe cualquier secuencia y cuenta los elementos 

In [None]:
contador = Counter('abracadabra')
contador

In [None]:
contador.most_common(3)

`namedtuple` es una factory de "tuplas con nombre", es decir, nuevos tipos de dato que funcionan igual que una tupla, pero donde cada elemento puede tener un nombre  además de su posición. 


In [None]:

Raices = namedtuple('Raices', ['x1', 'x2'])


def raices(a, b=0, c=0):
    """dados los coeficientes, encuentra los valores de x tal que ax^2 + bx + c = 0"""

    discriminante = (b**2 - 4*a*c)**0.5
    x1 = (-b + discriminante)/(2*a)
    x2 = (-b - discriminante)/(2*a)
    return Raices(x1, x2)

soluciones = raices(-2, 2, 2)
soluciones

En el ejemplo puede no ser necesario, pero si la tupla devuelva por la función tuviera muchos elementos (y no tenemos su código a la vista), **recordar qué significado tiene cada posición** puede ser engorroso. 

Lo bueno es que usar una `namedtuple` no es disruptiva, porque sigue funcionando como una tupla 

In [None]:
soluciones[0], soluciones[1]

Pero también se pueden pedir los valores como atributos

In [None]:
soluciones.x1

In [None]:
soluciones.x2

Obviamente, como es una tupla (es inmutable), no podemos asignar los atributos

In [None]:
soluciones.x1 = 10

### Traer datos de Internet

La biblioteca estándar tiene funcionalidades para manejar (leer y escribir) muchos protocolos de internet: http, pop3, ftp, imap, smtp y más. 

Para trabajar extensivamente con http, es muy popular (y recomendado) un biblioteca alternativa no oficial llamado [requests](http://www.python-requests.org/en/latest/)

También es útil el magic `%load` en el contexto de la sesión interactiva

In [None]:
from urllib.request import urlopen 

In [None]:
url = 'https://gist.githubusercontent.com/mgaitan/d75956d1d928fb4a8c8d/raw/60085d8bc1468dca88c029da7fe88f5956310ae3/Hola.txt'
with urlopen(url) as response:
    contenido = response.read().decode('utf8')     # el decode es para "decodificar" bytes crudos como texto unicode

In [None]:
print(contenido)

#### Ejercicio

1. Abrir la portada de un portal de noticias de su elección, leer todo su contenido y listar las 10 palabras  más repetidas de más de 4 caracteres y que no contengan símbolos


In [None]:
simbolos = set("#$%&\'()*+,-./:;<=>?@[\]^_`{|}~")

## Escribir programas de línea de comando


Ya vimos que es muy simple ejecutar un módulo de python como un **script**. Simplemente hay que pasar como parámetro al ejecutable python el módulo en cuestión 

    python archivo.py


In [1]:
%%writefile ejemplo_script.py

saludo = "Hola Mundo"

print(saludo)

Overwriting ejemplo_script.py


In [2]:
!python ejemplo_script.py

Hola Mundo


El tema es que si importamos ese módulo desde la sesión interactiva o desde otro módulo, tambien se ejecutará todo el código que defina

In [3]:
from ejemplo_script import saludo
print(saludo)

Hola Mundo
Hola Mundo


A veces queremos que **se ejecute algo sólo cuando lo invocamos como script** y no cuando lo importamos. 

Para eso podemos valernos de que Python asigna el nombre `__main__` al módulo principal con que fue llamado, en la variable global `__name__`

In [4]:
%%writefile ejemplo_script2.py

saludo = "Hola Mundo"

if __name__ == '__main__':
    # esto se ejecuta solo cuando el modulo se llama como script
    # no cuando se importa desde otro modulo o desde la sesion interactiva
    print(saludo)

Writing ejemplo_script2.py


In [5]:
from ejemplo_script2 import saludo
saludo[:4]

'Hola'

In [6]:
!python ejemplo_script2.py

Hola Mundo


Si bien un programa de linea de comandos puede solicitar información al usuario interactivamente (por ejemplo, a utilizando la función `input()`), lo más típico es que los argumentos se pasen directamente en la llamada

    python mi_programa.py <parametro> [parametro 2]
    
    
Python guarda todos los argumentos pasados (incluyendo el nombre del propio módulo) en una lista llamada `argv` del módulo `sys`

In [7]:
%%writefile ejemplo_argv.py

if __name__ == '__main__':
    import sys
    print(sys.argv)

Writing ejemplo_argv.py


In [9]:
!python ejemplo_argv.py --allthenight --shampein

['ejemplo_argv.py', 'parametro', '10', '--allthenight', '--shampein']


Para parámetros muy simples podemos buscar valores directamente en esta lista, por ejemplo:

      if '--allthenigh' in sys.argv:
           room.append(cristal)
           
Pero la mayoría de las veces los argumentos posibles son más complejos y se requiere una **librería para procesar los argumentos** dados, convertirlos a un tipo de datos particular, asignar valores defaults a aquellos parametros que no se explicitaron, generar un resumen de la opciones disponibles a modo de ayuda, etc. 

Para esto se puede usar el módulo [`argparse`](https://docs.python.org/3/library/argparse.html#module-argparse)




In [16]:
%%writefile prog.py

import argparse

if __name__ == '__main__':

    parser = argparse.ArgumentParser(description='Procesa una lista de enteros')
    parser.add_argument('enteros', metavar='N', type=int, nargs='+',        # uno o mas argumentos. se acumulan en una lista
                       help='an integer for the accumulator')
    parser.add_argument('--sum', dest='operacion', action='store_const',    # si se pasa --sum se usará const 
                       const=sum, default=max,                              # en vez de default
                       help='sum the integers (default: find the max)')

    args = parser.parse_args()
    print(args.operacion(args.enteros))

Overwriting prog.py


In [18]:
!python3 prog.py

usage: prog.py [-h] [--sum] N [N ...]
prog.py: error: the following arguments are required: N


In [19]:
!python3 prog.py -h

usage: prog.py [-h] [--sum] N [N ...]

Procesa una lista de enteros

positional arguments:
  N           an integer for the accumulator

optional arguments:
  -h, --help  show this help message and exit
  --sum       sum the integers (default: find the max)


In [21]:
!python3 prog.py  10 2 --sum 45 

usage: prog.py [-h] [--sum] N [N ...]
prog.py: error: unrecognized arguments: 45



Tarea: Estudiar la biblioteca estándar de Python ! 

--------------





## Matplotlib, un gráfico vale más que mil palabras

Python es un lenguaje muy completo pero aunque es muy grande, su librería estándar no es infinita. Por suerte hay miles y miles de bibliotecas extra para complementar casi cualquier aspecto en el que queramos aplicar Python. En algunos ámbitos, con soluciones muy destacadas. 

Para hacer gráficos existe Matplotlib http://matplotlib.org/ . Ya viene instalado con la versión completa de Anaconda. 


In [None]:
%matplotlib inline

In [None]:
from matplotlib import pyplot

In [None]:
x = [0.1*i for i in range(-50, 51)]
y = [x_i**2 for x_i in x]

In [None]:
pyplot.plot(x,y)

Los gráficos emergentes son buenos porque tiene la barra de herramientas y podemos guardarlos en excelente calidad (incluso vectorial, ideal para un poster A0). Pero en los notebooks podemos poner los gráficos directamente incrustados

In [None]:
pyplot.plot(x,y)
pyplot.title('Pará bola!')
pyplot.grid()

Matplotlib sabe hacer muchísimos tipos de gráficos!

In [None]:
components = [c for (c, f) in critical_oil[1:]]
fraction = [float(f) for (c, f) in critical_oil[1:]]
# el ; evita el output
pyplot.pie(fraction, labels=components, shadow=True);

In [None]:
import random
campana = [random.gauss(0, 0.5) for i in range(1000)]

In [None]:
pyplot.hist(campana, bins=15);

Pero antes de seguir con Matplotlib debemos aprender el corazón del Python Cientifico: Numpy

## Numpy, todo es un array

El paquete **numpy** es usado en casi todos los cálculos numéricos usando Python. Es un paquete que provee a Python de estructuras de datos vectoriales, matriciales y de rango mayor, de alto rendimiento. Está implementado en C y Fortran, de modo que cuando los cálculos son vectorizados (formulados con vectores y matrices), el rendimiento es muy bueno.

In [None]:
import numpy as np

El pilar de numpy (y toda la computación científica basada en Python) es el tipo de datos `ndarray`, o sea arreglos de datos multidimensionales. 

¿Otra secuencia más? ¿pero que tenina de malo las listas?

Las listas son geniales pero guardar **cualquier tipo de objeto** y su flexibilidad las vuelve ineficientes

In [None]:
%timeit [0.1*i for i in range(10000)]    # %timeit es otra magia de ipython

In [None]:
%timeit np.arange(0, 1000, .1)    # arange es igual a range, pero soporta paso de tipo flotante

Existen varias formas para inicializar nuevos arreglos de numpy, por ejemplo desde

- Listas o tuplas
- Usando funciones dedicadas a generar arreglos numpy, como `arange`, `linspace`,`ones`, `zeros` etc.
- Leyendo datos desde archivos

In [None]:
v = np.array([1,2,3,4])
v

In [None]:
# una matriz: el argumento de la función array function es una lista anidada de Python
M = np.array([[1, 2], 
              [3, 4]])
M

In [None]:
type(v), type(M)

Los ndarrays tienen distintos atributos. Por ejemplo

In [None]:
v.ndim, M.ndim    # cantidad de dimensiones

In [None]:
v.shape, M.shape  # tupla de "forma". len(v.shape) == v.ndim

In [None]:
v.size, M.size   # cantidad de elementos. 

In [None]:
M.T   # transpuesta!

A diferencia de las listas, los *arrays* tambien **tienen un tipo homogéneo** 

In [None]:
v.dtype     # 

Se puede definir explicitamente el tipo de datos del array

In [None]:
np.array([[1, 2], [3, 4]], dtype=complex)

Una gran ventaja del atributo `shape` es que podemos cambiarlo. Es decir, reacomodar la distrución de los elementos (por supuesto, sin perderlos en el camino)

In [None]:
A = np.arange(0, 12)
print(A)

In [None]:
A.shape = 3, 4
print(A)

Esto es porque numpy en general no mueve los elementos de la memoria y en cambio usa **vistas** para mostrar los elementos de distinta forma. Es importante entender esto porque incluso los slicings son vistas. 

In [None]:
a = np.arange(10)
b = a[::2]  # todo de 2 en 2
b

In [None]:
b[0] = 12
a  # chan!!!

En cambio

In [None]:
a = np.arange(10)
b = a[::2].copy()
b[0] = 12
a

Además de `arange` hay otras funciones que devuelven arrays. Por ejemplo `linspace`, que a diferencia de `arange` no se da el tamaño del paso, sino la cantidad de puntos que queremos en el rango

In [None]:
np.linspace(0, 2 * np.pi, 100)      # por defecto, incluye el limite. 

In [None]:
_.size   # en cualquier consola, python guarda el ultimo output en la variable _ 

In [None]:
matriz_de_ceros = np.zeros((4,6))
matriz_de_ceros

In [None]:
np.ones((2, 4))

Pero numpy no sólo nos brinda los arrays. Los conceptos claves que aporta son *vectorización* y *broadcasting*

La **vectorización** describe la **ausencia de iteraciones explícitas e indización**
(que toman lugar, por supuesto, "detrás de escena", en un optimizado y precompilado
código C). La vectorización tiene muchas ventajas:

* El código vectorizado es más conciso y fácil de leer.
* Menos líneas de código habitualmente implican menos errores.
* El código se parece más a la notación matemática estándar (por lo que es más fácil,
por lo general, corregir código asociado a construcciones matemáticas
* La vectorización redunda en un código más "pythónico"

In [None]:
a = np.array([3, 4.3, 1])
b = np.array([-1, 0, 3.4])
c = a * b
c

¡Basta de bucles `for` for todos lados! 

El **broadcasting** (*difusión*) es el término que describe el comportamiento
**elemento por elemento** de las operaciones. En general, en Numpy todas
las operaciones adoptan por defecto un comportamiento de este tipo (no sólo las operaciones
aritméticas sino las lógicas, las funcionales y las de nivel de bits). 

In [None]:
x = np.linspace(-12, 12, 1000)
y = x ** 2 - 1
pyplot.plot(x, y)

Matplotlib se lleva muy bien con numpy (de hecho lo usa internamente)

### Slicing extendido

El funcionamiento básico del indexado y el slicing funciona igual con `ndarrays` que con cualquier secuencia.  


In [None]:
ruido = np.random.random(1000)   # 1000 numeros aleatorios entre [0, 1)


In [None]:
ruido[0] == ruido[-1000]

In [None]:
ruido[999] == ruido[-1]

In [None]:
ruido[1:5]

In [None]:
ruido[0:10] = np.zeros((10,))  # claro que los arrays son mutables!

Pero veamos algo más. Supongamos que tenemos una matriz de 3x3

In [None]:
m = np.arange(0, 9)  
m.shape = 3, 3
m

In [None]:
m[0]       # primer indice: filas

In [None]:
m[0:2]

Pero la sintaxis se extiende de una manera eficiente y compacta.



In [None]:
%timeit m[1][1]      # buuuuh!!!

In [None]:
%timeit m[1,1]    # yeaaaa!!!

In [None]:
m[:,0]      # quiero la primer columna

In [None]:
m[0:2, 0:2]   # la submatriz superior izquierda de 2x2 

Se acuerdan que en el slicing común había un tercer parametro opcional que era el paso? Funciona acá también

In [None]:
m[::2, ::2]    # esquinas

In [None]:
a = np.arange(60)
a.shape = 6, 10
a[:,:6]



In [None]:
a[:,2:3]h

Como resumen

![](http://www.tp.umu.se/~nylen/pylect/_images/numpy_indexing.png)


### Ejercicios

- Crear un array de 1000 números aleatorios y encontrar su media (tip: ver el método `mean()`)
- Crear una array (matriz) de 10x10 donde cada fila va del 0 al 9 (tip: ¿qué pasa al sumar un array 2d con otro 1d?)
- Crear una matriz de esta forma

        array([[0, 0, 0, 0, 5],
               [0, 0, 0, 4, 0],
               [0, 0, 3, 0, 0],
               [0, 2, 0, 0, 0],
               [1, 0, 0, 0, 0]])
  (tip: investigar la función `diag()` y `rot90()`


In [None]:
aleatorio = np.random.normal?

In [None]:
aleatorio = np.random.normal

In [None]:
np.zeros((10,10)) + np.arange(10)

### Algunas funciones incluídas en numpy

Encontrar raices de un polinomio

In [None]:
np.roots([2, 0, -2])

In [None]:
np.roots([1j, -4+0.4j, 18, -np.pi, 0])  # polinomio de grado 5!

Resolver un sistema de ecuaciones lineales  `Ax = b`

In [None]:
A = np.array([[1, 2], [0.5, -2]])
b = np.array([4, 5.2])

In [None]:
x = np.linalg.solve(A, b)
x

Encontrar la inversa de una matriz

In [None]:
A = np.array([[1,2],[3,4]])
invA = np.linalg.inv(A)
invA

In [None]:
np.dot(A,invA)   # producto punto

### Ejercicios

- Encontrar las raices para el polinomio $$f(x) = \frac{1}{4}(x^3 + 3x^2 − 6x − 8)$$ y grafique con x entre [-3, 3]
- Resuelva el siguiente sistema de ecuaciones 

  $$\begin{array} - -x + z = -2\\ 2x - y + z = 1 \\ -3x + 2y -2z = -1 \\ x - 2y + 3z = -2 \end{array}$$

