# Notas de Python  




### Referencias importantes:

* [Automate the Boring Stuff con Python](http://automatetheboringstuff.com/chapter0/) Gran Libro escrito del Al Sweigart, para gente que empiezan a programar.  


* [Dive in Python 3](http://getpython3.com/diveintopython3) Libro intermedio de Python, escrito por Mark Pilgrim, que abarca tópicos avanzados como  Refactoring  y Pruebas Unitarias.  


* [Composing Programs](http://composingprograms.com/) Introducción online  de Programación y Ciencia de la Computación, de la Universidad de Berkeley, escrita por John DeNero,  basado en el Libro: Structure and Interpretation of Computer Programs  [SICP](https://mitpress.mit.edu/sicp/)  de Harold Abelson y Gerald Jay Sussman y Julie Sussman.  


* [Python Cookbook](http://chimera.labs.oreilly.com/books/1230000000393/index.html) Libro escrito por [David Beazley](http://www.dabeaz.com/) y Brian k. Jones, para programadores con cierta experiencia en Python, que se centra en algunas de las más avanzadas técnicas usadas por librerias, framework y aplicaciones.  


* [Tutorial de Python](http://docs.python.org.ar/tutorial/3/) traducido por Python Argentina.


## Consiguiendo Python 


Puedes descargar Python desde [](https://www.python.org/). Pero es, recomendable  instalar la distribución [Anaconda](https://www.continuum.io/downloads), que incluye la mayor parte de las bibliotecas que se necesita para hacer ciencia de datos.

Si no desea o no consigue Anaconda, asegúrese de instalar [pip](https://pypi.python.org/pypi/pip), que es un administrador de paquete que te permite instalar fácilmente paquetes de terceros. Por ejemplo es digno conseguir IPython, que es un terminal de Python mucho más agradable para trabajar:

```bash
    pip install Ipython
 
 ```

## El Proyecto Jupyter

[El Proyecto Jupyter ](http://jupyter.org/) anteriormente conocido como el proyecto IPython, proporciona una colección de herramientas para la ciencia de datos mediante shells (Python, R, Julia) que combinan la ejecución del código con la creación de documentos informáticos activos.  Esta herramienta viene con la distribución Anaconda. 

[Spyder](https://github.com/spyder-ide) es un IDE de Python, que se incluye con Anaconda. Incluye edición,  pruebas interactivas, depuración y características de introspección para Python. Después de haber instalado Anaconda, se puede empezar  a utilizar Spyder en OSX, Linux o Windows mediante el terminal  y ejecutando el  comando  spyder.

## El Zen de Python  

David Goodger, presenta un  [tutorial interactivo](http://python.net/~goodger/projects/pycon/2007/idiomatic/handout.html), que cubre  lo esencial de Python y técnicas en profundidad, empezando con el Zen de Python de Tim Peters.

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Formato de los espacios en blanco

En [Python](https://www.python.org/)  se usa la **indentación**, para delimitar el c\'odigo a diferencia de otros lenguajes de programación, que usan llaves para delimitar bloques de código. Mayor información en la [Guia de Estilo de Google para Python](https://google.github.io/styleguide/pyguide.html).


In [2]:
# Un ejemplo para el bucle for 

for i in [1, 2, 3]:   
    print(i)
    for j in [1,2,3]:
        print(j)
        print(i + j)
    print(i)
print("Este es un bucle")

1
1
2
2
3
3
4
1
2
1
3
2
4
3
5
2
3
1
4
2
5
3
6
3
Este es un bucle


La indentación, hace del código Python fácil de leer, pero también significa que se tiene que ser muy cuidadoso  con nuestro formato y la manera de escribir código. El espacio en blanco es ignorado dentro de los paréntesis y corchetes.

In [3]:
# Ejemplo con clases y herencias 

class Animalito():
    def __init__(self, nombre):
        self.nombre = nombre
        
    def decir_algo(self):
        print(" Yo soy" + self.nombre)
        
class Perrito(Animalito):
    def decir_algo(self):
        print("Yo soy " + self.nombre + "y puedo ser tu amigo")
        
perrito = Perrito("Kapu")
perrito.decir_algo()

Yo soy Kapuy puedo ser tu amigo


### Control de flujo

En casi todos los lenguajes, tu puedes llevar acciones condicionalmente usando **if**. Empecemos con un ejemplo:

In [7]:
if 1 > 2:
    mensaje = "si 1 es mayor que 2"
elif 1 > 3:
    mensaje = "elif representa 'else if"
else:
    mensaje = " cuando todas las alternativas  fallan usamos else"
    

Los operadores ternarios son comúnmente usados como expresiones condicionales en Python. Estos se convirtieron en una parte de Python en la versión 2.4. Aquí la sintaxis de un operador ternario y un ejemplo del uso de estas expresiones condicionales.  


```python
    condicion_es_verdad if condicion else condicion_is_falso
```

In [8]:
x = 9
paridad = 'par' if x%2 ==0 else 'impar'
paridad

'impar'

Python, tiene el bucle while y una aplicación de while son las sumatorias en matemáticas. Por ejemplo la función seno puede ser calculada aproximadamente usando while de la siguiente manera:

In [11]:
x = 1.2 # asignamos algun valor",
N = 25 # maximo potencia de sumas"
k = 1
s = x
sign = 1.0

import math

while k < N:
    sign = - sign
    k = k + 2
    term = sign*x**k/math.factorial(k)
    s = s + term
print ("seno(%g) = %g (aproximacion con %d terminos)" % (x, s, N))

seno(1.2) = 0.932039 (aproximacion con 25 terminos)


Pese al uso de  while , a menudo se usa for  acompañado con la palabra in:

In [12]:
frutas = ['manzana', 'pera', 'mango']
for fruta in frutas:
    print(fruta.capitalize())

Manzana
Pera
Mango


Los bucles en Python también tienen la  cláusula else. La estructura básica de un bucle for-else es:

```python
for item in contenedor:
    if buscar_algo(item):
        # Encontrado!
        procesarlo(item)
        break
else:
    # No encontrado
    no_encontrado_en_el_contenedor()
```  

Veamos un ejemplo:

In [14]:
# Encontremos los numeros primos entre el 2 y el 20

for n in range (2,20):
    for x in range(2,n):
        if n%x ==0:
            print(n, 'igual', x, '*', n/x)
            break
    
    else:
        # el bucle no encontro ningun factor
        print(n, 'es un numero primo')

2 es un numero primo
3 es un numero primo
4 igual 2 * 2.0
5 es un numero primo
6 igual 2 * 3.0
7 es un numero primo
8 igual 2 * 4.0
9 igual 3 * 3.0
10 igual 2 * 5.0
11 es un numero primo
12 igual 2 * 6.0
13 es un numero primo
14 igual 2 * 7.0
15 igual 3 * 5.0
16 igual 2 * 8.0
17 es un numero primo
18 igual 2 * 9.0
19 es un numero primo


## Funciones

Una función es una pieza de código de un programa que lleva una tarea especifica. Las  funciones  pueden ser asignadas a variables, almacenadas en collecciones o pasadas como argumentos. Hay dos tipos de funciones, las que son parte del lenguaje como dir(), len o abs() y las que puede definir el usuario, las que se crean con la palabra reservada, def.

In [15]:
def doble(x):
    """
    aqui es donde colocas informacion extra
    que indica lo que hace la funcion(docstring)
    """
    
    return x*2

La función se ejecuta posteriormente  cuando es necesario. Decimos que  llamamos a la función. Si llamamos a la función, las declaraciones dentro del cuerpo de la función son ejecutadas.

In [17]:
doble(5) # Llamando a la funcion doble()

10

Las definiciones de las funciones deben preceder a su uso. De lo contrario el intérprete mostrará una excepción NameError. Veamos un ejemplo de funciones que muestra que su definición precede a su uso:

In [19]:
def f1():
    print("f1()")
f1()
f2()

def f2():
    print ("f2()")

f1()


NameError: name 'f2' is not defined

Una función  puede ser definida dentro de un módulo, una clase o otra función. Una función definida dentro de una clase es llamado  un método. Veamos el siguiente ejemplo

In [20]:
class g1():
    @staticmethod
    def h1():
        print("h1() es un metodo")
        
def h1():
    print("h1() es una funcion")
    
def k1():
    def h1():
        print("h1() es una funcion interna")
    h1()
    
g1.h1()
h1()
k1()

h1() es un metodo
h1() es una funcion
h1() es una funcion interna


Las funciones en Python, son objetos. Ellos pueden ser manipulados como otros objetos en Python. Por tanto las funciones son llamadas  de primera clase. Esto no es cierto para lenguajes como Java o C#. Esta particularidad se muestra en el siguiente ejemplo:

In [21]:
# Las funciones son objetos

def f():
    """
    Esta funcion imprime un mensaje
    """
    print("Python es un lenguaje tan importante como R")
    
print(isinstance(f, object)) # se verifica si f() es una instancia de objeto
print(id(f))

print(f.__doc__)
print(f.__name__)

True
140552634524400

    Esta funcion imprime un mensaje
    
f


Los objetos pueden ser almacenados en colecciones y pasados a funciones.

In [23]:
def fun1():
    pass
def gfun1():
    pass

def hfun1(fun1):
    print(id(fun1))
    
a = (fun1, gfun1, hfun1)
for i in a:
    print(i)
    
hfun1(fun1)
hfun1(gfun1)

<function fun1 at 0x7fd4f5dae9d8>
<function gfun1 at 0x7fd4f5daea60>
<function hfun1 at 0x7fd4f5dae7b8>
140552634558936
140552634559072


Hay en el mundo de las funciones de Python, funciones que siempre están disponibles para su uso; funciones que son contenidas dentro de un  módulo externo;  las que deben ser importadas y funciones definidas por el usuario  con la palabra reservada def:

In [24]:
from math import sqrt

def cuadratica(x):
    return x*x*x*x

print (abs(-1))   # funcion parte de Python
print(cuadratica(4))
print(sqrt(97))

1
256
9.848857801796104


La palabra reservada de Python return es usada para devolver valores desde una función. Una función puede o no retornar un valor. Si una función no tiene un return, entonces se debería enviar un valor None.

In [25]:
def g1(msg):
    print(msg)

def suma(x, y):
    return x + y

z = suma(3,5)
print(z)
g1("Notebook  a punto de terminar")
print(g1("Listo!"))

8
Notebook  a punto de terminar
Listo!
None


Podemos enviar más de un valor de una función.. Los objetos después de la palabra clave return  están separados por comas.

In [26]:
n = [1, 2, 3, 4, 5, 6]

def estadistica(x):
    mx = max(x)
    mn = min(x)
    ln = len(x)
    sm = sum(x)
    
    return mx, mn, ln, sm

mx, mn, ln, sm = estadistica(n)
print(estadistica(n))
print(mx, mn, ln, sm)

(6, 1, 6, 21)
6 1 6 21


La naturaleza dinámica de Python, permite redefinir funciones ya definidas. Veamos un ejemplo hecho por Jan Bodnar:

In [27]:
from time import gmtime, strftime

def msg1(msg):
    print(msg)

msg1("Hola, mi nombre es alegria")

def msg1(msg):
    print(strftime("%H:%M:%S", gmtime()))
    print(msg)

msg1("Proceso")

Hola, mi nombre es alegria
18:17:08
Proceso


Muchas funciones aceptan argumentos. Los argumentos son valores que son enviados a la función. Las funciones procesan los valores y opcionalmente retornan un valor.

In [29]:
a = 20;  b = -2.5 # variables globales
def f1(x):
    a = 21
    return a * x + b

f1(9)

186.5

Los argumentos en las funciones pueden tener implícitos valores. Un implícito valor es usado si un valor no es proporcionado:

In [30]:
def potencia(x, y =2):
    r = 1
    for i in range(y):
        r = r * x
    return r

print(potencia(3))
print(potencia(4,3))
print(potencia(5,4))

9
64
625


Las funciones de Python pueden especificar sus argumentos con una palabra clave. Esto significa que cuando se llama a una función, se especifica tanto una palabra clave y un valor. Cuando tenemos varios argumentos y se usan sin palabras clave, el orden en que se pasa esos argumentos es crucial.

In [31]:
def informacion(nombre, edad, lenguaje):
    print("Nombre", nombre)
    print("Edad", edad)
    print("Lenguaje", lenguaje)
    
informacion(edad =43, nombre= "cesar", lenguaje="Java") # no es recomendable cambiar el orden
informacion(nombre ="kapu", edad = 6, lenguaje = "R")
informacion(nombre = "karina", edad = 24, "Python") # no podemos usar una palabra sin clave.

SyntaxError: positional argument follows keyword argument (<ipython-input-31-9a5fffa0bcfc>, line 8)

Las funciones en Python puede aceptar un número arbitrario de argumentos. El operador *  indica que la función acepta un número arbitrario de argumentos.

In [33]:
def suma(*args):
    ''' Funciona que retorna la suma de todos los valores dados'''
    
    r = 0
    for i in args:
        r += i
    return r

print(suma.__doc__)
print(suma(1,2,3))
print(suma(1,2,3,4,5))

 Funciona que retorna la suma de todos los valores dados
6
15


También podemos usar el operador ` ** `  en nuestras funciones. En tal caso, la función aceptará un diccionario de  longitud arbitraria. Podemos entonces normalmente analizar el diccionario, de la manera usual:

In [34]:
def muestra(**datos):
    for i in datos:
        print("%s: %s" % (i, datos[i]))
muestra(lenguaje="Python", paradigma="OOP", edad= 23)

edad: 23
lenguaje: Python
paradigma: OOP


Los parámetros a funciones se pasan por referencia. [Mayor información en stackoverflow](http://stackoverflow.com/questions/986006/how-do-i-pass-a-variable-by-reference). Algunos lenguajes pasan copias de los objetos a las funciones. Pasar objetos por referencia tiene dos importantes conclusiones. El proceso es más rápido que si se pasaron copias de los objetos y los objetos mutables que son modificados en funciones cambian de forma permanente. Un ejemplo de Jan Bodnar, donde se pasa una lista de números enteros a una función, el objeto se modifica en el interior del cuerpo de la función. Después de llamar a la función, el objeto original, la lista de los números enteros es modificada.  En el cuerpo de la función trabajamos con el objeto original, no con una copia del objeto.

In [35]:
n = [1, 2, 3, 4, 5]
print("Lista original:", n)

def f(x):
    x.pop()
    x.pop()
    x.insert(0,0)
    print("dentro de f()", x)
    
f(n)
print("despues de la llamada de la funcion")

Lista original: [1, 2, 3, 4, 5]
dentro de f() [0, 1, 2, 3]
despues de la llamada de la funcion


Las variables definidas en el cuerpo de una función tienen un alcance local, esto es, sólo son válidas dentro del cuerpo de la función. Por defecto, se puede obtener el contenido de una variable global en el interior del cuerpo de una función, pero si queremos cambiar una variable global en una función, hay que utilizar la palabra clave global.

In [36]:
a = 20; b = -2.5 # variables globales
def f1(x):
    a = 21
    return a *x + b # esta es una nueva variable local

print(a)

def f2(x):
    global a
    a = 21
    return a *x + b # la variable global a es cambiada

f1(3); print(a)   # 20 es impreso
f2(3); print(a)   # 21 es impreso

20
20
21


Es posible crear funciones anónimas en Python. Las funciones anónimas no tienen un nombre. La palabra reservada lambda produce  funciones anónimas en  Python . Ellas son parte del paradigma funcional (Lisp) incorporados a Python.

In [37]:
def j(x):
    return x*2
j(4)

8

In [38]:
# usando lambda 

g = lambda x: x*2
g(5)

10

In [39]:
# usamos lambda sin asignar una variable
(lambda x: x*2)(4)

8

La función lambda, puede ser usada por otras partes funcionales de Python, como las funciones filter(), map() o reduce(). 

La función de map() aplica una función a cada elemento de un iterable y devuelve el resultado.

In [41]:
def cuadrado(x):
    return x**2

cuadrados = map(cuadrado, range(8))
print(list(cuadrados))

[0, 1, 4, 9, 16, 25, 36, 49]


In [42]:
# Usando lambda() y map() juntos
cuadrados = map(lambda x: x**2, range(8))
print(list(cuadrados))

[0, 1, 4, 9, 16, 25, 36, 49]


filter toma una función que devuelve True o False y lo aplica a una secuencia, devolviendo  una lista de los  miembros de la secuencia para el cual la función devolvió True.

In [43]:
# Usando lambda(), map() y filter() 

cuadrados = map(lambda x: x**2, range(8))
cuadrados1 = filter(lambda x: x>3 and x < 40, cuadrados)
print(list(cuadrados1))

[4, 9, 16, 25, 36]


La función reduce() aplica una función a una lista de datos evaluando los elementos por pares. La primera vez se aplica al primer y segundo elemento, la siguiente, se aplicará al valor devuelto por la función junto al tercer elemento y así, sucesivamente, reduciendo la lista hasta que quede un sólo elemento.  

Mayor información en [Functional Programming HOWTO](https://docs.python.org/3/howto/functional.html).

In [45]:
import functools # modulo de python 3

functools.reduce(lambda x ,y: x + y, [3, 6,9])

18

In [46]:
# Otro ejemplo

cadenas1 = ['Python es un lenguaje de programacion, multiparadigma'\
            'Lisp, C, C++ son utilizados en muchos paquetes' \
            "Numpy, Scilab o Pandas son ejemplos de ellos"]
cont = 0
for cadena in cadenas1:
    cont += cadena.count('son')
print(cont)

2


Para revisar más ejemplos acerca del paradigma de la Programación Funcional en Python, revisar el [A Practical Introduction to Functional Programming](http://maryrosecook.com/blog/post/a-practical-introduction-to-functional-programming) de Mary Roose Cook.

## Listas por Comprensión

Las listas por comprensión se añadieron con Python 2.0. En esencia, es una forma  de implementar una notación muy conocida en la teoria de  conjuntos y se escriben en Python de la siguiente manera:

```python
    [expresion_con_variable_del_bucle for variable_del_bucle in secuencia]
```

Las listas por comprensión  es una manera elegante de definir y crear  listas en Python y son un sustituto  para la función lambda, así como para las funciones map(), filter() y reduce():

In [48]:
cuadrados = [x **2 for x in range(8)]
print(cuadrados)

[0, 1, 4, 9, 16, 25, 36, 49]


In [49]:
# Otro ejemplo

Celsius = [39.2, 36.5, 37.3, 37.8]
Fahrenheit = [((float(9)/5)*x + 32) for x in Celsius ]
print(Fahrenheit)

[102.56, 97.7, 99.14, 100.03999999999999]


Las lista por comprensión pueden ser anidadas y tienen la siguiente forma:

```python
    [expr_var_bucle for var_del_bucle_ext in secuencia_ext for var_del_bucle_int in secuencia_ext]
```

In [50]:
posible_paradigma = [ [OOP,FP] for OOP in ['Python', 'JavaScript', 'SmallTalk'] for FP in ['Lisp', 'Haskell', 'Scala'] ]
print (posible_paradigma)

[['Python', 'Lisp'], ['Python', 'Haskell'], ['Python', 'Scala'], ['JavaScript', 'Lisp'], ['JavaScript', 'Haskell'], ['JavaScript', 'Scala'], ['SmallTalk', 'Lisp'], ['SmallTalk', 'Haskell'], ['SmallTalk', 'Scala']]


In [51]:
# La lista por comprension se puede usar para crear la ternas Pitagóricas

[(x,y,z) for x in range(1,30) for y in range(x,30) for z in range(y,30) if x**2 + y**2 == z**2]

[(3, 4, 5),
 (5, 12, 13),
 (6, 8, 10),
 (7, 24, 25),
 (8, 15, 17),
 (9, 12, 15),
 (10, 24, 26),
 (12, 16, 20),
 (15, 20, 25),
 (20, 21, 29)]

## Módulos 

Un módulo es un archivo que contiene código Python. El nombre de un módulo es el nombre del archivo con la extensión .py.  
 
La variable `__name__` es una variable que almacena el nombre del módulo que se está haciendo referencia. El actual módulo, el módulo que está siendo ejecutado tiene un especial nombre: `__main__`. Con este nombre puede ser referenciado desde el código Python.  

Supongamos que tenemos dos archivos: mod1.py y mod2.py . El segundo módulo es el módulo principal, el cual es ejecutado. Este importa el primer módulo. Los módulos son importados usando la palabra clave import.

In [52]:
# Archivo mod1.py

""" Ejemplo de un modulo"""

print("hola: yo soy un módulo")

hola: yo soy un módulo


In [53]:
# Archivo mod2.py

import mod1
import sys

print (__name__)
print (mod1.__name__)
print(sys.__name__)



hola: yo soy un módulo
__main__
mod1
sys


Cuando se importa un módulo, el intérprete busca entre los módulos integrados  ese nombre. Si no lo encuentra, entonces busca en una lista de directorios dada por la  variable  sys.path. La variable sys.path  es una lista de cadenas que especifica la ruta de búsqueda para los módulos. Consiste del directorio de trabajo actual, los nombres de directorios especificados en la variable de entorno PYTHONPATH y algunos directorios adicionales  dependientes de la instalación . Si no se encuentra el módulo, se produce una excepción ImportError.

La palabra clave import, puede ser usada de varias maneras:

```python

import modulo

```

In [57]:
# Ejemplo

import re   # modulo de expresiones regulares

my_regex = r"[A-z]{1,2}[0-9R][0-9A-Z]? [0-9][ABD-HJLNP-UW-Z]{2}"
add = "BBC News Centre, London, W12 7RJ"
compile_re = re.compile(my_regex)
res = compile_re.search(add)
print(res)
        

<_sre.SRE_Match object; span=(25, 32), match='W12 7RJ'>


Aquí re es el módulo conteniendo funciones y constantes que trabajan con expresiones regulares. Después de este tipo de ìmport  solo se puede acceder a esas funciones con el prefijo re.  Se puede usar un alias si es que por ejemplo tienes que escribir demasiado. Por ejemplo, en el uso de matplotlib y visualización de datos, una convención estándar es:

```python
 import matplotlib.pyplot as plt
```   

Si tu necesitas especificar algunos valores de un módulo, puedes importarlos explícitamente y usarlos sin restricción:

``` python
  from module import f1, f2...
```

In [59]:
from collections import defaultdict, Counter
l = defaultdict(int)

contador = Counter()

contador

Counter()

Una manera poco recomendable sería importar todo el contenido de un módulo en tu espacio de nombres:

```python
from modulo import*
```

El uso de esta forma  de importación puede resultar en problemas en en el espacio de nombres. Podemos tener varios objetos del mismo nombre y sus definiciones pueden ser anuladas:

In [60]:
match = 10
from re import *
print(match)

<function match at 0x7fd505330ea0>


Una excepción ImportError es producido si un módulo no puede ser importado. Los módulos pueden ser importados en otros módulos o ellos pueden ser ejecutados. Si el módulo es ejecutado como un script, el atributo `__name__` es igual a `__main__`.

In [61]:
# Modulo conteniendo a la funcion de fibonacci

"""
Modulo que contiene una funcion que genera la 
secuencia de Fibonacci
"""

def fib(n):
    x ,y = 0, 1
    while y < n:
        print(y)
        (x , y ) = (y, x + y)

#Prueba
if __name__ == '__main__':
    fib(20)

1
1
2
3
5
8
13


Si el módulo fibo es importado, la `prueba`, no es ejecutada automáticamente:

In [62]:
import fibo as fib
fib.fib(20)

1
1
2
3
5
8
13


La función dir() da una lista ordenada de cadenas que contienen los nombres definidos por un módulo. En el siguiente módulo, importamos dos sistemas de módulos. Nosotros definimos una variable, una lista y una función:

In [64]:
# Uso de la funcion dir() en el espacio de nombres del modulo

"""
Este es un modulo de ejemplo para el uso de 
la funcion dir()
"""

import math, sys

x = math.sin(20)
lenguajes = ["Python", "R", "Java", "C", "Make"]

def mostrar_lenguajes():
    for i in lenguajes:
        print(i)
        
print(dir(sys.modules['__main__']))


['A', 'ASCII', 'Animalito', 'Celsius', 'Counter', 'DOTALL', 'Fahrenheit', 'I', 'IGNORECASE', 'In', 'L', 'LOCALE', 'M', 'MULTILINE', 'N', 'Out', 'Perrito', 'S', 'U', 'UNICODE', 'VERBOSE', 'X', '_', '_16', '_17', '_29', '_37', '_38', '_39', '_45', '_51', '_59', '_8', '__', '___', '__builtin__', '__builtins__', '__doc__', '__loader__', '__name__', '__package__', '__spec__', '_dh', '_i', '_i1', '_i10', '_i11', '_i12', '_i13', '_i14', '_i15', '_i16', '_i17', '_i18', '_i19', '_i2', '_i20', '_i21', '_i22', '_i23', '_i24', '_i25', '_i26', '_i27', '_i28', '_i29', '_i3', '_i30', '_i31', '_i32', '_i33', '_i34', '_i35', '_i36', '_i37', '_i38', '_i39', '_i4', '_i40', '_i41', '_i42', '_i43', '_i44', '_i45', '_i46', '_i47', '_i48', '_i49', '_i5', '_i50', '_i51', '_i52', '_i53', '_i54', '_i55', '_i56', '_i57', '_i58', '_i59', '_i6', '_i60', '_i61', '_i62', '_i63', '_i64', '_i7', '_i8', '_i9', '_ih', '_ii', '_iii', '_oh', '_sh', 'a', 'add', 'b', 'cadena', 'cadenas1', 'compile', 'compile_re', 'cont', 'c

La función dir() retorna todos los nombres disponibles en el actual espacio de nombres. `__main__` es el nombre del actual módulo. Partiendo de la idea de que  los módulos como todo lo demás es un objeto, una vez importados, siempre se pude obtener una referencia a un módulo mediante el diccionario global sys.modules.

La función globals() retorna un diccionario que representa el actual espacio de nombres global. Este es un diccionario de nombres (globales) y  sus valores. Este es el diccionario del actual módulo y se usa para imprimir todos los nombres globales del actual módulo.

In [65]:
# uso de la funcion globals() en el uso de modulos

import math
import textwrap

z = math.sqrt(5)

def f1():
    pass

gl = globals()
gb = ','.join(gl)
print(textwrap.fill(gb))

b,compile,_i5,mx,z,gl,__name__,fib,posible_paradigma,re,sign,_i62,sm,h
1,_i27,my_regex,gmtime,_i56,sqrt,U,_i20,ln,_i45,_ih,___,_i65,perrito,_
59,_i12,_dh,estadistica,__builtin__,_39,cuadrado,purge,split,_i36,this
,contador,res,_i61,f2,search,cuadratica,Fahrenheit,_i31,X,quit,DOTALL,
muestra,doble,_i43,g,_i17,VERBOSE,_i11,Counter,cadenas1,term,_,L,A,i,_
i28,sys,_i41,mensaje,mod1,_i63,_i16,_i2,_i60,_i64,_i22,__package__,_i4
6,cuadrados1,fruta,fullmatch,mostrar_lenguajes,_i18,_i39,_i33,functool
s,hfun1,_i42,cont,_i44,_51,_i25,__doc__,_i55,_i35,defaultdict,_45,_i54
,strftime,mn,escape,_i30,math,msg1,_37,ASCII,lenguajes,_i59,_i10,_oh,_
i26,_i15,j,_i47,_i38,S,I,gfun1,UNICODE,paridad,__spec__,_i58,_i49,_8,_
sh,Out,N,Perrito,_i40,_i14,_38,_29,_16,frutas,_i32,a,f,_i57,_i24,_iii,
_i6,_i9,_17,_i1,__,_i4,g1,textwrap,x,get_ipython,_i34,l,cuadrados,_i51
,fun1,_i,k,add,__loader__,Celsius,cadena,exit,__builtins__,subn,In,err
or,_i48,_i23,_i3,findall,_i19,_i13,M,s,template,IGNORECASE,n,_i53,_i37
,LOCAL

El atributo de clase `__module__` tiene el nombre del módulo en el cual la clase es definida. Sea el módulo, llamado mod3.py

In [66]:
"""
modulo ejemplo
"""
class m1:
    pass 

class m2:
    pass

Escribamos ahora un segundo módulo, usando el atributo `__module__`:

In [68]:
# uso del atributo __mod__ en los modulos de Python

from mod3 import m1

class l1:
    pass

b = l1()    # Una instancia de clase es creada

print (b.__module__) # Imprimimos el nombre de modulo

c = m1()    #  creamos un objeto desde la clase m1
print (c.__module__) # Imprimimos el nombre del modulo donde fue definido

__main__
mod3


## Excepciones 

Cualquier error que se produce durante la ejecución del código es una excepción. Cada excepción generalmente  muestra algún mensaje de error. Usamos el bloque try...except para manejar excepciones. La sintaxis básica es la siguiente:

```python
try:
   declaracion1
   declaracion2
   ...
except Nombre_Excepcion:
   declaracion a ser evaluada en caso de que
   aparezca alguna excepcion.
```

Veamos algunos ejemplos:

In [69]:
print('c++' + 1) # TypeError

TypeError: Can't convert 'int' object to str implicitly

In [70]:
print(w) # NameError

NameError: name 'w' is not defined

In [72]:
while True:
    try:
        n = input("Ingresa un numero: ")
        n = int(n)
        break
    except  ValueError:
        print("No es un numero entero, vuelve a intentarlo...")
print ("Bien, es un numero entero")

Ingresa un numero: 2.3
No es un numero entero, vuelve a intentarlo...
Ingresa un numero: 3
Bien, es un numero entero


Una sentencia try  puede tener más de una cláusula  except para diferentes excepciones. Sin embargo, a lo sumo una cláusula except será ejecutada. veamos un ejemplo de la [documentacion de Python a Excepciones](https://docs.python.org/3/tutorial/errors.html):

In [73]:
import sys 

try:
    f = open('Hadoop.txt')
    s = f.readline()
    i = int(s.strip())

except OSError as err:
    print("OS error: {0}".format(err))
    
except ValueError:
    print("No se puedo convertir los datos a entero")
    
except:
    print("Error inesperado:", sys.exc_info()[0])
    raise 
          

No se puedo convertir los datos a entero


Se puede lanzar una excepción usando raise, como muestra en el siguiente ejemplo:

In [74]:
raise ValueError("Un error de valor a ocurrido.")

ValueError: Un error de valor a ocurrido.

Podemos manejar  estas excepciones como cualquier otras excepciones:

In [75]:
try:
    raise ValueError("Un valor a ocurrido.")
except ValueError:
    print("ValueError en nuestro codigo.")

ValueError en nuestro codigo.


La sentencia try puede ser seguido por una cláusula finally. A la cláusula finally  se lo conoce como *cláusulas de limpieza*, y debe ser ejecutada en cualquier circunstancia, es decir, la cláusula se ejecuta siempre, independientemente si se ha producido una excepción en un bloque try o no.

In [76]:
try:
    x = float(input("Ingresa un numero: "))
    inverse = 1.0 / x

except ValueError:
    print("Deberías haber dado  un int o un float")

except ZeroDivisionError:
    print("Infinito")
finally:
    print("Hay o no hay una excepcion")

Ingresa un numero: 5
Hay o no hay una excepcion


La sentencia try...except tiene una cláusula else  opcional. Un bloque más tiene que ser colocado después de todas las cláusulas except. Una cláusula else se ejecutará si la cláusula try no lanza  una excepción:

In [79]:
def division(x, y):
    try:
        resultado = x/y
    except ZeroDivisionError:
        print("division por cero")
    else:
        print("el resultado es ", resultado)
    finally :
        print ("ejecutando la clausula finally")
        
division("uno", "dos")

ejecutando la clausula finally


TypeError: unsupported operand type(s) for /: 'str' and 'str'

In [80]:
division(2,0)

division por cero
ejecutando la clausula finally


## Listas

Una de las estructuras fundamentales de Python, es sin lugar a dudas el de lista (list). Una lista es ordenación de objetos. Esto es similar a lo que en otros lenguaje pero con algo más de funcionalidad.

In [81]:
lista_entero = [2, 5,6]
lista_heterogenea = ['Python', 0.3, True]
lista_de_lista = [lista_entero, lista_heterogenea]

lista_longitud = len(lista_entero)
lista_suma     = sum(lista_entero)

lista_longitud
lista_suma


13

In [82]:
# Podemos conseguir el conjunto de elementos de una lista con corchetes

x = list(range(10))
zero = x[0]
one  = x[1]
nine  = x[-1]
eight = x[-2]
zero, one, nine, eight




(0, 1, 9, 8)

In [83]:
# Podemos modificar los valores de la lista

x = list(range(10))
x[0] = -1
x

[-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [84]:
# Podemos ingresar corchetes para dividir una lista

primeros_tres = x[:3]
tres_ultimos  = x[3:]
uno_al_cuatro = x[1:5]
res = x[-3:]
sin_el_primero_ultimo = x[1:-1]
copia_de_x = x[:]
primeros_tres

[-1, 1, 2]

In [85]:
tres_ultimos


[3, 4, 5, 6, 7, 8, 9]

In [86]:
sin_el_primero_ultimo

[1, 2, 3, 4, 5, 6, 7, 8]

Python tiene un operador **in** para verificar si un elemento pertenece a una lista. Esto implica que examina los elementos de la lista uno a la vez, de manera que es adecuado  usarlo  si es que la lista es muy pequeña.

In [87]:
'erika' in ["Erika", "erika", "ErIka"]

False

In [90]:
# Es facil, concatenar listas, usando la funcion extend

y = ["Python", 3,  "C++", 1.2, ["JavaScript", "R"]]
y.extend([3,5,7])
y

['Python', 3, 'C++', 1.2, ['JavaScript', 'R'], 3, 5, 7]

In [91]:
# Es frecuente también agregar un elemento a la vez, usando la función append

z = [1, 3, 5, 7]
z.append(9)
z

[1, 3, 5, 7, 9]

Es conveniente desempaquetar listas si se conoce cuantos elementos ellas contienen, ya que de lo que contrario se puede encontrar un ValueError, sino tenemos el mismo número de elementos en ambos lados.  Es común usar un guión abajo, para un valor que estas lanzando

In [93]:
x, y = [1 , 2]
_,y = [1, 2]
y

2

## Tuplas 

Las tuplas son primas *inmutables* de las  listas. Casi todo lo que se puede hacer a una lista que no implica la modificación, se puede hacer para una tupla. Puede especificar una tupla utilizando paréntesis (o nada) en lugar de corchetes:

In [98]:
a = 'Python', 'R', 'C++', 'Bash'
a

('Python', 'R', 'C++', 'Bash')

In [95]:
for x in a :
    print(x, end= ' ')

Python R C++ Bash 

La tuplas no se pueden modificar, es decir no se puede eliminar, agregar o editar algún valor dentro de la tupla.

In [99]:
lista1 = [1 ,3]
tupla1 = (1,3)
tupla2 = 4, 5
lista1[1] = 8  # lista1  es ahora [1,8]
try:
    tupla1[1] = 8

except TypeError:
    print ("No se puede modificar la tupla")

No se puede modificar la tupla


Se pueden desempaquetar valores de alguna tupla en variables:

In [100]:
divmod(23, 4)
x ,y = divmod(23,8) # (2,7)
x

2

In [101]:
y

7

Las tuplas son una manera conveniente de retornar múltiples valores de las funciones

In [103]:
def sum_and_product(x, y):
    return (x + y),(x * y)

sp = sum_and_product(2, 3) # igual a  (5, 6)
s, p = sum_and_product(5, 10)
s


15

In [104]:
p

50

## Cadenas 

En Python, una cadena es una secuencia  de caracteres y son inmutables, es decir, una vez que son definidas no se pueden modificar.


In [105]:
a = "python, scala, R, C"
b = 'Machine Learning'
c = """ El
 mago de 
 OZ
 """
print(a)
print(b)
print(c)

python, scala, R, C
Machine Learning
 El
 mago de 
 OZ
 


In [106]:
# Podemos realizar algunas operaciones con cadenas

lenguajes = ["Python", "C",  "C++", "Java", "Perl"]
len(lenguajes)
print(lenguajes[0], lenguajes[2]) # Python, C++
print(lenguajes[0] + " y " + lenguajes[4] + " son muy diferentes")

Python C++
Python y Perl son muy diferentes


In [107]:
# Slicing 

str1 = "Python es un poderoso lenguaje de Programacion, Java es un lenguaje de programacion comercial"
s_str=str1[0:46]   # Python es un poderoso lenguaje de Programacion
s1_str = str1[48:] # Java es un lenguaje de programacion comercial
s1_str
copia_str = str1[:]
copia_str

'Python es un poderoso lenguaje de Programacion, Java es un lenguaje de programacion comercial'

También el 'slicing' trabaja con tres argumentos:

```python
    s[inicio : final: paso]
```

El resultado es una secuencia consistente de los siguientes elementos:

```python
    s[inicio], s[inicio + 1 * paso], ... s[inicio + i * paso], donde  (inicio + i * paso) < final
```

In [108]:
str2 = 'Python en Linux, usando Jupyter es genial'
str2[::3]

'Ph  n,sdJyrsea'

Cuando usamos cadenas, podemos utilizar *secuencias de escape*. Las *secuencia de escape* son caracteres especiales, para própositos específicos, cuando es usada dentro de una cadena. Por ejemplo la secuencia de escape `\\t` coloca espacio de blanco entre texto:

Si  anteponemos un `r` a  la cadena, se obtiene una cadena de texto (raw string). Las secuencias de escape no se interpretan.

In [115]:
print (r"Another world\\t")

Another world\\t


Los métodos find(), index() y rindex() son usados para encontrar subcadenas en una cadena.

In [117]:
a = "Yo aprendi Python!. Si Python"
print (a.find("Python ")) # Encuentra el indice de la subcadena en la cadena
print (a.find("Python", 10, 20))
print (a.find("Python", 15))

print (a.rfind("Python")) # Lo mismo que find(), solo le que empieza desde el final de la cadena

-1
11
23
23


In [118]:
# Usemos el método ìndex() en el siguiente ejemplo

a1 = "Yo aprendi Java!. Si Java y Python"
print (a1.index("Java"))
print (a1.rindex("Java"))
                 
try:
    print (a1.rindex('Perl'))
except ValueError:
    print ('No se encuentra en  la cadena')

11
21
No se encuentra en  la cadena


El método replace()  reemplaza subcadenas en una cadena con otras. Por defecto, se reemplaza todas las ocurrencias de una subcadena. El método tiene un tercer argumento que limita los reemplazos a un determinado número.


In [119]:
a2 = "Yo aprendi Java!. Si Java y Python"
a3 = a2.replace("Java", "Lisp")
print(a3)
a4 = a2.replace("Java", "C++", 1)
print(a4)

Yo aprendi Lisp!. Si Lisp y Python
Yo aprendi C++!. Si Java y Python


Una cadena se puede dividir con los métodos split() o rsplit() Estos devuelven  una lista de cadenas que 'fueron cortadas' de la cadena mediante un separador. Hay un segundo parámetro opcional que es el máximo de divisiones permitidos.

In [121]:
nums = "1,3,5,7,9,11,13,15"
k = nums.split( " " )
print(k)

['1,3,5,7,9,11,13,15']


In [127]:
letra = "abcdefghijklmnopqrstuvwxyz,1"
letra.split(",", 1)
letra.rsplit(",", 1)


['abcdefghijklmnopqrstuvwxyz', '1']

In [131]:
from timeit import timeit
timeit('"abcdefghijklmnopqrstuvwxyz,1".split(",", 1)')

0.5094608889994561

In [134]:
from timeit import timeit
timeit('"abcdefghijklmnopqrstuvwxyz,1".rsplit(",", 1)')

0.49028100600116886

Las cadenas pueden ser unidas con el método join(). Devuelve una cadena concatenada de las cadenas pasadas como parámetro. El separador entre los elementos es la cadena que proporciona este método:

In [136]:
s = "- "
seq = ("a", "b", "c") # Esta es una secuencia de cadenas
print (s.join( seq ))


a- b- c



Python tiene cuatro métodos  que  devuelven una nueva cadena modificada. Veamos un ejemplo:

In [150]:
s = "MachineLearning"
print (s.upper())   # copia de s con letras mayusculas"
print (s.lower())   # copia de s con letras minusculas 
print (s.swapcase()) # Intercambio de letras mayuscula a minuscula y viceversa
print (s.title())

MACHINELEARNING
machinelearning
mACHINElEARNING
Machinelearning


Hay varias funciones incorporadas útiles en Python que se pueden utilizar para trabajar con cadenas

In [152]:
# Uso de funciones incorporadas a  Python para el uso de cadenas

str1 = "Hay muchos lenguajes de Programacion raros: Ook, Piet, Befunge"

letras = 0
digitos= 0
espacios=0

for i in str1:
    if i.isalpha():
        letras += 1
    if i.isdigit():
        digitos += 1
    if i.isspace():
        espacios += 1
        
print ("Hay", len(str1),"caracteres")
print ("Hay", letras, "caracteres alfabeticos")
print  ("Hay", digitos, "digitos en la cadena")
print ("Hay", espacios, "espacios en la cadena")

Hay 62 caracteres
Hay 51 caracteres alfabeticos
Hay 0 digitos en la cadena
Hay 8 espacios en la cadena


Para el formato de cadenas, usamos el método format  agregado en la versión 2.6 de Python. La forma general de este método luce como

 ```python
  str.format(p0,p1,..., k0 = v0, k1 = v1,...)
```

In [156]:
'First argument: {0}, second one: {1}'.format(47,11)

'First argument: 47, second one: 11'

En el siguiente ejemplo se demuestra cómo los parámetros se puede utilizar con el método  format. Mayor información en [stackoverflow: % vs .format](http://stackoverflow.com/questions/5082452/python-string-formatting-vs-format).

In [158]:
"Regalo: {a:5d},  Precio: {p:8.2f}".format(a=453, p=59.058)

'Regalo:   453,  Precio:    59.06'

## Diccionarios 

Una estructura fundamental de Python, es el diccionario, el cual está asociado con *valores* y *claves* y permite recuperar el valor correspondiente a la clave.

In [159]:
diccionario_vacio ={}
diccionario_vacio1 = dict()
Mili_notas = {'Cesar': 85, "Milagros": 89} # diccionario literal
Mili_notas 

{'Cesar': 85, 'Milagros': 89}

Conseguimos un KeyError si solicitas por una clave que no está en el diccionario

In [161]:
try:
    Checha_notas = Mili_notas["checha"]
except KeyError:
    print ("No existen notas para checha!")

No existen notas para checha!


In [164]:
# Verificamos la existencia de una clave usando: in

mili= 'Milagros' in Mili_notas
checha = 'checha' in Mili_notas

mili

True

Los diccionarios tienen un método get  que retorna un valor por defecto (en lugar de mostrar una excepción, cuando miras  que la clave no está en el diccionario:

In [165]:
mili = Mili_notas.get("Milagro", 0)
checha = Mili_notas.get("checha", 0) # igual a 0
no_hay_notas = Mili_notas.get("Ninguna")   # el valor por defecto es None

In [169]:
checha

0

In [170]:
no_hay_notas

In [172]:
# Podemos asignar clave-valor  usando los mismos corchetes

Mili_notas['Gabriela'] = 88
Mili_notas['Cesar'] = 91
num_estudiantes = len(Mili_notas)
Mili_notas

{'Cesar': 91, 'Gabriela': 88, 'Milagros': 89}

Los diccionarios se usan como una manera simple de representar datos estructurados:

In [174]:
tweet = { "usuario" : "C-Lara",
        "texto" : "M-L",
    "respuestas": 100,
    "hashtag" : ["#data", "#science", "#datascience", "#python", "#R"]
    }
tweet

{'hashtag': ['#data', '#science', '#datascience', '#python', '#R'],
 'respuestas': 100,
 'texto': 'M-L',
 'usuario': 'C-Lara'}

Además de buscar las claves específicas, podemos realizar todas las operaciones anteriores:

In [176]:
tweet_claves  = tweet.keys() # lista todas las claves
tweet_valores = tweet.values() # lista todos los valores
tweet_items   = tweet.items()   # lista de (clave, valor) en tuplas
'usuario' in tweet_claves
'usuario' in  tweet
'C-Lara'  in tweet_valores

True

In [178]:
tweet_valores

dict_values(['C-Lara', 100, ['#data', '#science', '#datascience', '#python', '#R'], 'M-L'])

Las claves de los diccionarios deben ser inmutables; en particular, no puede utilizar una lista como claves. Si
es necesaria una clave se  debe usar una tupla o encontrar una manera de poner la clave en una cadena.

El módulo **json** proporciona una API para convertir objetos de Python en memoria a una representación serializada conocido como JavaScript Object Notation (JSON). JSON tiene la ventaja de contar con implementaciones en muchos lenguajes (especialmente en JavaScript),  que es adecuado para la comunicación entre aplicaciones. Por ejemplo:

In [179]:
import json

data = {'nombre' : 'Python',
      'descarga' : 100,
      'precio' : 542.23,
    }

json_str = json.dumps(data)
json_str   # Codificamos una estructura python en JSON"

'{"descarga": 100, "precio": 542.23, "nombre": "Python"}'

In [180]:
# Realizamos el proceso inverso

data = json.loads(json_str)
type(data)

dict

EL formato JSON, es casi idéntico a la sintaxis de Python, salvo, algunas diferencias. Por ejemplo True es llevado a true, False es llevado a false y None es llevado a null:

In [181]:
json.dumps(False)

'false'

In [182]:
d = {'a' : True,
    'b': 'Hello',
    'c' : None}
json.dumps(d)

'{"a": true, "c": null, "b": "Hello"}'

Basados en el [artículo de John Strickler](https://www.accelebrate.com/blog/using-defaultdict-python/), el tipo defaultdict, es como un diccionario regular, pero es inicializado con una función que no toma argumentos y proporciona el valor por defecto de una clave no existente.  Con el fin de utilizar  defaultdict, tenemos  que importarlos desde collections.

In [183]:
import collections
from collections import defaultdict

lenguajes = defaultdict(lambda:'python')
lenguajes["Cesar"] = "R"
lenguajes["Lia"] = "Latex"
print(lenguajes["Lia"])
print(lenguajes["Claudi"])

Latex
python


En este ejemplo, default es usado para contar. La función por defecto es int , la cual a su vez tiene un valor por defecto igual a 0

In [1]:
from collections import defaultdict

lenguaje_lista = 'R Python Haskell C Latex'.split()
lenguaje_contador = defaultdict(int)  # El valor por defecto de int es 0

for lenguaje in lenguaje_lista :
    lenguaje_contador[lenguaje] += 1
    
lenguaje_contador

defaultdict(int, {'C': 1, 'Haskell': 1, 'Latex': 1, 'Python': 1, 'R': 1})

defaultdict puede ser útil con list, dict o incluso con funciones:

In [2]:
lista1_ = defaultdict(list)  # Lista vacia
lista1_["Java"].append(1)
lista1_

defaultdict(list, {'Java': [1]})

In [3]:
# Otro ejemplo

dict1_ = defaultdict(dict)   #diccionario vacio
dict1_["Cesar"]["Ciudad"] = "Lima"

dict1_

defaultdict(dict, {'Cesar': {'Ciudad': 'Lima'}})

In [4]:
# Para el caso de funciones

fun1_ = defaultdict(lambda: [0, 0])
fun1_[2][1] = 1
fun1_

defaultdict(<function __main__.<lambda>>, {2: [0, 1]})

Counter es un contenedor que mantiene un registro de cuántas veces se añaden valores equivalentes. Counter es compatible con tres formas de inicialización. Este constructor puede ser llamado con una secuencia de elementos, un diccionario conteniendo  claves y  conteos o usando nombres como argumentos para los conteos:

In [6]:
import collections

print (collections.Counter(['a', 'b', 'c', 'a', 'b', 'b']))
print (collections.Counter({'a':2, 'b':3, 'c':1}))
print (collections.Counter(a=2, b=3, c=1))

Counter({'b': 3, 'a': 2, 'c': 1})
Counter({'b': 3, 'a': 2, 'c': 1})
Counter({'b': 3, 'a': 2, 'c': 1})


Podemos recuperar los valores desde Counter, de la siguiente forma :

In [7]:
import collections

d = collections.Counter('abbeeddaabbbccc')
for letra in 'abcdef':
    print ('%s: %d' %(letra, d[letra]))
    

a: 3
b: 5
c: 3
d: 2
e: 2
f: 0


Counter no lanza  la excepción KeyError para los elementos desconocidos. Si un valor no se  encuentra (como la f en este ejemplo), el conteo es 0. Mayor información en el artículo de Doug Hellmann [PyMOTW-3](https://pymotw.com/2/collections/counter.html).

El método most_common() produce una secuencia de los *n*  valores de entrada que más se 'encuentran' y sus respectivos números de coincidencia.

In [8]:
import collections

c = collections.Counter()
with open('Svm.txt', 'rt') as f:
    for linea in f:
        c.update(linea.rstrip().lower())
        
print("Mas comunes")
for letra, contador in  c.most_common(5):
    print('%s: %7d' % (letra, contador))
    

Mas comunes
 :     223
e:     164
a:     151
s:     118
o:     113


[enumerate](https://docs.python.org/3/library/enum.html) es una función integrada de Python. Su utilidad no se puede resumir en una sóla línea.  Sin embargo, la mayoría de los recién llegados e incluso algunos programadores avanzados no son conscientes de ello. Con esta función se  nos permite iterar sobre algo y tener un contador automático.

```python 
for i, valor in enumerate(lista):
    print(i, valor)
```



In [9]:
mis_lenguajes= ['R', 'Python', "C++", "JavaScript"]
for i, lenguajes in enumerate(mis_lenguajes, 1):
    print(i, lenguajes)
    

1 R
2 Python
3 C++
4 JavaScript


Muchas veces vamos a necesitar  comprimir dos o más listas juntas. La [función zip](https://docs.python.org/3.3/library/functions.html#zip) transforma varias listas en una única lista de tuplas de elementos correspondientes:

In [10]:
lista1= ['Erika', 'Delia', 'Milagros']
lista2 = [1, 2, 3]
lista = zip(lista1, lista2)
list(lista)

[('Erika', 1), ('Delia', 2), ('Milagros', 3)]

Si las listas tienen diferentes longitud, zip se detiene tan pronto como la primera lista finaliza. Tu puedes 'descomprimir' una lista, usando un 'truco'

In [12]:
chicas = [('Erika', 1), ('Delia', 2), ('Milagros', 3)]
lista1, lista2 = zip(*chicas)
lista1

('Erika', 'Delia', 'Milagros')

In [13]:
lista2

(1, 2, 3)

## Conjuntos

Otra estructura de datos es `set`, que representa una colección de distintos elementos:

In [14]:
s = set()
s.add(1)  # s es ahora { 1 }   
s.add(2)  # s es ahora { 1, 2 }
s.add(2)  # s es aun  { 1, 2 }
x = len(s) # igual a 2
y = 2 in s # igual a  True
z = 3 in s # igual a  False
x, y, z

(2, True, False)

Vamos a utilizar conjuntos por dos razones principales. La primera es que in es una operación es muy rápida con los conjuntos. Si tenemos una gran colección de objetos que queremos utilizar para una prueba de pertenencia, los conjuntos son más apropiados  que las listas:

In [15]:
alguna_lista = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicados = set([x for x in alguna_lista if alguna_lista.count(x) > 1])
print(duplicados)

{'b', 'n'}


La segunda razón  es para encontrar distintos ítems en una colección:

In [16]:
item_lista = [1, 2, 3, 1, 2, 3, 4, 5, 5,]
num_items = len(item_lista)
item_set = set(item_lista)
num_distintos_items = len(item_set)
distintos_item_lista = list(item_set)

num_items, item_set, num_distintos_items, distintos_item_lista


(9, {1, 2, 3, 4, 5}, 5, [1, 2, 3, 4, 5])

## Aleatoriedad 

En análisis de datos, es frecuente generar números aleatorios, el cual puede hacerse con el módulo [random](https://docs.python.org/3.0/library/random.html):

In [17]:
import random 

cuatro_elementos_aleatorios = [random.random() for _ in range(4)]
cuatro_elementos_aleatorios

[0.3534234522330121, 0.6905045774325141, 0.61963476214888, 0.9919302336166624]

El módulo random, produce [números pseudoaleatorios](https://es.wikipedia.org/wiki/N%C3%BAmero_pseudoaleatorio). Las funciones a las que hacemos referencia, cada vez que son invocadas, devuelven un valor de una secuencia de números predeterminada. Esta secuencia tiene un periodo bastante largo, es decir, es necesario obtener muchos números antes de que se vuelva a reproducir la misma secuencia. De ahí, el tratamiento de pseudo (o falso), aunque la utilidad que nos ofrezca sea equivalente al de los números aleatorios. Cuando nos interese obtener varias veces la misma secuencia de números pseudoaleatoria se puede utilizar la función  [random.seed](http://stackoverflow.com/questions/22639587/random-seed-what-does-it-do)  que fija mediante una *semilla* el mismo comienzo en cada secuencia, permitiendo con ello obtener series con los mismos valores:

In [18]:
random.seed(4)
print (random.random())
random.seed(4)
print (random.random())
random.seed(4)
print (random.random())
random.seed(4)
print (random.random())

0.23604808973743452
0.23604808973743452
0.23604808973743452
0.23604808973743452


Algunas veces usamos la función random.randrange que devuelve enteros que van desde un valor inicial a otro final separados entre sí un número de valores determinados. Esta separación (o paso) se utiliza en primer lugar con el valor inicial para calcular el siguiente valor y los sucesivos hasta llegar al valor final o al más cercano posible.

In [19]:
random.randrange(3, 6) # Escoge aleatoriamente desde el rango[3,4,5]

3

Hay otros métodos que también pueden ser convenientes. random.shuffle, mezcla o cambia aleatoriamente el orden de los elementos de una lista antes de realizar la selección de alguno de ellos.

In [20]:
hasta_diez = list(range(10))
random.shuffle(hasta_diez)
print (hasta_diez)

[4, 1, 8, 3, 5, 9, 0, 2, 7, 6]


Si necesitamos aleatoriamente escoger un elemento de una lista, podemos usar la función random.choice()

In [21]:
mis_lenguajes_favoritos = random.choice(['Python', 'R', 'JavaScript', 'SQL', "C"])
mis_lenguajes_favoritos

'Python'

Para escoger de manera aleatoria una muestra de elementos sin reemplazamiento ( sin duplicados), podemos usar la función random.sample():

In [22]:
numeros_loteria = list(range(60))
numeros_ganadores = random.sample(numeros_loteria, 6)
numeros_ganadores

[14, 33, 34, 23, 17, 49]

Para escoger una muestra de elementos con reemplazo (se permite duplicados), se hace llamadas múltiples a random.choice():

In [23]:
cuatro_con_reemplazamiento = [random.choice(list(range(10)) ) for _ in range(4)]
cuatro_con_reemplazamiento

[2, 1, 4, 3]

## Expresiones regulares

Las [expresiones regulares](https://docs.python.org/3/library/re.html) proporcionan una manera de buscar patrones en los textos. Estas son increiblemente útiles, pero bastante complicadas, de forma que hay libros enteros escritos acerca de ellos. Mostremos algunos ejemplos acerca de sus aplicaciones.  


El método re.search() toma un patrón sobre  expresión regular y una cadena y busca ese patrón dentro de la cadena. Si la búsqueda es exitosa, search() devuelve un objeto que cumple con ese patrón o None en caso contrario. Por lo tanto, la búsqueda es generalmente seguida  por una sentencia if para comprobar si la búsqueda tuvo éxito.

In [24]:
import re

str = 'un ejemplo de  palabra:cat!!'
match = re.search(r'palabra:\\w\\w\\w', str)
if match:
    print ('Encontramos la ', match.group() )
else:
    print ('palabra no encontrada ')

palabra no encontrada 


El módulo re incluye funciones  para trabajar con expresiones regulares como cadena de textos, pero es usualmente más eficiente *compilar* las expresiones que tu programa usa frecuentemente. La función compile() convierte una cadena en un RegexObject.

In [25]:
import re

# Precompilamos el patron del texto

regexes = [re.compile(p) for p in ['sc','py']]

texto = "Scala y python son lenguajes de programacion?"
for regex in regexes:
    print(' Buscando por %s en %s ->' %(regex.pattern, texto),)
    if regex.search(texto):
        print ('Encontramos un emparejamiento')
    else:
        print ('No hay emparejamientos')

 Buscando por sc en Scala y python son lenguajes de programacion? ->
No hay emparejamientos
 Buscando por py en Scala y python son lenguajes de programacion? ->
Encontramos un emparejamiento
