# Curso de Python Básico

## El Zen de Python

In [10]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Formato de los espacios en blanco
En [Python](https://www.python.org/)  se usa la **indentación**, a diferencia de otros lenguajes de programación, que usan llaves para delimitar bloques de código:




In [11]:
# Clases y herencia en Python

class Animalito():
    def __init__(self, nombre):
        self.nombre = nombre
    
    def decir_algo(self):
        print ("Yo soy" + self.nombre)

class Perrito(Animalito):
    def decir_algo(self):
        print ("Yo soy " +  self.nombre + ", y puedo ser tu amigo")

perrito = Perrito("Kapu")
perrito.decir_algo()

Yo soy Kapu, y puedo ser tu amigo


## Módulos

Un módulo es un archivo que contiene código Python. El nombre de un módulo es el nombre del archivo con la extensión `.py`.
La variable `__name__` es una variable que almacena el nombre del módulo que se está haciendo referencia. El actual módulo, el módulo que está siendo ejecutado tiene un especial nombre: `__main__`. Con este nombre puede ser referenciado desde el código Python.

Supongamos que tenemos dos archivos: `mod1.py` y `mod2.py`. El segundo módulo es el módulo principal, el cual es ejecutado. Este importa el primer módulo. Los módulos son importados usando la palabra clave `import`.

In [12]:
# Archivo mod1.py

"""
Ejemplo de un módulo
"""
print("hola: yo soy un módulo")

hola: yo soy un módulo


In [13]:
# Archivo mod2.py

import mod1
import sys

print (__name__)
print (mod1.__name__)
print(sys.__name__)

hola: yo soy un módulo
__main__
mod1
sys


Cuando se importa un módulo el itérprete busca entre los módulos integrados  ese nombre. Si no lo encuentra, entonces busca en una lista de directorios dada por la  variable `sys.path`. La variable `sys.path` es una lista de cadenas que especifica la ruta de búsqueda para los módulos. Consiste del directorio de trabajo actual, los nombres de directorios especificados en la variable de entorno `PYTHONPATH` y algunos directorios adicionales  dependientes de la instalación . Si no se encuentra el módulo, se produce una excepción `ImportError`.


La palabra clave `import ` puede ser usado de varias maneras:

```python
import modulo
````

In [14]:
import re
my_regex = re.compile("[0-9]+", re.I)
my_regex

re.compile(r'[0-9]+', re.IGNORECASE|re.UNICODE)

Aquí `re` es el módulo conteniendo funciones y constantes que trabajan con expresiones regulares. Después este tipo de `ìmport` solo se puede acceder a esas funciones con prefijo `re.`  Se puede usar un alias si es que por ejemplo tienes que escribir demasiado. Por ejemplo, en el uso de `matplotlib` y visualización de datos, una convención estándar es:

```python
import matplotlib.pyplot as plt
```

Si tu necesitas especificar algunos valores de un módulo, puedes importarlos explícitamente y usarlos sin restricción:

``` python
from module import f1, f2...
```


In [15]:
from collections import defaultdict, Counter
l = defaultdict(int)
contador = Counter()

Una manera poco recomendable sería importar todo el contenido de un módulo en tu espacio de nombres,

```python
from modulo import*
```

El uso de esta forma  de importación puede resultar en problemas en en el espacio de nombres. Podemos tener varios objetos del mismo nombre y sus definiciones pueden ser anuladas:


In [16]:
match = 10
from re import *
print (match)

<function match at 0x000000BFE776C598>


Una excepción `ImportError` es producido si un módulo no puede ser importado.


Los módulos pueden ser importados en otros módulos o ellos pueden ser ejecutados. Si el módulo es ejecutado como un script, el atributo `__name__` es igual a `__main__`.

In [17]:
# Modulo conteniendo la funcion de fibonacci

"""
Modulo que contiene una funcion que genera
la secuencia de Fibonacci
"""

def fib(n):
    x ,y =0, 1
    while y < n:
        print (y)
        (x , y) = (y, x +y)
        
# Prueba
        
if __name__ == '__main__':
    fib(500)

1
1
2
3
5
8
13
21
34
55
89
144
233
377


Si el módulo `fibo` es importado, la `prueba`, no es ejecutado automáticamante:


In [18]:
import fibo as fib
fib.fib(34)

1
1
2
3
5
8
13
21


La función `dir()` da una lista ordenada de cadenas que contienen los nombres definidos por un módulo. En el siguiente módulo, importamos dos sistemas de módulos. Nosotros definimos una variable, una lista y una función:

In [19]:
# Uso de la funcion dir() en el espacio de nombres
# del modulo

"""
Este es un modulo de ejemplo para el
uso de la funcion dir()
"""

import math, sys

x = math.sin(20)

lenguajes = ["Python", "R","Java", "C", "Make"]

def mostrar_lenguajes():
    for i in lenguajes:
        print (i)

print (dir(sys.modules['__main__']))



['A', 'ASCII', 'Animalito', 'Counter', 'DOTALL', 'I', 'IGNORECASE', 'In', 'L', 'LOCALE', 'M', 'MULTILINE', 'Out', 'Perrito', 'S', 'U', 'UNICODE', 'VERBOSE', 'X', '_', '_14', '__', '___', '__builtin__', '__builtins__', '__doc__', '__loader__', '__name__', '__package__', '__spec__', '_dh', '_i', '_i1', '_i10', '_i11', '_i12', '_i13', '_i14', '_i15', '_i16', '_i17', '_i18', '_i19', '_i2', '_i3', '_i4', '_i5', '_i6', '_i7', '_i8', '_i9', '_ih', '_ii', '_iii', '_oh', '_sh', 'b', 'c', 'compile', 'contador', 'defaultdict', 'error', 'escape', 'exit', 'f1', 'fib', 'findall', 'finditer', 'fullmatch', 'gb', 'get_ipython', 'gl', 'l', 'l1', 'lenguajes', 'm1', 'm2', 'match', 'math', 'mod1', 'mostrar_lenguajes', 'my_regex', 'perrito', 'purge', 'quit', 're', 'search', 'split', 'sub', 'subn', 'sys', 'template', 'textwrap', 'this', 'x', 'z']


La función `dir()` retorna todos los nombres disponibles en el actual espacio de nombres. `__main__` es el nombre del actual módulo. Partiendo de la idea de como los módulos como todo lo demás es un objeto, una vez importados, siempre se pude obtener una referencia a un módulo mediante el diccionario global `sys.modules`.

La función `globals()` retorna un diccionario que representa el actual espacio de nombres global. Este es un diccionario de nombres (globales) y  sus valores. Este es el diccionario del actual módulo y se usa para imprimir todos los nombres globales del actual módulo.

In [20]:
# uso de la funcion globals() en el uso de modulos

import  math
import textwrap

z = math.sqrt(5)

def f1():
    pass

gl = globals()
gb = ' ,'.join(gl)

print (textwrap.fill(gb))

_i ,_i18 ,error ,_i19 ,__name__ ,Counter ,_iii ,_i8 ,perrito ,_i4
,split ,c ,template ,_i12 ,_i7 ,_i10 ,l1 ,m2 ,_i13 ,_oh ,Perrito ,_14
,MULTILINE ,DOTALL ,IGNORECASE ,math ,UNICODE ,VERBOSE ,A ,_dh ,x
,search ,z ,sub ,gl ,_i5 ,M ,lenguajes ,_i1 ,get_ipython ,defaultdict
,_ ,_sh ,l ,re ,gb ,_i20 ,_i9 ,this ,_ih ,fib ,_i16 ,I ,_i6
,__builtin__ ,_ii ,compile ,__loader__ ,match ,_i14 ,ASCII ,quit ,sys
,_i3 ,_i15 ,L ,__spec__ ,S ,f1 ,U ,__package__ ,_i17 ,In ,contador
,findall ,m1 ,_i2 ,escape ,mostrar_lenguajes ,Out ,exit ,LOCALE
,finditer ,b ,Animalito ,mod1 ,purge ,textwrap ,__ ,my_regex ,X ,_i11
,___ ,__doc__ ,fullmatch ,subn ,__builtins__


El atributo de clase `__module__` tiene el nombre del módulo en el cual la clase es definida. Sea el módulo, llamado `mod3.py` 

In [21]:
"""
modulo ejemplo

"""

class m1:
    pass

class m2:
    pass



Escribamos ahora un segundo módulo, usando el atributo `__module__`:

In [22]:
# uso del atributo __mod__ en los modulos de Python.

from mod3 import m1

class l1:
    pass

b = l1()
print (b.__module__)

c = m1()
print (c.__module__)


__main__
mod3


Desde el módulo `mod3` importamos  la clase `m1 `. En el actual módulo, definimos una clase `l1`

```python
class l1:
    pass
```

Una instancia de clase `l1` es creada. Imprimimos el nombre de este módulo

```python
b = l1()
print (b.__module__)
```

Creamos un objeto desde la clase `m1`. También imprimimos el módulo donde fue definido.

```python
c = m1()
print (c.__module__)
```

En Ipython podemos correr el  módulo ``%run mod4.py`:

```python
__main__
mod3
```

El nombre actual del módulo es `__main__` y el nombre del módulo `m1` es `mod3`.

## Listas

Una de las estructuras fundamentales de Python, es sin lugar a dudas el de lista (list). Una lista es ordenación (Esto es similar a lo que en otros lenguajes puede ser llamado como array, pero con algo más de funcionalidad.

In [23]:
lista_entero = [2, 5,6]
lista_heterogenea = ['Python', 0.3, True]
lista_de_lista = [lista_entero, lista_heterogenea]


lista_longitud = len(lista_entero)
lista_suma     = sum(lista_entero)

lista_longitud
lista_suma


# Podemos conseguir el conjunto de elementos de una lista con corchetes

x = list(range(10))
zero = x[0]
one  = x[1]
nine  = x[-1]
eight = x[-2]
zero, one, nine, eight


(0, 1, 9, 8)

In [24]:
# Podemos modificar los valores de la lista

x = list(range(10))
x[0] = -1
x

[-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Podemos ingresar 'corchetes' para dividir una lista

In [25]:
primeros_tres = x[:3]
tres_ultimos  = x[3:]
uno_al_cuatro = x[1:5]
ultimos_tres = x[-3:]
sin_el_primero_ultimo = x[1:-1]
copia_de_x = x[:]
primeros_tres

[-1, 1, 2]

In [26]:
tres_ultimos

[3, 4, 5, 6, 7, 8, 9]

In [27]:
sin_el_primero_ultimo

[1, 2, 3, 4, 5, 6, 7, 8]

 Python tiene un operador **in** para verificar si un elemento pertenece a una lista. Esto implica que examina los elementos de la lista uno a la vez, de manera que es adecuado  usarlo  si es que la lista es muy pequeña.

In [28]:
'erika' in ["Erika", "erika", "ErIka"]

True

In [29]:
0 in [1,2,3,4]

False

Es facil, concatenar listas, usando la función `extend` :

In [30]:
y = ["Python", 3, "C++", 1.2, ["JavaScript", "R"]]
y.extend([3,5,7])
y

['Python', 3, 'C++', 1.2, ['JavaScript', 'R'], 3, 5, 7]

Es frecuente también agregar un elemento a la vez, usando la función `append` :

In [31]:
z = [1, 3, 5, 7]
z.append(9)
z

[1, 3, 5, 7, 9]

Es conveniente 'desempaquetar' listas si se conoce cuantos elementos ellos contienen, ya que de lo que contrario se puede encontrar un `ValueError`, sino tenemos el mismo número de elementos en ambos lados.  Es común usar un guión abajo, para un valor que estas lanzando:

In [32]:
x, y = [1 , 2]
_, y = [1 , 2]
y

2

## Tuplas

Las tuplas son primas *inmutables* de las  listas. Casi todo lo que se puede hacer a una lista que
no implica la modificación, se puede hacer para una tupla. Puede especificar una tupla utilizando
paréntesis (o nada) en lugar de corchetes:

In [33]:
a = 'Python', 'R', 'C++', 'Bash'
a
a[1]
for x in a :
    print(x, end=' ')

Python R C++ Bash 

La tuplas no se pueden modificar, es decir no se puede eliminar, agregar o editar algún valor dentro de la tupla.

In [34]:
lista1 = [1 ,3]
tupla1 = (1,3)
tupla2 = 4, 5
lista1[1] = 8 # la lista es ahora [1,8]

try:
    tupla1[1] = 8
except TypeError:
    print ("No se puede modificar la tupla")

No se puede modificar la tupla


Se pueden desempaquetar valores de alguna tupla en variables:


In [35]:
divmod(23, 4)
x ,y = divmod(23,8) # (2,7)
x

2

In [36]:
y

7

Las tuplas son una manera conveniente de retornar múltiples valores de las funciones

In [37]:
def sum_and_product(x, y):
    return (x + y),(x * y)

sp = sum_and_product(2, 3) # igual a  (5, 6)
s, p = sum_and_product(5, 10)

In [38]:
s

15

In [39]:
p

50

## Diccionarios

Una estructura fundamental de Python, es el diccionario, el cual está asociado con *valores* y *claves* y permite recuperar el valor correspondiente a la clave.

In [40]:
diccionario_vacio ={}
diccionario_vacio1 = dict()
notas = {'Cesar': 85, "Milagros": 89} # diccionario literal

Mili_notas = notas["Milagros"] # Mostramos el valor de una clave
Mili_notas 

89

Conseguimos un `KeyError` si solicitas por una clave que no está en el diccionario

In [41]:
try:
    Checha_notas = notas["checha"]
except KeyError:
    print ("No existen notas para checha!")

No existen notas para checha!


In [42]:
# Verificamos la existencia de una clave usando: in

Mili_tiene_notas = 'Milagros' in notas
checha_tiene_notas = 'checha' in notas

Mili_tiene_notas

True

Los diccionarios tienen un método `get ` que retorna un valor por defecto (en lugar de mostrar una `excepción`, cuando miras  que la clave no está en el diccionario:

In [43]:
Mili_notas = notas.get("Milagros", 0)
Checha_notas = notas.get("checha", 0) # igual a 0
no_hay_notas = notas.get("Ninguna")   # el valor por defecto es None

In [44]:
Checha_notas

0

In [45]:
no_hay_notas

Podemos asignar clave-valor usando los mismos corchetes


In [46]:
notas['Gabriela'] = 88
notas['Cesar'] = 91
num_estudiantes = len(notas)
notas

{'Cesar': 91, 'Gabriela': 88, 'Milagros': 89}

Los diccionarios se usan como una manera simple de representar datos estructurados:

In [47]:
tweet = {
    "usuario" : "C-Lara",
    "texto" : "M-L",
    "respuestas" : 100,
    "hashtags" : ["#data", "#science", "#datascience", "#python", "#R"]
}
tweet

{'hashtags': ['#data', '#science', '#datascience', '#python', '#R'],
 'respuestas': 100,
 'texto': 'M-L',
 'usuario': 'C-Lara'}

Además de buscar las claves específicas, podemos realizar todas las operaciones anteriores:

In [48]:
tweet_claves  = tweet.keys() # lista todas las claves
tweet_valores = tweet.values() # lista todos los valores
tweet_items   = tweet.items()   # lista de (clave, valor) en tuplas

'usuario' in tweet_claves
'usuario' in  tweet
'C-Lara'  in tweet_valores

True

In [49]:
tweet_items

dict_items([('hashtags', ['#data', '#science', '#datascience', '#python', '#R']), ('respuestas', 100), ('texto', 'M-L'), ('usuario', 'C-Lara')])

Las claves de los diccionarios deben ser inmutables; en particular, no puede utilizar una `list` como claves. Si
es necesaria una clave se  debe usar una tupla o encontrar una manera de poner la clave en una cadena. 



El módulo **json** proporciona una API para convertir objetos de Python en memoria a una representación serializada conocido como JavaScript Object Notation (JSON). JSON tiene la ventaja de contar con implementaciones en muchos lenguajes (especialmente en JavaScript), lo que es adecuado para la comunicación entre aplicaciones. Por ejemplo:

In [50]:
import json

data = {
   'nombre' : 'Python',
   'descarga' : 100,
   'precio' : 542.23
}

json_str = json.dumps(data)
json_str   # Codificamos una estructura python en JSON

'{"descarga": 100, "nombre": "Python", "precio": 542.23}'

In [51]:
# Realizamos el proceso inverso

data = json.loads(json_str)
type(data)

dict

EL formato JSON, es casi idéntico a la sintaxis de Python, salvo, algunas diferencias. Por ejemplo `True` es llevado a `true`, `False` es llevado a `false` y `None` es llevado a `null`:

In [52]:
json.dumps(False)

'false'

In [53]:
d = {'a': True,
     'b': 'Hello',
     'c': None}
json.dumps(d)

'{"b": "Hello", "c": null, "a": true}'

### Aleatoriedad 

En análisis de datos, es frecuente generar números aleatorios, el cual puede hacerse con el módulo [random](https://docs.python.org/3.0/library/random.html):

In [54]:
import random 

cuatro_elementos_aleatorios = [random.random() for _ in range(4)]
cuatro_elementos_aleatorios

[0.028843429249929553,
 0.11149646416016246,
 0.7960845754615156,
 0.7394000890061129]

El módulo random, produce [números pseudoaleatorios](https://es.wikipedia.org/wiki/N%C3%BAmero_pseudoaleatorio). Las funciones a las que hacemos referencia, cada vez que son invocadas, devuelven un valor de una secuencia de números predeterminada. Esta secuencia tiene un periodo bastante largo, es decir, es necesario obtener muchos números antes de que se vuelva a reproducir la misma secuencia. De ahí, el tratamiento de pseudo (o falso), aunque la utilidad que nos ofrezca sea equivalente al de los números aleatorios. Cuando nos interese obtener varias veces la misma secuencia de números pseudoaleatoria se puede utilizar la función  [random.seed](http://stackoverflow.com/questions/22639587/random-seed-what-does-it-do)  que fija mediante una "semilla" el mismo comienzo en cada secuencia, permitiendo con ello obtener series con los mismos valores. 


In [55]:
random.seed(4)
print (random.random())
random.seed(4)
print (random.random())
random.seed(4)
print (random.random())
random.seed(4)
print (random.random())


0.23604808973743452
0.23604808973743452
0.23604808973743452
0.23604808973743452


Algunas veces usamos la función `random.randrange` que devuelve enteros que van desde un valor inicial a otro final separados entre sí un número de valores determinados. Esta separación (o paso) se utiliza en primer lugar con el valor inicial para calcular el siguiente valor y los sucesivos hasta llegar al valor final o al más cercano posible. 

In [56]:
random.randrange(3, 6) # Escoge aleatoriamente desde el rango[3,4,5]

3

Hay otros métodos que también pueden ser convenientes. `random.shuffle` 'mezcla' o cambia aleatoriamente el orden de los elementos de una lista antes de realizar la selección de alguno de ellos. 

In [57]:
hasta_diez = list(range(10))
random.shuffle(hasta_diez)
print (hasta_diez)

[4, 1, 8, 3, 5, 9, 0, 2, 7, 6]


Si necesitamos aleatoriamente escoger un elemento de una lista, podemos usar la función `random.choice`

In [58]:
mis_lenguajes_favoritos = random.choice(['Python', 'R', 'JavaScript', 'SQL', "C"])
mis_lenguajes_favoritos

'Python'

Para escoger de manera aleatoria una muestra de elementos sin reemplazamiento ( sin duplicados), podemos usar la función 
`random.sample`

In [59]:
numeros_loteria = list(range(60))
numeros_ganadores = random.sample(numeros_loteria, 6)
numeros_ganadores

[14, 33, 34, 23, 17, 49]

Para escoger una muestra de elementos con reemplazo (se permite duplicados), se hace llamadas múltiples a `random.choice`:

In [60]:
cuatro_con_reemplazamiento = [random.choice(list(range(10)) ) for _ in range(4)]
cuatro_con_reemplazamiento

[2, 1, 4, 3]

## Expresiones regulares 

Las [expresiones regulares](https://docs.python.org/3/library/re.html) proporcionan una manera de buscar patrones en los textos. Estas son increiblemente útiles, pero bastante complicadas, de forma que hay libros enteros escritos acerca de ellos. Mostremos algunos ejemplos acerca de sus aplicaciones

El método `re.search()` toma un patrón sobre  expresión regular y una cadena y busca ese patrón dentro de la cadena. Si la búsqueda es exitosa, `search()` devuelve un objeto que cumple con ese patrón o `None` en caso contrario. Por lo tanto, la búsqueda es generalmente seguida  por una sentencia `if` para comprobar si la búsqueda tuvo éxito.


In [61]:
import re

str = 'un ejemplo de  palabra:cat!!'
match = re.search(r'palabra:\w\w\w', str)
if match:
    print ('Encontramos la ', match.group() )
else:
    print ('palabra no encontrada ')


Encontramos la  palabra:cat


El módulo `re` incluye funciones  para trabajar con expresiones regulares como cadena de textos, pero es usualmente más eficiente *compilar* las expresiones que tu programa usa frecuentemente. La función `compile()` convierte una cadena en un `RegexObject`.

In [62]:
import re

# Pre-compilamos el patron del texto

regexes = [re.compile(p) for p in ['sc',
                                  'py']
          ]
texto = "Scala y python son lenguajes de programacion?"

for regex in regexes:
    print(' Buscando por "%s" en"%s" ->' %(regex.pattern, texto),)
    if regex.search(texto):
        print ('Encontramos un emparejamiento')
    else:
        print ('No hay emparejamientos')


 Buscando por "sc" en"Scala y python son lenguajes de programacion?" ->
No hay emparejamientos
 Buscando por "py" en"Scala y python son lenguajes de programacion?" ->
Encontramos un emparejamiento


### Enumerate 

[enumerate](https://docs.python.org/3/library/enum.html) es una función integrada de Python. Su utilidad no se puede resumir en una sóla línea.  Sin embargo, la mayoría de los recién llegados e incluso algunos programadores avanzados no son conscientes de ello. Con esta función se  nos permite iterar sobre algo y tener un contador automático. 

```python
for i, valor in enumerate(lista):
    print(i, valor)
```

Aquí unos ejemplos:

In [63]:
mis_lenguajes= ['R', 'Python', "C++", "JavaScript"]
for i, lenguajes in enumerate(mis_lenguajes, 1):
    print(i, lenguajes)

1 R
2 Python
3 C++
4 JavaScript


### La función zip

Muchas veces vamos a necesitar  comprimir dos o más listas juntas. La [función zip](https://docs.python.org/3.3/library/functions.html#zip) transforma varias listas en una única lista de tuplas de elementos correspondientes:




In [64]:
lista1 = ['Erika', 'Delia', 'Milagros']
lista2 = [1,2,3]
lista  = zip(lista1, lista2)
list(lista)

[('Erika', 1), ('Delia', 2), ('Milagros', 3)]

Si las listas tienen diferentes longitud, zip se detiene tan pronto como la primera lista finaliza. Tu puedes 'descomprimir' una lista, usando un 'truco'

In [65]:
chicas = [('Erika', 1), ('Delia', 2), ('Milagros', 3)]
lista1, lista2 = zip(*chicas)
lista1

('Erika', 'Delia', 'Milagros')

In [66]:
lista2

(1, 2, 3)