# Introducción a Python

Python es un lenguaje de alto nivel de propósito general, con usos muy diversos como el desarrollo web, creación de juegos y el análisis de datos. Entre las ventajas de usar Python están:
* Es gratuito.
* Es relativamente fácil de programar.
* Es multipropósito, puede hacer muchas tareas aparte del análisis de datos.
* Tiene miles de librerias con funciones escritas por otras personas y que pueden ser descargadas.
* Es uno de los lenguajes más utilizados en el mundo, por lo que hay mucha información en internet para solucionar dudas.
* Hay una alta demanda laboral de personas que sepan análisis de datos y programación y Python está entre los programas más demandados.

[en este blog](https://www.ibm.com/developerworks/community/blogs/jfp/entry/Why_Python?lang=en) y en este [otro](https://dbader.org/blog/why-learn-python) pueden encontrar más razones para usar Python.

## Filosofía de Python
Python sigue el principio de que la programación debe ser sencilla y fácilmente legible. La sintaxis en Python ayuda a que los programadores escriban menor cantidad de código a comparación de otros lenguajes. La filosofía viene descrita en el Zen de Python (negrillas propias).
* Bello es mejor que feo.
* **Explícito es mejor que implícito.**
* **Simple es mejor que complejo.**
* Complejo es mejor que complicado.
* Plano es mejor que anidado.
* Disperso es mejor que denso.
* **La legibilidad cuenta.**
* Los casos especiales no son tan especiales como para quebrantar las reglas.
* Lo práctico gana a lo puro.
* Los errores nunca deberían dejarse pasar silenciosamente.
* A menos que hayan sido silenciados explícitamente.
* Frente a la ambigüedad, rechaza la tentación de adivinar.
* **Debería haber una -y preferiblemente sólo una- manera obvia de hacerlo.**
* Aunque esa manera puede no ser obvia al principio a menos que usted sea holandés.
* Ahora es mejor que nunca.
* Aunque nunca es a menudo mejor que ya mismo.
* Si la implementación es difícil de explicar, es una mala idea.
* **Si la implementación es fácil de explicar, puede que sea una buena idea.**
* Los espacios de nombres (namespaces) son una gran idea ¡Hagamos más de esas cosas!

Estos principios se pueden ver al ejecutar:
```python
import this
```

## Usos de Python
* Análisis y visualización de datos.
    * Estadística descriptiva
    * Modelos Econométricos
    * *Machine learning*: [Scikit-Learn](http://scikit-learn.org/stable/), [TensorFlow](https://www.tensorflow.org/)
    * [Análisis de texto](https://www.datacamp.com/courses/natural-language-processing-fundamentals-in-python?).
    
* Desarrollo web, [creaciones de aplicaciones web](https://www.instagram.com/?hl=es): [DJango](https://www.djangoproject.com/), [Flask](http://flask.pocoo.org/), [Pyramid](https://trypyramid.com/).
* [Creación de aplicaciones de escritorio](https://www.dropbox.com/h): PyQT(https://riverbankcomputing.com/software/pyqt/intro), [wxPython](https://wxpython.org/), [Tkinter](https://docs.python.org/3/library/tk.html)
* Computación matemática y científica: [SciPy](https://www.scipy.org/),[SymPy](http://docs.sympy.org/latest/index.html)
* [Desarrollo de videojuegos](https://wiki.python.org/moin/PythonGames)
* [Analisis geoespacial](https://automating-gis-processes.github.io/2016/index.html): Geocoding, operaciones con shapefiles, [visualizaciones](http://python-visualization.github.io/folium/quickstart.html).
* [Web scrapping](http://www.thebillionpricesproject.com/): [BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/), [Scrapy](https://scrapy.org/).

[Y mucho más](https://www.python.org/about/success/)

## Instalación
Hay varias distribuciones de Python, pero la más recomendada es la de **[Anaconda](https://www.anaconda.com/download/)**, ya que incluye la mayoría de paquetes utilizados en análisis de datos. La versión más actual de Python es la 3.6, sin embargo la versión 2.7 sigue siendo la más utilizada. Para este taller usaremos la versión 3.6.

## Abriendo Jupyter Notebook
Podríamos usar Python directamente desde la consola de comandos de nuestra computadora, sin embargo lo usual es utilizar IDLES con una interfaz gráfica más amigable. Con anaconda se instalan dos programas con los que podemos trabajar Python: **Spyder** y **Jupyter Notebook**. En esta presentación vamos a utilizar el Jupyter notebook ya que es más amigable para empezar a programar.

Para abrir Jupyter Notebook tenemos dos opciones:
1. Buscar entre nuestros programas instalados a Jupyter Notebook y abrirlo.
2. Desde la terminal de comandos, nos ubicamos en la carpeta en que queremos trabajar y escribimos: 
```
jupyter notebook
```

Se abrirá una ventana de comandos que **no debemos cerrar**.

En nuestro explorador de internet se abrirá una nueva pestaña que será el host local de Jupyter, y mostrará los archivos de ese directorio.

### Creando un nuevo notebok

1. Nos vamos a la esquina superior derecha, hacemos click en el botón que dice *New* y seleccionamos *Python [root]*

2.  Se abrirá una nueva pestaña con un notebook y le asignamos un nombre. 
3.  En los notebooks se trabaja con celdas, en las que puede ir código o texto en markdown (permite incluir expresiones matemáticas de latex $y = X^2\hat{\beta} + \mu_i$). En la caja superior se puede seleccionar cuál es el contenido de la celda.

4. Para agregar nuevas celdas hacemos click en el el símbolo $+$ en la parte superior.

5. Para ejecutar el código de una celda presionamos *ctrl + enter*. El resultado de la operación, si lo hay, se mostrará debajo de la celda.

In [1]:
# aquí imprimimmos #
print('hola mundo!')

hola mundo!


* Los notebooks de Python tienen extensión **.ipynb**. Los scripts normales de Python tienen extensión **.py**
* Cada línea de código es una instrucción separada. Generalmente, en cada línea solo se puede hacer una operación, por ejemplo, asignar un objeto a una variable, leer datos, hacer una operación matemática, etc. Si se quiere hacer varias operaciones en una sola línea se puede separar cada operación por un punto y coma $;$
* Python es sensible a mayúsculas y minúsculas.
* Hay algunas palabras claves reservadas para el uso de Python. En un Jupyter Notebook estas palabras se vulven de color verde al escribirlas. Por ejemplo:
```python
for,if,in,import,print(),False,True, len(), type()
```
Pueden verlas todas [aquí](https://www.programiz.com/python-programming/keyword-list)

* Los Notebooks tienen muchas funcionalidades, como crear [visualizaciones interactivas](https://blog.dominodatalab.com/interactive-dashboards-in-jupyter/) o [dashboards](http://jupyter-dashboards-layout.readthedocs.io/en/latest/index.html). Para aprender más de los Notebooks y ver otras funciones interesantes pueden ver esta [guía](https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Jupyter_Notebook_Cheat_Sheet.pdf), esta [otra](https://www.datacamp.com/community/tutorials/tutorial-jupyter-notebook#gs.BsF_sZM) y esta [página](https://blog.dominodatalab.com/lesser-known-ways-of-using-notebooks/) para funciones más avanzadas.

## Tipos de datos
* ### Númericos
    
    * #### enteros:
    Números sin decimales, positivos o negativos. Se pueden escribir directamente en la consola de Python.
    
    * #### flotantes:
    Números con decimales, positivos o negativos. También incluye valores que son no numéricos (NaN) y el infinito.
    
    * #### Operaciones con números:
      
    ![alt text](numberOperations.png "Operaciones con números")
    
    También existen los operadores $+=$,$-=$, $*=$, $/=$ para hacer operaciones reflexivas, por ejemplo, $a+=2$ es equivalente a $a= a + 2$
    
    * #### operaciones de comparación:
    ![alt text](comparisonsOperations.png "Operaciones con números")

In [2]:
a=10
b=2
a!=b

True

* ### Texto
    En Python una cadena de texto es un objeto denominado *str* o *string*. Un *string* se puede crear de diferentes formas:
    1. Colocando texto entre comillas dobles ": 
    ```python
    "puedo usar 'comillas' simples adentro"
    ```
    2.  Colocando texto entre comillas simples ':
    ```python
    'puedo usar "comillas" dobles adentro'
    ```
    3. Usando comillas triples (tres comillas simples '''):
    ```python
    '''Puedo escribir 
    varias lineas 
    de texto'''
    ```
    4. usando el constructor str():
    ```python
    str(2)
  ```

#### operaciones con string
Con las cadenas de texto podemos usar las operaciones:
* suma: $+$ 
* multiplicación: $*$ 
* Igual o diferente: $==$ o $!=$
* "mayor que" o "menor que": $>$ o $<$
* Además se puede usar los operadores **in** y **not in**

In [3]:
h = "hola"
m = 'mundo'
# Suma
print("la suma de los dos string es:",h+m)
# Multiplicación
print("Aquí asociamos y multiplicamos:",(h+m+' ')*3)
#Comparación lexicográfica. Para ver el orden usar ord("")
print("¿'hola' es mayor que 'mundo'?",h>m)
print("¿'mundo' es mayor que 'hola'?",m>h)
print("¿'mundo' contiene la letra t?", 't' in m)

la suma de los dos string es: holamundo
Aquí asociamos y multiplicamos: holamundo holamundo holamundo 
¿'hola' es mayor que 'mundo'? False
¿'mundo' es mayor que 'hola'? True
¿'mundo' contiene la letra t? False


* Podemos extraer parte de un texto indexando con corchetes y la posición o un rango.

In [4]:
print('la primera letra es:',h[0])
print('Las primeras 3 letras son:',h[0:3])
print('Las últimas 2 letras son:',h[-2:])

la primera letra es: h
Las primeras 3 letras son: hol
Las últimas 2 letras son: la


#### Métodos de *string*
    
Los métodos son funciones que se aplican sobre el objeto. Algunos de los métodos útiles para cadenas de texto son los siguientes:

In [5]:
L = "Esta es una Cadena de Texto"
print("Solo la primera letra en mayúscula:",L.capitalize())
print("Todo en mayúscula:", L.upper())
print("Todo en minúscula:", L.lower())
print("La primera letra de cada palabra en mayúscula:", L.title())
print("La letra 'a' aparece",L.count('a'),"veces")
print("La primera ocurrencia de la letra 'a' está en la posición",L.find('a'))
print("Puedo construir una lista 'rompiendo' un t,ex,to:",'t,ex,to'.split(','))

Solo la primera letra en mayúscula: Esta es una cadena de texto
Todo en mayúscula: ESTA ES UNA CADENA DE TEXTO
Todo en minúscula: esta es una cadena de texto
La primera letra de cada palabra en mayúscula: Esta Es Una Cadena De Texto
La letra 'a' aparece 4 veces
La primera ocurrencia de la letra 'a' está en la posición 3
Puedo construir una lista 'rompiendo' un t,ex,to: ['t', 'ex', 'to']


* ### Booleanos
Los Booleanos toman dos valores, **True** o **False**. Los usamos principalmente en estructuras if-else para validar condiciones y también como índices en algunas estructuras de datos.
Los booleanos también pueden ser considerados números enteros: *True* es igual a 1 y *False* a 0.

In [6]:
# podemos hacer operaciones aritméticas con booleanos:
print("2+True=",2+True)
print("2*False=",2*True)

2+True= 3
2*False= 2


Los booleanos se pueden construir de distintas formas:
1. A partir de una comparación de elementos.
2. Los elementos de tipo *int*, *float* y *str* pueden convertirse en booleanos. Cualquier número, excepto el cero, retorna un valor *True*, el cero retorna un valor *False*. Cualquier texto retorna un valor True, solo un string vacío genera un *False*.

In [7]:
print("A partir de una comparación de elementos:",a>5)
print("A partir del constructor bool():",bool(5.3),bool(0),bool(h),bool(""))

A partir de una comparación de elementos: True
A partir del constructor bool(): True False True False


## Tipos de estructuras de datos en Python

Python tiene diferentes tipos de estructuras para guardar datos. Algunas vienen incluidas en el nucleo base de Python, pero otras se importan con librerías. Para el análisis de datos usamos principalmente DataFrames de la librería [Pandas](http://pandas.pydata.org/) y arrays de [NumPy](http://www.numpy.org/), sin embargo para este taller usaremos principalmente listas, dicccionarios y conjuntos. 

Veamos las estructras más básicas:
### Listas
es un arreglo de elementos separados por comas, encerrados en corchetes []. También se pueden crear con el constructor *list()*. Cada elemento puede ser un número, texto, listas, o cualquier otro objeto de Python.

In [8]:
J = ['Juan',89,['H',3],False,4.8]
K = list(('True','Kelly'))

Para indexar los elementos las listas se utilizan [] al lado de la lista y el número de posición del elemento. Hay que tener cuidado porque en Python la enumeracion de elementos empieza desde 0, por tanto el primer elemento se indexa con 0, el segundo con 1 y así sucesivamente:

In [9]:
print("El primer elemento de la lista es:",J[0])
print("Los elementos en la posición 2 hasta el 4 son:",J[2:4])
print("El segundo elemento de la lista en la posición 2:",J[2][1])
print("Los dos últimos elementos",J[-2:])

El primer elemento de la lista es: Juan
Los elementos en la posición 2 hasta el 4 son: [['H', 3], False]
El segundo elemento de la lista en la posición 2: 3
Los dos últimos elementos [False, 4.8]


Las listas pueden sumarse entre ellas o pueden multiplicarse por un escalar. También se puede usar el operador *in* para saber si un elemento está contenido en la lista.

In [10]:
print(J+K)
print(K*2)
print('Juan' in K)

['Juan', 89, ['H', 3], False, 4.8, 'True', 'Kelly']
['True', 'Kelly', 'True', 'Kelly']
False


#### Métodos de las listas:

Algunos métodos útiles para las listas son:

In [11]:
#count
print("El elemento False aparece",J.count(False),"veces")
# append, Note que el resultado de append es diferente al de sumar las dos listas
J.append(K)
print("Agregamos la lista K a la lista J:",J)
# Sort
K.sort()
print("La lista ordenada es:",K)
# reverse
J.reverse()
print("La lista en orden inverso al original es",J)

El elemento False aparece 1 veces
Agregamos la lista K a la lista J: ['Juan', 89, ['H', 3], False, 4.8, ['True', 'Kelly']]
La lista ordenada es: ['Kelly', 'True']
La lista en orden inverso al original es [['Kelly', 'True'], 4.8, False, ['H', 3], 89, 'Juan']


### Diccionarios

Los diccionarios son conjuntos de elementos compuestos por parejas de un nombre (*key*) y su contenido (*value*), separados usando el símbolo de dos puntos $:$. Los diccionarios se definen usando llaves {} y sus elementos de un  se separan por comas. El nombre debe ser texto y los contenidos pueden ser números, texto, tuplas, listas, o diccionarios

In [12]:
D = {'nombre':'Juan',
     'apellidos':{'paterno':'Santos','materno':'Ochoa'},
     'edad':20,}

Una gran diferencia entre los diccionarios y las listas, es que los primeros se indexan con los nombres definidos, mientras que las listas con números:

In [13]:
print(D['edad'])
print(D['apellidos']['materno'])

20
Ochoa


No puede repetirse un *key* en un mismo diccionario. Para agregar un nuevo valor al diccionario, o reemplazar uno existente, solo hace falta asignarlo.

In [14]:
D['nombre2']:'Javier'
print(D)

{'nombre': 'Juan', 'apellidos': {'paterno': 'Santos', 'materno': 'Ochoa'}, 'edad': 20}


Los diccionarios no pueden sumarse ni multiplicarse. 

### Conjuntos
Los conjuntos son arreglos de elementos separados por comas. A diferencia de las listas, los conjuntos solo se quedan con elementos únicos. Se pueden construir usando llaves {} o con el constructor $set()$. 

In [15]:
L2 = ['a',1,True,'1',0]
C1 = {'f','a',4,7,False}
C2 = set(L2)
print(C1)
print(C2)

{False, 4, 7, 'a', 'f'}
{'1', 1, 'a', 0}


Con los conjuntos se pueden hacer operaciones de unión e intersección

In [16]:
print("La unión de los conjuntos C1 y C2 es:",C1.union(C2))
print("La intersección de los conjuntos C1 y C2 es:",C1-C2)

La unión de los conjuntos C1 y C2 es: {False, 1, 4, 7, '1', 'a', 'f'}
La intersección de los conjuntos C1 y C2 es: {'f', 4, 7}


## Funciones incluidas importantes
Python tiene algunas funciones incluidas o *built-in* que son muy útiles para hacer operaciones. Entre algunas de las que considero más útiles están:
```python
type(A) # retorna el tipo de objeto que es A
len(A) # retorna el número de elementos que contiene el objeto A
input() # permite que el usuario ingrese texto
sum(A) # Suma todos los elementos de la lista A, si son números
max(A) # retorna el valor máximo de la lista A
min(A) # retorna el valor mínimo de la lista A
range(start,end) # crea una lista con elementos desde start hasta end
all(A) # retorna True solo si todos los elementos de la lista son True, en caso contrario, retorna False
any(A) # retorna False solo si todos los elementos de la lista son False, en caso contrario, retorna True
abs(a) # Retorna el valor absoluto del número a
round(a) # redondea el valor del número a
```
Pueden ver todas las funciones *built-in* [aquí](https://docs.python.org/3/library/functions.html#int)

In [17]:
len(J), any(K), all(J), min(a,b,a*b), max(a,b*a+b),type(D), abs(-8), round(3.56)

(6, True, False, 2, 22, dict, 8, 4)

## TAREA

1. Cree una lista que contenga los siguientes valores:
```python
'cide', 55, 'python', True, {'libro':'100 años de soledad','autor':'gabriel garcia marquez', 24}
```
2. Cree un nuevo elemento que sea igual a la suma del elemento 0 de la lista + el nombre del libro que está en el diccionario.
3. Use la función apropiada para poner en mayúsculas las iniciales del nombre del autor.
4. Cree un nuevo elemento que sea igual a la suma de las 3 últimas letras de todos los elementos que son texto.

5. Utilize la función print() y el método .count() para mostrar cuántas veces aparece cada vocal en un texto. El resultado debe ser algo así:
```python
En 'acido desoxirribonucleico' la letra 'a' aparece 1 veces
En 'acido desoxirribonucleico' la letra 'e' aparece 2 veces
En 'acido desoxirribonucleico' la letra 'i' aparece 4 veces
etc..
```

Para profundizar más sobre estos temas, recomiendo los siguientes recursos:
* [Automate the boring stuff](https://automatetheboringstuff.com/)
* [Python for Data Analysis](http://shop.oreilly.com/product/0636920023784.do)
* [Quantitative economics with Python](https://lectures.quantecon.org/py/)
* [Python for everybody (Curso online)](https://es.coursera.org/specializations/python)
* [Python path DataCamp (curso online)](https://www.datacamp.com/tracks/python-programming)
