# Capítulo 1: un padawan de Python
_Del curso "Python y Machine Learning: de 0 a 100 con Reinforcement Learning"_ <br/>
_24 de Marzo de 2020_

Duración estimada: **2 horas** en streaming.

---
<br/>

> DISCLAIMER: No soy un maestro de Python

<br/>

**Hey!** Antes de comenzar, tienes 3 modos de obtener este *notebook*. 

1. A través de GitHub, en el repositorio [@espetro/pyCourse](). Duplicas el repositorio (bien descargas el `.zip` o ejecutas `git clone`) y usas el *notebook* en local.
2. A través de Google Colab, siguiendo [este enlace](https://colab.research.google.com/).
3. Otra alternativa para no iniciar sesión es usar Binder: [aquí el enlace](https://mybinder.org/).

<br/>

<img src="https://i.imgur.com/yAwThCj.jpg" width="30%" style="margin-left:25em"/>

Espero que todo funcione 🤞🤞

<br/>

---

<br/>

En la anterior clase pudimos iniciarnos con Python, el lenguaje más *cool* del último lustro. Supiste cómo instalar Python, qué es Anaconda y para qué puede sernos útil, y empezaste a programar en Python.

En este bloque, entenderás mejor por qué Python está partiendo la pana. Verás conocimientos fundamentales para cualquier desarrollador Python, y en concreto, iremos orientándonos a ser desarrollador Python para Machine Learning.


Como quizás ya sepas, Python no solo se usa para Machine Learning. Pero... ¿y por qué se usa?

### Por qué usamos Python

<img src="https://i.imgur.com/Xt1NL3Y.png" width="60%"/>

<br/>

Creo que este punto es importante porque, por un lado, **te hace mejor programador**, al razonar los motivos por los que programas en `X` y no solo porque *mi empresa o universidad trabaja con X*; y por otro lado, puedes lograr a **aprovechar las ventajas** del lenguaje que usas.

+ Es un lenguaje enfocado en la **legibilidad**, trabajando con un gran subconjunto de palabras del inglés. De esta manera, proporciona un <u>balance justo entre productividad y mantenimiento</u>
> Fíjate! En Python no usamos corchetes `{}` para definir funciones ni bucles

<br/>

+ Es un lenguaje **multiparadigma**, por lo que permite programar usando distintos modelos de programación, como el *orientado a objetos* o *funcional*. Además, es un lenguaje **tipado dinámicamente**, aunque deja abierta la posibilidad de tiparlo estáticamente.
> Fíjate! Al contrario que en Java o C, para guardar un número entero, no tienes que asignarle el tipo `int`. Por suerte, **sí está fuertemente tipado**, lo que hace que no puedas, por ejemplo, sumar `1 + "1"`, cosa que sí ocurre en JavaScript.

<br/>

+ Tiene una **librería estándar robusta**, lo que permite desarrollar nuevas librerias de manera más sencilla. Además, cuenta con una **gran comunidad** por detrás, lo que ayuda al mantenimiento y adaptación del lenguaje.
> Fíjate! El lenguaje es de código abierto, por lo que [es la comunidad la que propone cambios][peps].

<br/>

+ Por último, tiene gran cabida en la gran mayoría de plataformas, como ya pudisteis comprobobar en el anterior capítulo 😉 Si bien es cierto que no es tan rapido como C o C++, la posibilidad de compilar en tiempo de ejecución y de poder ejecutar algunas tareas en C o C++  mejora bastante su rendimiento.
> Fíjate! Python es uno de los lenguajes base de las distribuciones Linux, estando presente también en MacOS.

<br/>


Por ésto y por otras cosas, es porque está en varios rankings ([PYPL][pypl], [TIOBE][tiobe]) como uno de los lenguajes más populares.

---

[pypl]: http://pypl.github.io/PYPL.html
[tiobe]: https://www.tiobe.com/tiobe-index/
[peps]: https://www.python.org/dev/peps/

### Micro apunte sobre ayuda

De aquí en adelante veremos algunos bloques teóricos y prácticos complejos. En Python, puedes usar **`help()`** sobre cualquier variable, palabra predefinida u objeto para obtener más información.

In [62]:
help(None)

Help on NoneType object:

class NoneType(object)
 |  Methods defined here:
 |  
 |  __bool__(self, /)
 |      self != 0
 |  
 |  __repr__(self, /)
 |      Return repr(self).
 |  
 |  ----------------------------------------------------------------------
 |  Static methods defined here:
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.



### Micro apuntes sobre formateo de texto

Podemos formatear el texto en Python de varias maneras. Veamos cuáles hay:

In [44]:
print("Hoy es", 24, "de Marzo de", 2020)           # sintaxis clasica
print("Hoy es %d de Marzo de %d" % (24, 2020))     # sintaxis similar a C (printf, sprintf)
print("Hoy es" + " 24 " + "de Marzo de" + " 2020") # sintaxis similar a Java (System.out.print)
print("Hoy es {} de Marzo de {}".format(24, 2020))

dia, anyo = 24, 2020
print(f"Hoy es {dia} de Marzo de {anyo}")          # sintaxis similar a JS ES6 y Bash [solo disponible a partir de 3.6]

Hoy es 24 de Marzo de 2020
Hoy es 24 de Marzo de 2020
Hoy es 24 de Marzo de 2020
Hoy es 24 de Marzo de 2020
Hoy es 24 de Marzo de 2020



### Micro-recordatorio del capítulo 0: Tipos de datos

¿Recuerdas los tipos de datos principales que dimos en el capítulo 0?

<img src="https://i.imgur.com/cCJ7SSD.png" width="60%"/>

Todos estos tipos se pueden comprobar con la función `type()`. Además, hay que tener en cuenta otros tipos fundamentales:

+ ¿Conoces `null`? En Python no existe, pero tenemos **`None`**, cuyo tipo es `NoneType`.

+ Toda clase que creemos se considera un tipo nuevo. Por ello, toda instancia del objeto es del tipo de la clase.
> Si tenemos una clase `Persona` y una instancia/objeto `pepe = Persona(edad=32, altura=180)`, `type(pepe)` es `Persona`

+ Además, en Python [**todas las funciones son objetos**][f]. Esto se conoce como *First-Class Functions* y permite, entre otras cosas, usar las variables como parámetros para las funciones, y almacenar las funciones en bases de datos.

Podeis ver todos los tipos [aquí][t].

### Cómo comprobar la equivalencia de tipos y datos en Python

Muy simple: en vez de usar `==`, en Python podemos usar `is`:

```python
lista1 = [1, 3, "5", 7, "9", None]

filtrar_errores = [x for x in lista1 if x is not None]

sumar_dos = [x + 2 for x in filtrar_errores if x is int]

print(sumar_dos)
```

¿Qué nos dará?

[f]: https://dbader.org/blog/python-first-class-functions
[t]: https://docs.python.org/3.7/library/types.html

In [50]:




class Persona:
    def __init__(self, edad, altura):
        self.edad = edad
        self.altura = altura
    
    def info(self):
        print(f"Mi edad es {self.edad} y mi altura es {self.altura}")
        
pepe = Persona(32, 180)
type(pepe)

__main__.Persona

In [48]:
type(pepe.info)

method

In [49]:
type(Persona.info)

function

In [18]:
import re
type(re)

module

In [16]:
type((x for x in range(10)))

generator

In [46]:
type([x for x in range(10)])

list

In [51]:
type(None)

NoneType

---

## Python ¿estáticamente tipado? 😱😱

¡Sí sí sí! [**Aquí teneis la chuleta**][chuleta]. Realmente el tipado es estático, si no que se comprueba antes de que sea ejecutado, algo así [como pasa con JavaScript y TypeScript][ts]. Esta posibilidad **se introduce en [Python 3.5][pep484]** y se mejora en las siguientes versiones.

Usaremos el [módulo `typing`][typing] para ello

[why]: https://wiki.python.org/moin/Why%20is%20Python%20a%20dynamic%20language%20and%20also%20a%20strongly%20typed%20language
[duck]: https://realpython.com/lessons/duck-typing/
[chuleta]: https://www.pythonsheets.com/notes/python-typing.html
[ts]: https://www.typescriptlang.org/docs/handbook/typescript-in-5-minutes.html
[pep484]: https://www.python.org/dev/peps/pep-0484/
[typing]: https://docs.python.org/3/library/typing.html

In [92]:
from datetime import datetime as dtime

class Persona:
    duracion_anyo: int = 365
    
    def __init__(self, nombre: str, altura: float, fecha_de_nacimiento: str):
        self.nombre = nombre
        self.altura = altura
        self.fecha_de_nacimiento = dtime.strptime(fecha_de_nacimiento, "%Y-%m-%d")
        
    def wave(self):
        diferencia = dtime.now() - self.fecha_de_nacimiento
        edad_actual = diferencia.days // Persona.duracion_anyo
        
        print(f"Mi nombre es {self.nombre}, tengo {edad_actual} años y mido {self.altura} cms.")

In [93]:
# Necesitamos insertar la fecha en el formato "YYYY-MM-DD" ! 
Quino = Persona("Quino", "181", "1996-11-11")

Quino.wave()

Mi nombre es Quino, tengo 23 años y mido 181 cms.


---

## *Si quieres ir rápido, programa solo. Si quieres llegar lejos, programa con los demás*

*Worst translation ever, but the point is*: **Documenta y testea**. Esto no es algo unico de Python, pero hacemos énfasis porque en Python prima la **legibilidad**.


In [50]:
class Persona:
    """Permite representar personas físicas"""
    def __init__(self, nombre, edad, altura):
        """
        @param nombre: el nombre de la persona
        @param edad: su edad
        @param altura: su altura, en centrimetros
        """
        self.nombre = nombre
        self.edad = edad
        self.altura = altura
    
    def info(self):
        """Dibuja la información de la persona por pantalla"""
        print(f"Mi edad es {self.edad} y mi altura es {self.altura}") # es preferible este 'print' a
        # print("Mi edad es %d y mi altura es %.2f" % (self.edad, self.altura))

__main__.Persona

#### Crea código legible

Es lo que llaman *el Zen de Python*. Es [uno de los primeros PEP][pep20] creados y sintetiza las ideas para crear codigo legible.

```md
Lo explícito es mejor que lo implícito.
Lo plano es mejor que lo enrevesado.
Los errores nunca deberían de ser silenciados.
Ahora es mejor que nunca.
```

Otro de los PEP fundamentales [se centra en la guía de estilo para Python][pep08]: el **PEP8 es una de las guías fundamentales** para estandarizar codigo en Python.

[pep20]: https://www.python.org/dev/peps/pep-0020/
[pep08]: https://www.python.org/dev/peps/pep-0008/

#### Documenta

Tanto si es para desarrollar herramientas más complejas por ti mismo como si estás participando en un proyecto con otros desarrolladores, documentar "correctamente" es esencial. Python tiene su propia guía de estilo para la documentación, **basada en reStructuredText y condensada en el [PEP287][pep287]**.

De manera simple, reStructuredText es un lenguaje de texto enriquecido que compila a HTML. Veámoslo:

[pep287]: https://www.python.org/dev/peps/pep-0287/

#### Testea

Explicar POR ENCIMA lo del Unit Testing, `assert` y poco más (el TDD?)

#### Depuración de errores

Explicar el `pdb` y algo de linters

---

## Estructuras de datos avanzadas


### Numpy

### Pandas

asdasd

---

## Progamación funcional

### Inmutabilidad de datos

### Funciones anónimas o *lambda*

### Map, Filter y Reduce

### *Lazy evaluation*

Quizás ya te hayas preguntado <u>por qué Python compila código que no es correcto</u>, siempre que esté dentro de funciones o clases. Ésto es porque **Python usa evaluación perezosa** dentro de funciones. Esta funcionalidad no solo está en la evaluación de funciones, sino también en algo llamado **generadores**. [En este artículo][lazy] se arroja más información sobre el tema.

### Manejo de errores

[lazy]: https://swizec.com/blog/python-and-lazy-evaluation/swizec/5148

---

## Y de aquí.. ¿a Pekín?

Creo que el contenido del capítulo ya es suficientemente denso como para seguir avanzando, así que dejo unos cuantos recursos por si quereis seguir avanzando:

### Extras

+ Expresiones Regulares. Si no sabes lo que son, [Mozilla tiene un artículo muy bueno](https://developer.mozilla.org/es/docs/Web/JavaScript/Guide/Regular_Expressions) (practica con [RegExr, es genial!](https://regexr.com/)). En Python funcionan [de otro modo](http://buhoprogramador.com/entrada/10/expresiones-regulares-en-python). Para más avanzados, [aquí](https://www.pythonsheets.com/notes/python-rexp.html).

+ Cómo funciona la Lectura/Escritura de archivos. Más [aquí](https://pythonista.io/cursos/py101/escritura-y-lectura-de-archivos).

+ Ligeramente ligado con lo anterior, y sobre todo con estructuras de datos, están los **generadores**. [En este artículo](https://alvarohurtado.es/2013/08/31/generadores-en-python/) tienes una explicación de qué son y para qué sirven. Para avanzados: [aquí](https://www.pythonsheets.com/notes/python-generator.html).

+ Los **decoradores** son algo muy interesante, algo único de Python. Es algo que me estoy mirando recientemente y permiten, además de mejorar la documentación de tu código, pre-procesarlo para poder añadir funcionalidades extras. Algo así **como las macros de Excel o Rust**. Para iniciarte: [aquí](https://codingornot.com/python-que-es-un-decorador). Para avanzados: [aquí](https://realpython.com/primer-on-python-decorators/).

### Plataformas para practicar

<img src="https://i.imgur.com/3PHSZV5.png" width="60%"/>

+ [Codewars](https://www.codewars.com/) permite practicar tus conocimientos de programación entorno a varios problemas - todo problema puedes resolverlo en más de 20 lenguajes: Python, Haskell, Java, ...

+ Otras plataformas como [Exercism](https://exercism.io/) o [Leetcode](https://leetcode.com/) se centran en *tracks* o cursos completos, que tratan temas como Algoritmia, problemas de decisión o búsqueda.

+ Incluso Google ofrece [un curso de Python](https://developers.google.com/edu/python). De cara a los próximos capítulos, [**recomiendo este libro sobre Python y Data Science**](https://jakevdp.github.io/PythonDataScienceHandbook/), totalmente gratuito de manera online.

De todas formas, ésto solo es un pequeño grano en el mar de recursos que hay. Te recomiendo que hagas [una búsqueda en GitHub](https://github.com/search?q=python), o [pruebes en PyPi](https://pypi.org/).

### Cosillas feas de Python

+ **La cantidad de versiones**: si acabas de llegar a Python y te encuentras con alrededor de 8 versiones, tu cabeza hace 🤯🤯 incluso peor, es cuando tienes que usar Python2 y Python3 a la vez, pues tienes que operar como si fuesen dos lenguajes distintos. Ésto también se acentua cuando trabajas por proyecto (menos mal que existe Anaconda y PyEnv 🥳)

+ **La dificultad para hacer concurrencia** (ésto es algo avanzado): Python tiene varias implementaciones, y *CPython*, la más usada, implementa [una estructura, llamada *GIL*, que obliga a correr Python en un solo procesador](https://hackernoon.com/concurrent-programming-in-python-is-not-what-you-think-it-is-b6439c3f3e6a).

+ Las implementaciones completamente hechas en Python tienden a ser lentas, comparadas con C / C++ o Rust.


---

Licencia: [GNU GPLv3](https://www.tiobe.com/tiobe-index/) 2020