# Introducción

## Comprobar versión de Python de nuestro entorno

Para comprobar la versión del intérprete de python que estamos usando en el entorno de `conda` activo, simplemente tenemos que ejecutar la siguiente "celda":

In [1]:
import sys
sys.version

'3.7.6 (default, Jan  8 2020, 13:42:34) \n[Clang 4.0.1 (tags/RELEASE_401/final)]'

💡**Nota**: El módulo `sys` es uno de los múltiples módulos nativos (conocidos como *built-in*'s) de `Python`. Este módulo brinda acceso a algunas variables utilizadas o mantenidas por el intérprete, y a funciones que interactúan con el intérprete.

## Revisión de Python

En primer lugar, tal y como indica el título de la sección, debemos aclarar que este breve documento introductorio (o más bien de revisión) de `Python` no pretende ser una guía exhaustiva del lenguaje en sí mismo. El presente documento únicamente pretende revisar los conceptos que consideramos importantes para el desarrollo de la asignatura. Podemos asegurar de antemano que lo que a continuación se muestra no es más que una pequeña exposición introductoria (un pequeño subconjunto selecto de una inmensidad de contenidos posibles que sólo podrían verse con la atención necesaria en un curso específico del lenguaje). Para las mentes más inquietas que quieran sacar el máximo partido del [lenguaje más popular en la actualidad](https://linuxiac.com/python-the-most-popular-programming-language/), recomendamos la lectura las referencias *de facto*: 

- [Learning Python](https://www.oreilly.com/library/view/learning-python-5th/9781449355722/): Una introducción completa y detallada al lenguaje de Python. Basado en el popular curso de capacitación del autor Mark Lutz, este libro provee una inmersión total en el lenguaje, con el objetivo último de enseñar a escribir código eficiente y de alta calidad con Python. Es una guía de mucho detalle, y por tanto apta para gente que quiera ganar un conocimiento muy profundo del lenguaje. No obstante, es un libro apto para novatos y expertos, sea nuevo en la programación o un desarrollador profesional versado en otros lenguajes.

- [Python in a Nutshell](https://www.oreilly.com/library/view/python-in-a/9781491913833/): Libro práctico que proporciona una referencia rápida al lenguaje, incluidos Python 3.5, 2.7 y aspectos destacados de 3.6, áreas de uso común de su amplia biblioteca estándar y algunos de los módulos y paquetes de terceros más útiles.

No obstante, queremos hacer notar que dicha lectura es algo opcional, y que el material necesario para entender el desarrollo de la asignatura debería estar contenido en este documento. Ésto no significa que "todo" lo que vayamos a utilizar en lo referente a `Python` esté contenido en este documento (pues esto conllevaría una extensión inncesaria del documento). Por contra, lo que queremos decir con *material necesario para entender el desarrollo de la asignatura* es precísamente *el material fundamental para entender y desarrollar otros conceptos más complejos*. Así, entederemos esta guía como un punto de partida, y nunca como un punto final.

### Tipos, variables, operadores, listas, diccionarios, control de flujo y funciones

Cualquier curso de programación tiene como punto de partida la introducción de los diferentes `tipos` inherentes del lenguaje. El paso lógico a posteriori es continuar con la definición de  `variables`, siguiendo con `operadores` que nos permiten trabajar con dichas variables, siguiendo con colecciones de variables (`listas` y `diccionarios`), para posteriormente ver `controles de flujo`  y definición de `funciones`.


#### Tipos de datos (Data Types)

En este pequeño curso exprés de `Python` seguiremos el esquema mencionado, empezando por los tipos de datos con los que podemos trabajar (por defecto) en `Python`.

Todo dato en `Python` es representado por un `objeto`, cuyo valor (`value`) en cuestión es el dato en sí mismo (y que se suele confundir con el objeto), y cuyo tipo (`type`). El tipo de un objeto determina las operaciones que soporta el objeto en cuestión, más específicamente el valor del objeto. Además, el tipo también determina si el objeto puede ser modificado, siendo un objeto `mutable` en caso afirmativo, o `inmutable` en el caso contrario.

Para conocer el tipo de un objeto, podemos hacer uso de una función/método nativo (built-in) de `Python`, el llamado `type`. A continuación exploramos con `type` los tipos de datos nativos de `Python`:

##### Numéricos

In [2]:
# decimal integer literal:
print(type(123))
print(type(1_000_000))

# binary integer literal:
print(type(0b010101))

# octal integer literal:
print(type(0o6645))

# hexadecimal integer literal:
print(type(0xDA5))

<class 'int'>
<class 'int'>
<class 'int'>
<class 'int'>
<class 'int'>


In [3]:
# floating-point literals:
print(type(1.))
print(type(.1))
print(type(1e5))
print(type(1_000.000_000_123))

<class 'float'>
<class 'float'>
<class 'float'>
<class 'float'>


In [4]:
# complex-number literals:
print(type(0j))
print(type(1+1j))

<class 'complex'>
<class 'complex'>


##### Secuencias

Una secuencia no es más que un contenedor (finito, ésta es la diferencia con un `iterador`) de elementos que mantienen un órden (de indexado). Tenemos:

- Cadenas de caracteres (`str`): **Inmutables**
- Tuplas (`tuples`): **Inmutables**
- Listas (`list`): **Mutables**

In [5]:
# Strings
print(type("hello world!"))
print(type("""This is a formatted string with several lines
without the need of adding special characters to break line."""))

<class 'str'>
<class 'str'>


In [6]:
# Tuples:
print(type( (1,2,3,4) ))

# NOT! print(type(1,2,3,4))

<class 'tuple'>


##### Conjuntos y Diccionarios

Los conjuntos y diccionarios son *built-in's* de `Python` que permiten el almacenamiento no ordenado de objetos (no tienen por qué ser del mismo tipo):

- Conjuntos (`set`): **Mutables**
- Diccionarios (`dict`): **Mutables**

In [7]:
# Set:
print({"1", 1, 1.1, 1, "1"})
print(type({"1", 1, 1.1, 1, "1"}))

print(set(["1",2]))
print(type(set(["1",2])))

{1, '1', 1.1}
<class 'set'>
{2, '1'}
<class 'set'>


In [8]:
# Dict:

print({"key_1": "value", "key_2": 1231})
print(type({"key_1": "value", "key_2": 1231}))
print(dict(key_1="value", key_2=1231))

{'key_1': 'value', 'key_2': 1231}
<class 'dict'>
{'key_1': 'value', 'key_2': 1231}


##### Boleanos

Cualquier valor en Python se puede usar como un valor de verdad: verdadero o falso. Cualquier número distinto de cero o no vacío (`not None`) (por ejemplo, cadena, tupla, lista, conjunto o diccionario) equivale a verdadero (`True`). El valor `0` (de cualquier tipo numérico), `None` y cualquier contenedor vacío equivalen a falso (`False`). 

##### None

Existe un tipo especial en `Python` que es usado para expresar la ausencia de datos, `None`.

In [9]:
print(type(None))
None

<class 'NoneType'>


##### Callables

Un último tipo que es importante tener en consideración es el de `callable`, que no es más que un objeto que tiene "propiedad" de pode ser *llamado*. Uno de los ejemplos más fácil de entender de este tipo es el de `función`. Toda función es un `callable`, aunque no son los únicos. Si queremos explorar qué es o no un `callable`, podemos usar la función *built-in* con el mismo nombre sobre un objeto, lo que retornará `True` en caso verdadero y `False` en el caso contrario:

In [10]:
callable(print)

True

In [11]:
callable(123)

False

#### Variables y referencias

Un programa `Python` accede a cualquier dato a través de una **referencia**. Es importante que entendamos éste concepto, a pesar de que pueda parecer algo abstracto, dado que es una característica fundamental del lenguaje, y que determina la forma de programación y el funcionamiento de los programas (en ocasiones llamados *scripts*). 

Una referencia no es más que un *nombre* que "apunta" a un valor, más específicamente a un objeto que tiene ese valor. ¿Dónde encontramos referencias? Como vamos a ver a continuación, una referencia puede ser: una `variable` (e.g. `x = 1.123`), un `atributo`, propiedades de un objeto (instancia de una clase, e.g. `obj.x` donde `x` sería el atributo del objeto `obj`), o un `elemento`, i.e. un componente de un contenedor (e.g., `[x, y, z]` siendo `x`, `y`, `z` elementos de la lista `[...]`). 

Lo más característico de `Python`, sobre todo para programadores que vienen de lenguajes fuertemente tipados, como puede ser `C/C++` o `Java`, es que las variables, u otras referencias, no tienen un tipo intrínseco. Esto se debe a que en python la declaración es dinámica. De esta forma, la referencia `x = 1`, puede ser primeramente una referencia a un `int`, y posteriormente cambiar a ser `x = "hola"` referencia a `str`. Es decir, en `Python` no tenemos que malgastar tiempo en "declaraciones". ¿Cómo definimos entonces una variable? Tan sencillo como asignarle (*binding*) un valor con el operador `=`:

In [12]:
my_var = 1.123

In [13]:
type(my_var)

float

In [14]:
# Posición de memoria:
hex(id(my_var))

'0x7f79b585a4b0'

De esta forma, `my_var` es una variable que referencia al objeto tipo `float` con valor `1.123`. Sin embargo, `my_var` puede cambiar en cualquier momento a qué dato/objeto referencia. Para ello solo tenemos que cambiar su valor (*unbinding*):

In [15]:
my_var = "hola!"

In [16]:
type(my_var)

str

In [17]:
hex(id(my_var))

'0x7f79b5a1a230'

Lo interesante de lo que acabamos de ver es que `my_var` es en sí mismo un objeto que tiene una ocupa una determinada posición de memoria, sin embargo el tipo de su contenido ha cambiado dinámicamente sin mayor esfuerzo. Esto se conoce como **tipado dinámico**.

El *tipado dinámico* (*dynamic typing*) obviamente representa una gran ventaja a la hora de escribir/prototipar código de manera rápida. Sin embargo, también puede darnos algún que otro dolor de cabeza cuando algo no funciona como esperamos y tenemos que destripar (*debugging*) el código. Es por ello que a día de hoy se recomienda anotar el tipo de las variables (*type hinting*) en ciertas ocasiones, como veremos a posteriori. Los *consejos* a los que nos refereriremos en éste curso siempre serán aquellos dados por la comunidad como PEP's ([Python Enhancement Proposals](https://www.python.org/dev/peps/)). 

Para poder explorar todos los tipos de variable que hemos comentado, vamos a utilizar una definición de una clase (`class`) antes de haber visto lo que ésto significa. Por el momento, recomendamos hacer uso del siguiente bloque de código sin mayor detalle de la definición de la clase, a lo que volveremos posteriormente con mayor atención en la sección sobre [OOP](https://en.wikipedia.org/wiki/Object-oriented_programming).

In [18]:
class Student:
    """Class defining a student
    
    The object student will contain (by default) the 
    name, surname and age of the student we are considering. 
    """
    def __init__(self, name: str, surname: str, age: float):
        """Instantiates a student object
        
        :param name: The name of the student (str)
        :param surname: The surname of the stududent (str)
        :param age: The age of the student (float)
        """
        self.name = name
        self.surname = surname
        self.age = age

In [19]:
# ref: Variable
my_hi = "hello!"
my_student = Student(
    name="John",
    surname="Doe",
    age=35,
)

my_tuple = (my_hi, my_student)
my_list = [my_hi, my_student]

In [20]:
my_hi

'hello!'

In [21]:
my_student

<__main__.Student at 0x7f79b5a18210>

In [22]:
# ref: Attribute
my_student.age

35

In [23]:
# ref: Item (first element)
my_tuple[0]

'hello!'

In [24]:
# last element:
my_tuple[-1]

<__main__.Student at 0x7f79b5a18210>

In [25]:
# slicing: selección de un intervalo semiabierto de índices [0,2)
my_list[0:2]

['hello!', <__main__.Student at 0x7f79b5a18210>]

Nada nos impide poder hacer un *rebinding* de la edad de nuestro estudiante:

In [26]:
my_student.age = "35"

#### Operadores

Para una discusión exhaustiva sobre los operadores nativos de `Python` podemos acudir a una de las referencias mencionadas más arriba, o a éste [link](https://realpython.com/python-operators-expressions/#arithmetic-operators).

En nuestro caso vamos a presentar los operadores que serán de mayor utilidada en éste curso, sin descartar la necesidad futura de alguno no mencionado en los siguientes ejemplos:

##### Operadores de comparación: `==`, `!=`, `<`, `>`, `<=`, `>=`, ...

In [185]:
my_hi == "hola"

False

In [186]:
my_hi <= "hello!"

True

In [187]:
1 < 12.123

True

In [188]:
# Cadenas (Equivalente: 1 < 2 and 2 < 3 and 3 < 4)
1 < 2 < 3 < 4

True

In [189]:
# Cuidado con los paréntesis!
((my_hi == "hello!") or (1 < 2)) and (4 < 3) 

False

In [190]:
(my_hi == "hello!") or (1 < 2) and (4 < 3)

True

In [191]:
st_1 = Student("John", "Doe", 35)
st_2 = Student("John", "Doe", 35)

# Cuidado con la comparación de objetos propios: 
st_1 == st_2

False

In [192]:
st_1.name == st_2.name and \
st_1.surname == st_2.surname and \
st_1.age == st_2.age

True

In [193]:
# Ternary operator: when_true if condition else when_false

## Built-in module for dealing with dates:
from datetime import datetime

is_friday = True if datetime.now().weekday() == 4 else False

In [194]:
is_friday

False

##### Operadores de secuencias:

**Indexado**: Para acceder a los elementos de una secuencia usaremos el operador de indexación, que se caracterizad por los corchetes. Por ejemplo:

In [195]:
# Ejemplo con secuencia string, pero también válido con tuple y list
my_seq = "Ejemplo de secuencia string"

# Primer elemento de la secuencia:
my_seq[0] 

'E'

In [196]:
# último elemento:
my_seq[-1]

'g'

In [197]:
# Primeros 3 elementos:
my_seq[:3]

'Eje'

In [198]:
# Últimos 3 elementos:
my_seq[-3:]

'ing'

In [199]:
# Elementos alternos (recorrido directo):
my_seq[::2]

'Eepod euni tig'

In [200]:
# Elementos alternos (recorrido inverso):
my_seq[::-2]

'git inue dopeE'

Cada secuencia de las mencionadas tiene además métodos característicos que nos serán muy útiles para labores de análisis.
Algunos ejemplos de estos métodos:

In [201]:
my_str = "hola me llamo John"

# Conversión a Mayúsculas:
my_str.upper()

'HOLA ME LLAMO JOHN'

In [202]:
# Conversión a minúsculas:
my_str.lower()

'hola me llamo john'

In [203]:
my_str.title()

'Hola Me Llamo John'

In [204]:
my_str.split()

['hola', 'me', 'llamo', 'John']

In [205]:
word = "llamo"
word_idx = my_str.find(word)
my_str[word_idx:word_idx+len(word)]

'llamo'

In [206]:
my_lst = my_str.split(" ")

In [207]:
# encuentra el índice en lista:
word_idx = my_lst.index(word)
my_lst[word_idx]

'llamo'

In [208]:
my_lst.count(word)

1

In [209]:
my_lst.remove("John")

In [210]:
my_lst.append("Dan")

In [211]:
my_lst

['hola', 'me', 'llamo', 'Dan']

In [212]:
my_lst.remove("Dan")

my_lst += ["Jake"]

In [213]:
my_lst

['hola', 'me', 'llamo', 'Jake']

In [214]:
my_lst.reverse()
my_lst

['Jake', 'llamo', 'me', 'hola']

In [215]:
my_lst.sort(key=None)
# my_lst.sort(key=str.lower)
my_lst

['Jake', 'hola', 'llamo', 'me']

**Conversión**: No existe conversión implícita entre secuencias. Sin embargo, podemos llamar a los métodos nativos `list` y `tuple` pasándole como argumento cualquier iterable para obtener una nueva instancia de tipo lista o tupla. Por ejemplo:

In [216]:
l_string = list(my_seq)
l_string[0:7]

['E', 'j', 'e', 'm', 'p', 'l', 'o']

In [217]:
t_string = tuple(my_seq)
t_string[-6:]

('s', 't', 'r', 'i', 'n', 'g')

In [218]:
# Mutabilidad: las cláusulas try-and-except serán vistas en controles de flujo con mayor detalle
try: 
    t_string[-6] = "S"
except: 
    print("Ha habido un fallo: La tupla no es mutable")

Ha habido un fallo: La tupla no es mutable


In [219]:
# modificación de la lista:
l_string[-6] = "S"

# Conversión de lista a string:
"".join(l_string)

'Ejemplo de secuencia String'

In [220]:
# Replace: No modifica el string original, crea uno nuevo:
my_seq.replace("e", "*")

'Ej*mplo d* s*cu*ncia string'

In [221]:
my_seq

'Ejemplo de secuencia string'

**Pertenencia**: Una de las operaciones más frecuentes cuando trabajamos con secuencias de cualquier tipo, es la de testar si un elemento pertence o no a la secuencia. Ejemplos:

In [225]:
my_lst = """## Titular
Esto simula un texto de contenido (en concreto de un Markdown)

### Título de la subsección
Aquí tendríamos más contenido para poder leer
""".split()

# list comprehension (abundaremos más en el apartado de control de flujo)
cleaned_lst = [
    e.replace(")", "").replace("(","") 
    for e in my_lst
]

cleaned_lst

['##',
 'Titular',
 'Esto',
 'simula',
 'un',
 'texto',
 'de',
 'contenido',
 'en',
 'concreto',
 'de',
 'un',
 'Markdown',
 '###',
 'Título',
 'de',
 'la',
 'subsección',
 'Aquí',
 'tendríamos',
 'más',
 'contenido',
 'para',
 'poder',
 'leer']

In [226]:
# Pertenencia a lista/tuple:
"Markdown" in cleaned_lst

True

In [224]:
# Pertenencia a string:
"i" in cleaned_lst[1]

True

##### Operadores de diccionarios:

`Python` viene por defecto con una variedad amplia de operadores aplicables a diccionarios, i.e. a objetos del tipo `{key: value}`. Por definición, los diccionarios son objetos iterables, luego podemos usarlos en cualquier función o cláusula que tome como entrada un iterable. Un ejemplo de ello es (como veremos en breve) el `for loop`. A continuación exponemos ejemplos de los operadores más usados con diccionarios:

**Indexado**: Para acceder a un valor almacenado en un diccionario debemos hacerlo mediante el índice (la clave), con el operador de indexado `[...]`. La única diferencia con las listas es que en este caso no existe orden, y la clave no tiene porqué ser numérica:

In [236]:
my_car = {"brand": "Ford", "year": 1964}

my_car["brand"]

'Ford'

In [240]:
# Con el método get conseguimos lo mismo, pero evitamos la excepción
my_car.get("color", "Unknown")

'Unknown'

**Pertenencia**: Al igual que en el caso de las secuencias, los diccionarios admiten el operador `in` para comprobar si un *elemento* en cuestión es parte del mismo. En concreto, en la expresión `k in my_dct`, donde `my_dct` es un diccionario (`dict`), lo que se comprueba es si la clave (`key`) `k` pertence a la lista de claves del diccionario. Veamos ejemplos:

In [241]:
my_car = {
  "brand": "Ford",
  "model": "Mustang",
  "year": 1964
}

"brand" in my_car

True

In [242]:
"color" in my_car

False

**Unpacking**: Existe un operador un tanto peculiar que resulta bastante útil cuando queremos extender un diccionario (aunque la forma oficialmente recomendada es usando el operador `|`, tál y como se indica en [PEP 584](https://www.python.org/dev/peps/pep-0584/#d1-d2) con `Python>=3.9`):

In [243]:
# Extendiendo un diccionario:
{**my_car, "color": "Marengo"}

{'brand': 'Ford', 'model': 'Mustang', 'year': 1964, 'color': 'Marengo'}

In [246]:
# Extendiendo diccionario siguiendo PEP-584 (Python >= 3.9):
## my_car | {"color": "Marengo"}

### Programación orientada a objetos (OOP): Clases, métodos especiales y decoradores

### Trabajando con ficheros: Módulos `io`, `json` y `pickle`

### Librerías útiles para la analítica: Pandas, matplotlib, plotly, etc.