# Python basic

**Python** es un lenguaje simple, fácil de manejar, *open source* y que tiene una gran versatilidad. Ahora mismo es el lenguaje más usado en *data analysis* y hay muchísima documentación: [python.docs](https://docs.python.org/3/), dudas resueltas en [stackoverflow](https://stackoverflow.com) y otros. También podrás encontrar muchos paquetes y código compartido en [github](https://github.com). 

Aquí hacemos un pequeño resumen de las generalidades de **Python** y los tipos de estructuras básicos que hay. Al final hay unos ejercicios para practicar. 

<ul style="list-style-type:none">
    <li><a href='#1.-Generalidades'>1. Generalidades</a></li>
    <li><a href='#2.-Tipos-de-datos'>2. Tipos de datos</a></li>
    <ul style="list-style-type:none">
        <li><a href="#2.1-Tipos-numéricos">2.1. Tipos numéricos</a></li>
        <li><a href="#2.2-Strings">2.2. Strings </a></li>
        <li><a href="#2.3-Variables-lógicas">2.3. Variables lógicas</a></li>
        <li><a href="#2.4-Listas">2.4. Listas</a></li>
        <li><a href="#2.5-Tuplas">2.5. Tuplas</a></li>
        <li><a href="#2.6-Diccionarios">2.6. Diccionarios </a></li>
    </ul>
    <li><a href="#3.-Ejercicios-para-practicar">3. Ejercicios </a></li>
    <ul style="list-style-type:none">
</ul>


# 1. Generalidades

Para escribir código en **Python** se puede hacer desde un archivo plano con extension .py, con una notebook o con un IDE (entorno de escritorio integrado) como **PyCharm** o **Visual Studio Code**. 



### Espíritu de Python. 
La filosofía de los principales desarrolladores de **Python** es escribir código de manera **simple**, **comprensible** y **estéticamente agradable**. Para mantener un código limpio y leíble es **importante** usar espacios coherentemente, usar nombre de variables facilmente identificables, usar módulos y funciones, documentar bien el código... Para poder ser facilmente **compartido**. 

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Consejos
  -  Utilizar nombres de las variables o funciones que ayuden a entender.
  -  Organizar bien el código en funciones.
  -  Líneas cortas.

### Estética
Para la estética encontraron un truco: el **sangrado**. 

In [27]:
x = 2
 y = 3 + x
z = y * 2
print(z)

IndentationError: unexpected indent (882337842.py, line 2)

En **Python** es lo que establece el control de flujo. Y solo se puede variar el sangrado dentro de una estructura de control y se sale al volver al sangrado inicial.   

In [47]:
z = 0
for i in range(10):
    x = i * 2
    z += x + 4
print(z)

130


Además existe una **guía de estilo** aceptada por la comunidad: la PEP8, podéis ver las reglas [aquí](https://www.python.org/dev/peps/pep-0008/) con información como (identación, longitud de las líneas, espaciado, ... ). Vamos a intentar usarla en estas notebooks. 

In [28]:
# ejemplo en la guía de estilo:
x=x+y
x = x + y

### Comentarios

Las líneas se ejecutan en orden secuencial dentro de una celda. Si **no** queremos que se ejecute alguna línea ponemos `#` delante. Todo lo que hay detrás de una almohadilla no se ejecuta. Muy útil para comentar el código

In [98]:
# Sumamos dos valores
5 + 3 

8

In [99]:
x + 3   # hacemos otra operación

38

### Built-in functions
Cualquier función en python se ejecuta con el nombre de la función y paréntesis: nombre_funcion(). Python tiene algunas básicas predefindas:

In [29]:
print("hello world")
# nos sirve para ver resultados en cualquier momento
print()

hello world


In [190]:
# Los prints pueden tener concatenarse
print("tengo", 20, "años")

tengo 20 años


In [191]:
x = 20
print(f"tengo más de {x} años")

tengo más de 20


In [196]:
x = 20
print("tengo bastante más de {} años".format(20))

tengo bastante más de 20 años


Otras funciones muy útiles es help() que te permite ver información de una función:

In [198]:
help(print)

Help on built-in function print in module builtins:

print(*args, sep=' ', end='\n', file=None, flush=False)
    Prints the values to a stream, or to sys.stdout by default.
    
    sep
      string inserted between values, default a space.
    end
      string appended after the last value, default a newline.
    file
      a file-like object (stream); defaults to the current sys.stdout.
    flush
      whether to forcibly flush the stream.



o de una variable:

In [1]:
y = 5.4
help(y)

Help on float object:

class float(object)
 |  float(x=0, /)
 |  
 |  Convert a string or number to a floating point number, if possible.
 |  
 |  Methods defined here:
 |  
 |  __abs__(self, /)
 |      abs(self)
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __bool__(self, /)
 |      True if self else False
 |  
 |  __ceil__(self, /)
 |      Return the ceiling as an Integral.
 |  
 |  __divmod__(self, value, /)
 |      Return divmod(self, value).
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __float__(self, /)
 |      float(self)
 |  
 |  __floor__(self, /)
 |      Return the floor as an Integral.
 |  
 |  __floordiv__(self, value, /)
 |      Return self//value.
 |  
 |  __format__(self, format_spec, /)
 |      Formats the float according to format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getnewargs__(self, /)
 |  
 |  __gt__(sel

Y algunas otras funciones útiles básicas

In [203]:
x = [2, 3, 4, 1, -2]
# función que encuentra el máximo
max(x)

4

In [205]:
min(x)

-2

In [206]:
len(x)

5

In [207]:
help(len)

Help on built-in function len in module builtins:

len(obj, /)
    Return the number of items in a container.



[Aquí](https://docs.python.org/3/library/functions.html) podéis ver la lista de funciones predefinidas (built-in functions) de Python. 

### Errores 
Si algo falla sale un error que suele ir acompañado de una explicación y la linea donde está el error. Esto simplifica el *debugging*.

In [7]:
a = 2 * 3
pritn(a) # Suma de dos numeros

NameError: name 'pritn' is not defined

In [8]:
b = 12
a = b * 2
a / 0

ZeroDivisionError: division by zero

# 2. Data types
Hay distintas estructuras para guardar datos en **Pyhton**. Aquí vemos las más comunes: 

*Text Type:*	str

*Numeric Types:*	int, float, complex

*Boolean Type:* True or False

*Sequence Types:*	list, tuple

*Mapping Type:*	dict

## 2.1 Tipos numéricos
Tipos númericos hay **enteros**, **floats** (o reales de doble precisión) y **complejos**. A diferencia de otros lenguajes de programación, los tipos quedan definidos directamente con el valor de la variable. En este caso podemos hacer operaciones matemáticas básicas:

In [208]:
# Tenemos enteros, reales y complejos
hijos = 3
temperatura = 22.3
onda = complex(2, 3)  # --> 2+3i
# detecta tipo automáticamente
type(hijos), type(temperatura), type(onda)

(int, float, complex)

In [209]:
# Ejemplo
complex(3,4)

(3+4j)

In [214]:
# podemos hacer varios cálculos 
x = 1; y = 2.3; z = complex(2,3)
print(x + y)
# dividr / multplicar * exponente **, con print escribimos
print(x / y)
print(y * x)
print(f'el cuadrado de {y} es {y ** 2}')
print(f'el cuadrado de {z} es {z ** 2}')  #(2+3i)(2-3i)

3.3
0.4347826086956522
2.3
el cuadrado de 2.3 es 5.289999999999999
el cuadrado de (2+3j) es (-5+12j)


In [3]:
# podemos pasar de entero a real y al revés

X = 1
print(type(X))
X = 1.1
type(X)

<class 'int'>


float

In [41]:
print(y)
print(int(y))
print(type(int(y)))

2.3
2
<class 'int'>


## 2.2 Strings 
Las strings son variables de texto, útiles para cabeceras, análisis de texto, etc. Y se escriben entre comillas, simples o dobles. 

In [1]:
s = 'Santander' # en inglés se suele usar ""

Pero no operan como las variables númericas:

In [2]:
print(2 * s)

SantanderSantander


In [3]:
s.

SyntaxError: invalid syntax (2427568860.py, line 1)

Para python es lo mismo una palabra que una frase solo que hay caracteres espacio en blaco. Por ejemplo:

In [222]:
text = 'En Santander hay mar. Y llueve mucho.'

In [223]:
text*2

'En Santander hay mar. Y llueve mucho.En Santander hay mar. Y llueve mucho.'

Una frase la podemos separar por puntos por ejemplo con split

In [224]:
text.split('.')

['En Santander hay mar', ' Y llueve mucho', '']

In [226]:
# podríamos hacer lo mismo con la palabra Santander separada por la letra "a"
s.split('a')

['S', 'nt', 'nder']

In [19]:
# reemplazar texto
text.replace('Santander', 'Torrelavega') #+ " ;-)"


'En Torrelavega hay mar'

Y muchas más podéis ver todos los métodos de la clase *string* [aquí](https://www.w3schools.com/python/python_ref_string.asp).

## 2.3 Variables lógicas
Las variables lógicas tienen valores **True** o **False**, muy útiles cuando establecemos condiciones:

In [4]:
# variables lógicas
x = 3

y = 4 > x
print(y)

z = 'manzana' == 'pera'
print(z)


# y, z son variables lógicas, que serán útiles para establecer condiciones

True
False


Estas variables son muy útiles por ejemplo para decidir en qué condiciones se ejecuta código:

In [7]:
fruta = "mandarina"

if len(fruta) <= 7:
    print('Condición 1 se cumple')
if len(fruta) <= 4:
    print('Condición 2 se cumple')

## 2.4 Listas

Las listas son una estrucutras de varios elementos, con estas características:


In [8]:
# las listas se escriben entre corchetes

lista = []  # lista vacía

print(type(lista))

<class 'list'>


In [9]:
a_list = [4, 2, 3, 2] # lista con valores
print(l)
print(type(a_list))

NameError: name 'l' is not defined

Las listas son estructuras **ordenadas** es decir que podemos acceder a un elemento por su posición. En **Python** la primera posición de cualquier estructura ordenada siempre es la 0. 

In [10]:
print('lista entera', a_list)
print('primer elemento es --> ',a_list[0])
print('cuarto elemento es --> ', a_list[3])
print('último elemento es --> ', a_list[-1])  # con -1 accedemos al último elemento (N-1)

lista entera [4, 2, 3, 2]
primer elemento es -->  4
cuarto elemento es -->  2
último elemento es -->  2


In [11]:
# El orden importa
b_list = [2, 3, 4, 2]
b_list is a_list   # equivalente b_list == a_list

False

In [12]:
# tiene varias funciones como contar elementos,encontrar el índice,...
b_list.count(3)

1

In [None]:
b_list.

Las listas son estructuras **heterogéneas**, es decir, que pueden contener valores de distintos tipos. Ejemplo encuesta sobre cuantos minutos de ejercicio haces al día :

In [14]:
fitTime = [20, 40, 22, "NS/NC", 0, '', [20,20]] # lista hereogenea ser heterogeneas 
print(f"The list is:\n\t{fitTime}")
print(f'Type is {type(fitTime)}')



The list is:
	[20, 40, 22, 'NS/NC', 0, '', [20, 20]]
Type is <class 'list'>


Una lista es una estructura **mutable**, es decir que su contenido se puede cambiar. Para eso hay varios métodos implementados para listas. Por ejemplo, podemos añadir elementos de una lista al final con `append`, en cualquier posición con `insert`. 

In [15]:
fitTime[0]  = 15
print("After changign first element:\n\t{}".format(fitTime))

After changign first element:
	[15, 40, 22, 'NS/NC', 0, '', [20, 20]]


In [122]:
# Añadirmos un valor al final de la lista
fitTime.append('mucho')
print("After appending 'casa':\n\t{}".format(fitTime))

After appending 'casa':
	[15, 40, 22, 'NS/NC', 0, '', [20, 20], 'mucho']


También podemos eliminar elemento de una lista con `remove`. 

In [16]:
# Eliminamos el elemento vacío
fitTime.remove(15)
print("After removing 'empty':\n\t{}".format(fitTime))

After removing 'empty':
	[40, 22, 'NS/NC', 0, '', [20, 20]]


Podéis ver todos los métodos para listas [aquí](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists) o bien escribe el nombre de dicha variable seguida de un `.` y usa el tabulador. 

In [186]:
fitTime.

SyntaxError: invalid syntax (391235524.py, line 1)

## 2.5 Tuplas
Las tuplas son agrupaciones **ordenadas** de elementos, **hetereogeneas** pero son **immutables**. No podemos modificar sus elementos, ni eliminar ni añadir. Son más eficientes computacionalmente (iteraciones más rápidas, consumen menos memoria y menos suscepitble a errores) pero es poco flexible para operar y tiene pocas métodos asociados.  

Muy utilizado al cargar datos de un archivo, retorno de funciones.  

In [18]:
lista = [1, 2, 3]
tupla = (1, 2, 3)
lista == tupla

False

In [19]:
# Mientras que la lista se puede cambiar 
print(lista[0])
lista[0] = -1
print(lista)

1
[-1, 2, 3]


In [20]:
# La tupla no
print(tupla[0])
tupla[0] = -1
print(tupla)

1


TypeError: 'tuple' object does not support item assignment

In [127]:
# También se pueden omitir los paréntesis pero es menos usual
tupla2 = 1, 2, 3
tupla == tupla2

True

Si queremos cambiarla podemos pasarla a lista y al revés:

In [21]:
# tup = (3,4)
fitTime = tuple([20, 40, 22, "NS/NC", 0, '', [20,20]])
print(f'Tipo de fitTime ahora es {type(fitTime)}')
fitTime[0] = '15'


Tipo de fitTime ahora es <class 'tuple'>


TypeError: 'tuple' object does not support item assignment

In [None]:
# Arhoa tenemos muy pocas funciones:
fitTime.

¿Cuando es interesante usar una tupla? Cuando leemos datos externos, es una buena costumbre guardarlos en tuplas para que no los modifiquemos

## 2.6 Diccionarios
Los diccionarios en Python son colecciones muy útiles para guardar información de datasets complejos.  

Son colecciones con parejas **valor-clave**. Las claves solo pueden aparecer una única vez y tienen un valor asociado. Son mutables con sus correspondientes operaciones básicas ya implementadas. Son muy útiles para guardar datos y se usan en muchos formatos, ej. `json`.


In [25]:
# se definen con llaves {}
# Creamos un diccionario
dict_0 = {"a": 1, "b": 1, "c": 2}
dict_0

{'a': 1, 'b': 1, 'c': 2}

Los diccionarios son muy útiles cuando tenemos objetos principales con una serie de propiedades. Por ejemplo, precios de productos:

In [26]:
prices = {'oranges': 1.12, 'apples': 1.5, 'tomatoes': 1.7}
prices

{'oranges': 1.12, 'apples': 1.5, 'tomatoes': 1.7}

pueden ser **heterogeneos**

In [27]:
prices = {"oranges" : 1, "apples" : 1.5, "tomatoes" : "not available"}
prices

{'oranges': 1, 'apples': 1.5, 'tomatoes': 'not available'}

**No importa el orden**, accedemos a ellos no mediante posición, si no mediante el nombre de la clave:

In [28]:

# los diccionarios no tienen orden
prices_1 = {'oranges': 1.12, 'apples': 1.5, 'tomatoes': 1.7}
prices_2 = {'apples': 1.5, 'oranges': 1.12, 'tomatoes': 1.7}

print(products_1 == products_2)

NameError: name 'products_1' is not defined

In [29]:
prices_1[0]

KeyError: 0

In [30]:
prices_1["oranges"]

1.12

Son **mutables** por lo que podemos añadir y eliminar elementos. 

In [31]:
# Añadimos elemento con llave d y valor 40
prices["banana"] = 2.1
print("After adding d, dict_0 is:\n\t{}".format(prices))

After adding d, dict_0 is:
	{'oranges': 1, 'apples': 1.5, 'tomatoes': 'not available', 'banana': 2.1}


In [32]:
# Actualizamos uno de los elementos ya definidos:
prices['tomatoes'] = 1.8
print("After updating a, dict_0 is:\n\t{}".format(prices))

After updating a, dict_0 is:
	{'oranges': 1, 'apples': 1.5, 'tomatoes': 1.8, 'banana': 2.1}


Podemos recuperar todas las claves de un diccionario con `keys`, los valores con `values`y ambos con `items`:

In [33]:
# vemos las claves con keys
prices.keys()


dict_keys(['oranges', 'apples', 'tomatoes', 'banana'])

In [34]:
# vemos los valores
prices.values()

dict_values([1, 1.5, 1.8, 2.1])

In [165]:
list(prices.values())

[1.8, 1.5, 1.8, 2.1]

In [35]:
# vemos los los elementos
prices.items()

dict_items([('oranges', 1), ('apples', 1.5), ('tomatoes', 1.8), ('banana', 2.1)])

In [18]:
prices.

SyntaxError: invalid syntax (17920272.py, line 1)

Para ver en detalle todos los métodos implementados para diccionarios podéis verlo [aquí](https://docs.python.org/3.8/library/stdtypes.html#dict). Son menos intuitivos de usar pero muy prácticos y eficientes cuando los conoces bien. 



## Arrays y Dataframes 
Aquí hemos visto los tipos típicos de **Python** pero hay paquetes que tienen sus propios tipos como por ejemplo vectores (o arrays) en **NumPy**, dataframes en **Pandas** que veréis más adelante.

# 3. Ejercicios para practicar
Os dejamos aquí unos cuantos ejercicios, se pueden hacer con lo que acabamos de ver y/o mirando los links que se dan en este notebook. 


**1.**- Tomamos los datos de temperatura del mes pasado de la AEMET.  Vas a hacer algunas pruebas pero no quieres que se modifique nada. ¿Qué estructura usarías para cargarlos? 

datos -->  6.4902453,
 6.0602455,
 5.5602455,
 4.630245,
 3.6602454,
 3.8802452,
 'nan',
 3.6502452,
 3.1102452,
 2.7302456,
 2.5102453,
 2.4402454,
 4.2502456,
 6.5302453,
 8.290245,
 10.090245,
 11.3102455,
 12.100245,
 10.530245,
 'nan',
 7.3002453

Queremos operar con los datos y quitar los 'nan' numbers. ¿Qué procedimiento seguirías?
**para discutir**

In [38]:
# Codigo
lista = [6.4902453, 6.0602455, 5.5602455, 4.630245, 3.6602454, 3.8802452, 'nan', 3.6502452, 3.1102452, 2.7302456, 2.5102453, 2.4402454, 4.2502456, 6.5302453, 8.290245, 10.090245, 11.3102455, 12.100245, 10.530245, 'nan', 7.3002453]
lista.remove('nan')
print(lista)

[6.4902453, 6.0602455, 5.5602455, 4.630245, 3.6602454, 3.8802452, 3.6502452, 3.1102452, 2.7302456, 2.5102453, 2.4402454, 4.2502456, 6.5302453, 8.290245, 10.090245, 11.3102455, 12.100245, 10.530245, 'nan', 7.3002453]


**2.** Tenéis una serie de información sobre distintas frutas y verduras, su precio, su calidad y su procedencia. Que estructura usarías para guardar esos datos? De tal manera que sea la más óptima para luego acceder a la información?

Datos:

  **Fruta, precio (€/kg), calidad, procedencia**

    Naranjas, 1.12, normal, españa
    Tomate pera, 1.5, baja, sudáfrica
    Tomate ensalada, 2.9, alta, españa
    Patata, 1.7, normal, españa
    Anchoas, 8, alta, españa

Contesta con código:
- que calidad tiene el tomate de ensalada
- que precio y procedencia tienen las anchoas
- comprueba si el tomate pera viene de sudáfrica (usa una variable lógica)
- y si la patata está más barata de 2 €/kg
**para discutir**

In [45]:
# Escribe código

info_frutas = [{"nombre": "naranja", "precio": 1.12, "calidad": "normal", "procedencia": "España"}, 
               {"nombre": "tomate pera", "precio": 1.5, "calidad": "baja", "procedencia": "Sudáfirca"},]
info_frutas[1].values()

dict_values(['tomate pera', 1.5, 'baja', 'Sudáfirca'])

In [50]:
frutas_dict = {"naranjas": {"precio": 1.12, "calidad": "normal", "procedencia": "España"}, 
               "tomate pera" : {"precio": 1.5, "calidad": "baja", "procedencia": "Sudáfirca"}}

In [56]:
frutas_dict["naranjas"]["precio"]

1.12

In [55]:
dict_naranja["precio"]

1.12

**3.**- Escribe un diccionario con 5 ciudades y su número de habitantes. 

2.1 Añade dos ciudades más 

2.2 Muestra sólo las ciudades del diccionario. 

In [181]:
# Escribe código


**4.**- Opera en la lista_1 para obtener lista_2


In [182]:
lista_1 = ['Rojo', 'Verde', 'Blanco', 'Rosa', 'Amarillo']
lista_2 = ['Verde', 'Blanco', 'Negro']
 
# escribe el código

In [183]:
# escribe el código

**5.**- Une los siguientes diccionarios en uno, muestra las claves y los valores por separado (se concatena con `update`, pero busca en la documentación como hacerlo)

In [184]:
dic1 = {"uno" : 10, "dos" : 20}
dic2 = {"tres" : 30, "cuatro" : 40}
dic3 = {"cinco" : 50, "seis" : 60}

# concatena el diccionario

In [None]:
# Escribe código