01 Introducció a *Python*
============================

### Instruccions d'ús

A continuació es presentarà la sintaxi bàsica del llenguatge de
programació Python juntament amb exemples interactius.

Variables i tipus de variables
------------------------------

Podem entendre una variable com un contenidor en el qual podem posar les nostres
dades a fi de guardar-les i tractar-les més endavant. A Python, les
variables no tenen tipus, és a dir, no hem d'indicar si la variable serà
numèrica, un caràcter, una cadena de caràcters o una llista, per
exemple. A més, les variables poden ser declarades i inicialitzades en
qualsevol moment, a diferència d'altres llenguatges de programació.

Per declarar una variable, fem servir l'expressió *nom_de_variable
= valor*. Es recomana repassar el document [PEP-8](https://www.python.org/dev/peps/pep-0008/#function-and-variable-names) per indicar noms de variables correctes, però, *grosso modo*,
evitarem utilitzar majúscula a la inicial, separarem les diferents
paraules amb el caràcter «_» i no utilitzarem accents ni caràcters
específics de la nostra codificació com el símbol del «€» o la «ñ», per
exemple.

Vegem uns quants exemples de declaracions de variables i com fer-les servir:

In [None]:
# Declarem una variable de nom 'variable_numerica' que conté el valor enter 12.
variable_numerica = 12

# Declarem una variable de nom monstre que conté el valor 'Godzilla'.
monstre = 'Godzilla'

# Declarem una variable de nom 'planetes' que és una llista de cadenes de caràcters.
planetes = ['Mercuri', 'Venus', 'Terra', 'Mart']

In [None]:
la_meva_edat = 25
la_meva_edat_en_5 = la_meva_edat + 5
# 'Imprimim' el valor calculat que serà, efectivament, 30
print(la_meva_edat_en_5)

Els tipus nadius de dades que una variable de Python pot contenir són:
nombres enters (int), nombres decimals (float), nombres complexos
(complex), cadena de caràcters (string), llistes (list), tuples (tuple)
i diccionaris (dict). Vegem un per un cada un d'aquests tipus:

In [None]:
# Un nombre enter
int_var = 1
another_int_var = -5
# Podem sumar-los, restar-los, multiplicar-los o dividir-los.
print(int_var + another_int_var)
print(int_var - another_int_var)
print(int_var * another_int_var)
print(int_var / another_int_var)

# També podem realitzar la divisió entera.
# Com que només tractem amb nombres enters, no hi haurà part decimal.
print(int_var // another_int_var)

El comportament de l'operador `/` és una de les diferències entre Python 2 i Python 3. Mentre que en Python 3, l'operador `/` realitza la divisió real entre dos nombres enters (fixeu-vos que `1 / -5` dóna com a resultat `0.2`), en Python 2 realitzava la divisió entera (per la qual cosa el resultat d'executar` 1 / -5` en Python 2 seria `-1`). Noteu que usem l'operador `//` per expressar la divisió entera en Python 3.

In [None]:
# Un nombre decimal o 'float'
float_var = 2.5
another_float_var = .7
# Convertim un nombre enter en un de decimal mitjançant la funció 'float() '
encore_float = float(7)
# Podem fer el mateix en sentit contrari amb la funció 'int()'
new_int = int(encore_float)

# Podem fer les mateixes operacions que en el cas dels nombres enters, però en aquest cas la divisió serà
# decimal si algun dels nombres és decimal.
print(another_float_var + float_var)
print(another_float_var - float_var)
print(another_float_var * float_var)
print(another_float_var / float_var)
print(another_float_var // float_var)

In [None]:
# Un nombre complex
complex_var = 2+3j
# Podem accedir a la part imaginària o a la part real:
print(complex_var.imag)
print(complex_var.real)

In [None]:
# Cadena de caràcters
my_string = 'Hello, Bio! ñç'
print(my_string)

Fixeu-vos que podem incloure caràcters unicode (com `ñ`o`ç`) a les cadenes. Això també és una novetat de Python 3 (les variables de tipus `str` són ara UTF-8).

In [None]:
# Podem concatenar dues cadenes utilitzant l'operador '+'.
same_string = 'Hello, ' + 'Bio' + '!' + ' ñc'
print(same_string)

# A Python també podem utilitzar wildcards com en la funció 'sprintf' de C. Per exemple:
name = "Guido"
num_emails = 5
print("Hello, %s! You've got %d new emails" % (name, num_emails))

A l'exemple anterior, hem substituït a l'_string_ la cadena *%s* pel
contingut de la variable *name*, que és un _string_, i *%d* per
*num_emails*, que és un nombre enter. També podríem utilitzar *%f* per
a nombres decimals (podríem indicar la precisió, per exemple, amb *%5.3f*, el nombre tindria una mida total de cinc xifres i tres serien per
la part decimal). Hi ha moltes altres possibilitats, però haurem de
tenir en compte el tipus de variable que volem substituir. Per exemple,
si utilitzem *%d* i el contingut és _string_, Python retornarà un
missatge d'error. Per evitar aquesta situació, es recomana l'ús de la
funció *str()* per convertir el valor a _string_.

També podem mostrar el contingut de les variables sense especificar el seu tipus, fent servir `format`:

In [None]:
print("Hello, {}! You've got {} new emails".format(name, num_emails))

Ara presentarem altres tipus de dades nadius més complexos: llistes,
tuples i diccionaris:

In [None]:
# Definim una llista amb el nom dels planetes (string).
planets = ['Mercury', 'Venus', 'Earth', 'Mars',
           'Jupiter', 'Saturn', 'Uranus', 'Neptune']
# També pot contenir números.
prime_numbers = [2, 3, 5, 7]

# Una llista buida
empty_list = []

# O una barreja de qualsevol tipus:
sandbox = ['3', 'a string', ['a list inside another list', 'second item'], 7.5]
print(sandbox)

In [None]:
# Podem afegir elements a una llista.
planets.append('Pluto')
print(planets)

In [None]:
# O en podem eliminar.
planets.remove('Pluto')
print(planets)

In [None]:
# Podem eliminar qualsevol element de la llista.
planets.remove('Venus')
print(planets)

In [None]:
# Sempre que n'afegim, serà al final de la llista. Una llista està ordenada.
planets.append('Venus')
print(planets)

In [None]:
# Si volem ordenar-la alfabèticament, podem utilitzar la funció 'sorted()'
print(sorted(planets))

In [None]:
# Podem concatenar dues llistes:
monsters = ['Godzilla', 'King Kong']
more_monsters = ['Cthulu']
print(monsters + more_monsters)

In [None]:
# Podem concatenar una llista amb una altra i guardar-la a la mateixa llista:
monsters.extend(more_monsters)
print(monsters)

In [None]:
# Podem accedir a un element en concret de la llista:
print(monsters[0])
# El primer element d'una llista és el 0, per tant, el segon serà l'1:
print(monsters[1])
# Podem accedir a l'últim element mitjançant nombres negatius:
print(monsters[-1])
# Penúltim:
print(monsters[-2])

In [None]:
# També podem obtenir parts d'una llista mitjançant la tècnica de 'slicing'.
planets = ['Mercury', 'Venus', 'Earth', 'Mars',
           'Jupiter', 'Saturn', 'Uranus', 'Neptune']
# Per exemple, els dos primers elements:
print(planets[:2])

In [None]:
# O els elements entre les posicions 2 i 4
print(planets[2:5])

Fixeu-vos en aquest últim exemple: en la posició 2 trobem el tercer element de la llista (`'Earth'`) ja que la llista comença a indexar en 0. A més, l'últim element indicat (la posició` 5`) no s'inclou.

In [None]:
# O els elements del segon al penúltim:
print(planets[1:-1])

La tècnica de _**slicing**_ és molt important i ens permet gestionar
llistes d'una manera molt senzilla i potent. Serà imprescindible
dominar-la per afrontar molts dels problemes que haurem de resoldre en el camp de
la ciència de dades.

In [None]:
# Podem modificar un element en concret d'una llista:
monsters = ['Godzilla', 'King Kong', 'Cthulu']
monsters[-1] = 'Kraken'
print(monsters)

In [None]:
# Una tupla és un tipus molt semblant a una llista, però és immutable, és a dir, un cop declarada 
# no podem afegir-hi elements ni eliminar-ne:
birth_year = ('Stephen Hawking', 1942)
# Si executem la línia següent, obtindrem un error de tipus 'TypeError'
birth_year[1] = 1984

Els errors en Python solen ser molt informatius. Una recerca a internet
ens ajudarà en la gran majoria de problemes que puguem tenir.

In [None]:
# Un string també és considerat una llista de caràcters.
# Així doncs, podem accedir a una posició determinada (tot i que no modificar-la):
name = 'Albert Einstein'
print(name[5])

# Podem fer servir slicing també amb les cadenas de caràcters
print(name[7:15])

# Podem separar pel caràcter que considerem un string. En aquest cas, per l'espai en blanc, utilitzant
# la funció 'split()'.
n, surname = name.split()
print(surname)

# I podem convertir un determinat string en una llista de caràcters fàcilment:
chars = list(surname)
print(chars)

# Per unir els diferents elements d'una llista mitjançant un caràcter, podem utilitzar la funció 
# 'join()':
print(''.join(chars))
print('.'.join(chars))

In [None]:
# L'operador ',' és el creador de tuples. Per exemple, el típic problema d'assignar el valor d'una 
# variable a una altra en Python es pot resoldre en una línia d'una manera molt elegant utilitzant 
# tuples (es tracta d'un idiom):
a = 5
b = -5
a,b = b,a
print(a)
print(b)

L'anterior exemple és un *idiom* típic de Python. A la tercera línia,
creem una tupla (a,b) a la qual assignem els valors un per un de la
tupla (b,a). Els parèntesis no són necessaris, i per això queda una
notació tan reduïda.

Per acabar, presentarem els diccionaris, una estructura de dades molt
útil a la qual assignem un valor a una clau en el diccionari:

In [None]:
# Codis internacionals d'alguns països. La clau o 'key' és el codi de país, i el valor, el seu nom:
country_codes = {34: 'Spain', 376: 'Andorra', 41: 'Switzerland', 424: None}

# Podem buscar
my_code = 34
country = country_codes[my_code]
print(country)

In [None]:
# Podem obtenir totes les claus:
print(country_codes.keys())

In [None]:
# O els valors:
print(country_codes.values())

**És molt important notar que els valors que obtenim de les claus o en
imprimir un diccionari no estan ordenats**. És un error molt comú
suposar que el diccionari es guarda internament en el mateix ordre en
què va ser definit i serà una font d'error habitual no tenir-lo en
compte.

In [None]:
# Podem modificar valors al diccionari o afegir noves claus.

# Definim un diccionari buit. 'country_codes = dict()' és una notació equivalent:
country_codes = {}

# Afegim un element:
country_codes[34] = 'Spain'

# N'afegim un altre:
country_codes[81] = 'Japan'

print(country_codes)

In [None]:
# Modifiquem el diccionari:
country_codes[81] = 'Andorra'

print(country_codes)

In [None]:
# Podem assignar el valor buit a un element:
country_codes[81] = None

print(country_codes)

Els valors buits ens seran útils per declarar una variable que no
sapiguem quin valor o quin tipus de valor contindrà i per fer
comparacions entre variables. Habitualment, els valors buits són _None_ o
'', en el cas de les cadenes de caràcters.

In [None]:
# Podem assignar el valor d'una variable a una altra. És important que s'entenguin les 
# línies següents:
a = 5
b = 1
print(a, b)
# b conté la 'direcció' del contenidor al qual apunta 'a'.
b = a
print(a, b)

In [None]:
# Vegem ara què passa si modifiquem el valor d'a o b:
a = 6
print(a, b)
b = 7
print(a, b)

Fins aquí hem presentat com declarar i utilitzar variables. Recomanem la
lectura de la [documentació oficial en línia](https://docs.python.org/3/tutorial/introduction.html)
per a fixar els coneixements explicats.