#Funcions

Les funcions són el mètode d'organització i reutilització del codi més important. Com a norma general, si preveiem que farem servir el mateix codi, o un de molt semblant més d'una vegada, pot valer la pena escriure una funció reutilitzable. Les funcions també ajuden a fer el codi més llegible, donant un nom a un grup de sentències Python.

Les funcions es declaren amb la paraula reservada `def` i s'especifica el valor retornat amb `return`.

In [None]:
def major(x, y):
  if (x>=y):
    return x
  else:
    return y

És habitual, com en l'exemple anterior, tenir múltiples sentències `return`. Si una funció arriba al final sense haver trobat cap `return`, retorna `None` automàticament.

Quan cridam una funció, podem passar els arguments posicionalment (segons l'ordre en què han estat definits) o emprant el seu nom (keyword). Per exemple:

In [None]:
major(2,3)

3

In [None]:
major(x=5,y=3)

5

També podem definir arguments opcionls, als quals haurem de donar un valor per defecte. Per exemple, la següent funció calcula la suma entre dos números (x i y). Però té dos arguments opcionals (pesx, pesy) que ens permeten donar un pes diferent a cada un dels dos números.

In [None]:
def suma_ponderada(x, y, pesx=1, pesy=1):
  return (x*pesx+y*pesy)

Vegem com fem la crida sense donar pesos, on el que tenim és una suma "normal":

In [None]:
suma_ponderada(6,9)

15

O donan-li, posicionalment:

In [None]:
suma_ponderada(6,9,3,2)

36

O mitjançant el nom, donant només un dels pesos:

In [None]:
suma_ponderada(6,9,pesy=2)

24

La principal restricció dels arguments de les funcions és que els arguments de keyword han de seguir els arguments posicionals. Es poden especificar els arguments de *keyword* en qualsevol ordre; això ens allibera d'haver de recordar l'ordre en què es varen especificar els arguments a la funció i basta recordar-ne el nom. Per exemple:

In [None]:
suma_ponderada(y=9,x=6,pesy=2,pesx=3)

36

##Espai de noms, àmbit i funcions locals

Les funcions poden accedir a variables de dos àmbits distints: **global** i **local**. Un nom més descriptiu per als àmbits de les variables en Python és l'espai de noms (*namespace*). Les variables assignades dins una funció, per defecte s'associen a l'espai de noms local. L'espai de noms local es crea quan es crida la funció i s'omple immediatament amb els arguments de la funció. Després que la funció acaba, l'espai de noms local es destrueix (amb algunes excepcions). Considerem la funció següent.

In [None]:
def funcio():
  a = []
  for i in range(5):
    a.append(i)

a=[]
funcio()
print(a)

[]


Quan s'invoca funcio(), es crea la llista buida a, s'hi afegeixen cinc elements, i a es destrueix quan se surt de la funció. En canvi, suposem que s'ha delcarat a de la forma següent.

In [None]:
def funcio():
    for i in range(5):
        a.append(i)

a=[]
funcio()
a

[0, 1, 2, 3, 4]

Es poden assignar variables fora de l'àmbit de la funció, però aquestes variables s'han de declarar globals amb la paraula reservada `global`.

In [None]:
a = None

def lliga_a():
    global a
    a = []

lliga_a()
print(a)

[]


En general no s'aconsella l'ús de la variable `global`. Normalment les variables globals s'usen per emmagatzemar qualque mena d'estat d'un sistema. Si n'hi ha moltes, això pot indicar que convé fer servir la programació orientada a l'objecte, amb classes.

## Retorn de múltiples valors

Es poden tornar múltiples valors d'una funció amb una sintaxi simple. Vegem-ne un exemples.

In [None]:
def f():
    a = 3
    b = 4
    c = 5
    return a,b,c

a,b,c=f()

En anàlisi de dades i aprenentatge automàtic, ens podem trobar fent això sovint. Aquí la funció està retornant un sol objecte, però és una tupla, que després es pot desplegar en les variables resultat. En l'exemple d'abans, també ho podríem haver escrit així.

In [None]:
valor_de_retorn = f()

I ara valor_de_retorn seria una tupla de tres elements amb les tres variables retornades. Una alternativa interessant, segons què hàgim de fer, és retornar un diccionari.

In [None]:
def f():
   a = 3
   b = 4
   c = 5
   return {'a': a, 'b': b, 'c': c}

##Les funcions són objectes

Com que les funcions Python són objectes, hi ha construccions fàcils d'expressar que en altres llenguatges són complicades.

Imaginem que hem d'aplicar una sèrie de transformacions a una llista de cadenes com la següent.

In [None]:
poblacions = [' Palma, ','   manacor. ', ' Barcelona!', 'València?']

Aquí cal compondre un parell de coses: llevar els espais en blanc, els signes de puntuació, posar la primera lletra en majúscula... Una forma d'aconseguir-ho és usar els mètodes predefinits de cadenes amb el mòdul de la llibreria estàndard **re** (*regular expressions*).

In [None]:
import re

def clean_strings(strings):
    result=[]
    for value in strings:
        value = value.strip()   # lleva espais en blanc inicials i finals
        value = re.sub('[?,.;:!]','',value) # substitueix els signes de puntuació per no-res
        value = value.title() # posa la primera lletra en majúscula
        result.append(value) # afegeix el valor net a la llista
    return result

El resultat serà el següent.

In [None]:
print(clean_strings(poblacions))

['Palma', 'Manacor', 'Barcelona', 'València']


Una alternativa és fer una llista de les operacions que volem aplicar a una llista de cadenes.

In [None]:

def remove_punctuation(value):
    return re.sub('[?,.;:!]','',value)

#Aquí és on s'usen les funcions com a objectes
clean_ops = [str.strip, remove_punctuation, str.title]

def clean_strings(cadenes, ops):
    result = []
    for value in cadenes:
        for function in ops:
            value = function(value)
        result.append(value)
    return result


Aleshores, tenim això.

In [None]:
print(clean_strings(poblacions, clean_ops))

['Palma', 'Manacor', 'Barcelona', 'València']


Un patró més funcional, com aquest, permet modificar fàcilment com es transformen les cadenes, a alt nivell. La funció `clean_strings` ara és més reutilitzable i genèrica.

Es poden passar les funcions com a arguments a altres funcions, com la funció predefinida `map`, que aplica una funció a una seqüència de qualque tipus.

In [None]:
for x in map(remove_punctuation, poblacions):
    print(x)

 Palma 
   manacor 
 Barcelona
València


##Funcions Lambda (anònimes)

Python dona suport a les funcions anònimes, o lambda, que són una forma d'escriure funcions d'una sola línia, el resultat de la qual és el valor de retorn. S'escriuen amb la paraula reservada `lambda`, que significa "estam declarant una funció anònima".

In [None]:
def doble_func(x):
    return 2*x

doble_anon = lambda x: 2*x

doble_anon(3) == doble_func(3)

True

Les funcions lambda són molt útils en anàlisi de dades, perquè moltes vegades les funcions de transformació de dades prenen funcions com a arguments. Sovint és més breu i clar passar una funció lambda com a argument que no escriure una declaració de funció completa o assignar una funció lambda a una variable local. Per exemple, considerem aquest codi.

In [None]:
def apply_to_list(llista,func):
    return [func(item) for item in llista]

dades = [0,1,2,3,4]

apply_to_list(dades,lambda x: 2*x)

[0, 2, 4, 6, 8]

In [None]:
apply_to_list(dades,lambda x: x/2)

[0.0, 0.5, 1.0, 1.5, 2.0]

O aquest altre, en què ordenam les paraules d'una llista pel nombre de lletres diferents que tenen.

In [None]:
strings = ['llimoneres','unes', 'ara']

strings.sort(key=lambda x: len(set(list(x))))
strings

['ara', 'unes', 'llimoneres']

Aquí s'ha aprofitat la característica dels conjunts que els seus elements són únics, sense repeticions.

#Currying

Currying, o aplicació d'arguments parcials és una operació que rep el nom del matemàtic Haskell Curry. Es tracta de construir una funció aprofitant-ne una altra de més general i passant-hi algun argument com a constant. Per exemple, podem construir les funcions `anterior` i `posterior` a partir de la funcio `suma` de la manera següent, o `oposat` en funció de la resta.

In [None]:
suma = lambda x,y: x+y

previ = lambda x: suma(x,-1)
següent = lambda x: suma(x,1)

resta = lambda x,y: x-y

oposat = lambda x: resta(0,x)

In [None]:
oposat(-10)

10

In [None]:
previ(3)

2

In [None]:
següent(10) # no hi ha problema amb la dièresi

11

#Iteradors

Una característica important de Python és que té una manera consistent d'iterar sobre les seqüències, com els objectes d'una llista o les línies d'un fitxer.

Això s'aconsegueix amb el protocol **iterator**, una forma genèrica de fer els objectes iterables.

Per exemple, iterar sobre un diccionari dona les claus del diccionari.

In [None]:

dicc = {'a': 1, 'b': 2, 'c': 3}
for key in dicc:
    print(key)


a
b
c


I si volguéssim obtenir els valors, ho faríem de manera molt semblant:

In [None]:
dicc = {'a': 1, 'b': 2, 'c': 3}
for key in dicc:
    print(dicc[key])

1
2
3


Quan escrivim `for key in dicc`, l'intèrpret de Python intenta crear un iterador a partir de `dicc`:



In [None]:
dicc_iterator = iter(dicc)
dicc_iterator


<dict_keyiterator at 0x7a960df6a9d0>

Un iterador és un objecte que dona objectes a l'intèrpret Python quan s'usa en un context com el d'un bucle `for`. La majoria de mètodes que esperen una llista o un objecte com una llista també acceptaran qualsevol objecte iterable. Això inclou mètodes predefinits com `min`, `max`, i `sum`, i constructors de tipus com `list` i `tuple`.

In [None]:
list(dicc_iterator)

['a', 'b', 'c']

Un **generador** és una forma compacta de construir un nou objecte iterable. Mentre que les funcions normals s'executen i retornen un resultat cada vegada, els generadors retornen una seqüència de resultats múltiples de forma peresosa, fent una pausa després de cada un fins que es demana el següent. Per crear un generador, s'usa la paraula reservada `yield` en comptes de `return` en una funció.




In [None]:
def squares(n=10):
    print("Generant els quadrats d'1 a {0}".format(n ** 2))
    for i in range(1, n + 1):
        yield i ** 2

Quan s'invoca el generador, no s'executa cap codi immediatament.

In [None]:
gen = squares()
gen


<generator object squares at 0x7a95f987b450>

No és fins que demanam elements al generador quan es comença a executar el seu codi.

In [None]:
for x in gen:
    print(x, end=' ')

Generant els quadrats d'1 a 100
1 4 9 16 25 36 49 64 81 100 

##Expressions de generadors

Una altra forma encara més compacta de fer generadors és usar una expressió de generador. Això és un generador anàleg a les comprensions de list, dict i set. Per crear-ne un, s'ha d'encloure el que seria una comprensió de llista entre parèntesis en comptes de claudàtors.






In [None]:
gen = (x ** 2 for x in range(100))
gen

<generator object <genexpr> at 0x7a95f987b530>

AIxò és completament equivalent a la versió més llarga següent.

In [None]:
def _make_gen():
  for x in range(100):
    yield x ** 2

gen = _make_gen()
gen


<generator object _make_gen at 0x7a95f987b140>

Les expressions de generador es poden fer servir en lloc de les comprensions de llistes com a arguments de funció en molts de casos.

In [None]:
sum(x ** 2 for x in range(100))

328350

In [None]:
dict((i, i **2) for i in range(5))

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

In [None]:
set((i, i**2) for i in range(5))

{(0, 0), (1, 1), (2, 4), (3, 9), (4, 16)}

##Mòdul itertools

El mòdul `itertools` de la llibreria estàndard té una col·lecció de generadors per a molts d'algorismes de dades habituals. Per exemple, `groupby` pren una seqüència i una funció, i agrupa els elements consecutius de la seqüència segons el valor de retorn de la funció.

Aquí en tenim un exemple.


In [None]:
import itertools

first_letter = lambda x: x[0]

names = ['Mallorca', 'Menorca', 'Eivissa', 'Formentera', 'Cabrera', 'Còrsega','Sicília','Sardenya','Malta']
for letter, names in itertools.groupby(names, first_letter):
    print(letter, list(names)) # names is a generator

M ['Mallorca', 'Menorca']
E ['Eivissa']
F ['Formentera']
C ['Cabrera', 'Còrsega']
S ['Sicília', 'Sardenya']
M ['Malta']


La taula següent mostra algunes funcions útils del mòdul `itertools`.

|Funció|Descripció|
|-|-|
|`combinations(iterable, k)` | Genera una seqüència de totes les k-tuples possibles d'elements de l'iterable, ignorant l'ordre i sense reemplaçament (vegeu també la funció `combinations_with_replacement`)|
|`permutations(iterable, k)`| Generates a sequence of all possible k-tuples of elements in the iterable, respecting order |
|`groupby(iterable[, keyfunc])`| Generates (key, sub-iterator) for each unique key|
|`product(*iterables, repeat=1)`| Generates the Cartesian product of the input iterables as tuples, similar to a nested for loop|