# An√°lise de Dados em Python: Introdu√ß√£o ao Python (parte II)

2023/24 -- Jo√£o Pedro Neto, DI/FCUL

## Fun√ß√µes

At√© agora temos usado fun√ß√µes e operadores do Python para manipular valores de v√°rios tipos. √â f√°cil perceber a utilidade, por exemplo, da fun√ß√£o `len` se precisamos de saber o tamanho de uma lista para resolver um problema.

Sendo desej√°vel que as linguagens de programa√ß√£o permitam a resolu√ß√£o do maior n√∫mero poss√≠vel de problemas, da forma mais acess√≠vel poss√≠vel, √© natural que disponibilizem aos programadores uma forma destes criarem as suas pr√≥prias fun√ß√µes. Este ser√° o t√≥pico do cap√≠tulo.



Uma fun√ß√£o Python √© uma esp√©cie de mini-programa. √â capaz de receber um certo _input_, executar uma sequ√™ncia de comandos e devolver um _output_, que √© o resultado da execu√ß√£o dos seus comandos. Para al√©m disso, cada fun√ß√£o tem um nome, para podermos distingui-las umas das outras.

Nada disto √© novo, j√° us√°mos v√°rias das fun√ß√µes pr√©-definidas do Python.

Mas como criar fun√ß√µes novas?

Vamos faz√™-lo atrav√©s de uma **defini√ß√£o de fun√ß√£o** e mais vale come√ßar com um exemplo:

In [None]:
def dobro(numero):
  return 2*numero

Agora podemos usar esta nova fun√ß√£o,

In [None]:
valor = dobro(100)
print(valor)

A palavra reservada `def` indica ao Python que a seguir vem uma defini√ß√£o de fun√ß√£o. A defini√ß√£o de fun√ß√£o inclui:

+ O nome da fun√ß√£o. Os nomes das fun√ß√µes seguem a mesma conven√ß√£o dos nomes das vari√°veis. N√£o podem usar palavras reservadas e, se querem manter a sanidade mental, usem nomes que fa√ßam sentido e evitem vari√°veis e fun√ß√µes com nomes iguais.

+ A seguir escrevem um tuplo com os valores de _input_. Estes valores designam-se por **par√¢metros** da fun√ß√£o. Se uma fun√ß√£o n√£o tem par√¢metros usamos o tuplo vazio `()` para o indicar. Depois escreve-se um `:` porque o Python assim fica contente e n√£o vos chateia com um erro sint√°tico.

+ A seguir vem uma sequ√™ncia de comandos que vai ser executada cada vez que algu√©m chama a fun√ß√£o (dizemos *invocar* a fun√ß√£o). Para que o Python saiba onde acaba os comandos da fun√ß√£o temos de os indentar (ou seja, dar uns espa√ßos antes de come√ßar a escrever). Reparem como o comando `return (2*x)` est√° mais para a direita. A estes comandos costumamos chamar o **corpo da fun√ß√£o**.

+ Para devolver o resultado final -- o _output_ da fun√ß√£o -- usamos o comando `return`. Este comando avalia a express√£o que estiver √† sua frente e torna o resultado dessa express√£o o _output_ da fun√ß√£o. Podemos colocar mais que um `return` no corpo da fun√ß√£o, se houver necessidade. Vamos tentar seguir a boa pr√°tica que todos os _returns_ de uma mesma fun√ß√£o devolvam valores do mesmo tipo.

  + Se n√£o quisermos devolver valores, basta n√£o escrever um comando `return`. Neste caso o Python, quando terminar de executar o √∫ltimo comando da fun√ß√£o, devolve automaticamente o valor `None` que representa, na linguagem, a no√ß√£o de 'aus√™ncia de valor'.

Para invocar a fun√ß√£o basta usar a sintaxe do costume: usar o nome e, entre par√™nteses, quais os argumentos a passar para os par√¢metros da fun√ß√£o.



Vamos definir duas novas fun√ß√µes:

In [None]:
from math import pi

def piVezes(x):
  return pi*x

def relatorio(parametro):
  print(f'Pediram-me para imprimir {parametro}')

e agora vamos invoc√°-las:

In [None]:
valor = piVezes(10)
relatorio(valor)

Pediram-me para imprimir 31.41592653589793


Quando uma fun√ß√£o `f` √© invocada, a execu√ß√£o do programa atual fica em pausa e o Python faz o seguinte:

1. Copia os argumentos da invoca√ß√£o para os par√¢metros de `f` (se os houver)

1. Executa o corpo da fun√ß√£o `f`

1. Se apanhar um `return` algures no corpo da fun√ß√£o, avalia a express√£o associada que vai ser o _output_, e a *execu√ß√£o da fun√ß√£o termina*.

1. O Python volta ao programa original, coloca o valor do _output_ na vari√°vel associada, e passa para o comando seguinte.

Um detalhe importante: se uma outra fun√ß√£o foi invocada no corpo da primeira fun√ß√£o, volta-se a fazer o mesmo. Faz-se pausa na primeira fun√ß√£o e executa-se a segunda. A√≠ pode at√© haver a invoca√ß√£o de uma terceira fun√ß√£o, e assim sucessivamente. O Python √© atento e n√£o se confunde.

### O Uso de Fun√ß√µes na Resolu√ß√£o de Problemas

As fun√ß√µes s√£o √∫teis para lidarmos com problemas complexos. Se formos capazes de decompor um problema em subproblemas, podemos implementar cada um deles com fun√ß√µes adequadas. Esta abordagem √© mais f√°cil do que tentar atacar o problema todo de uma s√≥ vez.

Vamos considerar que quer√≠amos pedir tr√™s notas de um aluno, para depois calcular a m√©dia e, finalmente, imprimir esse valor no ecr√£.

Este problema exemplo pode ser decomposto em tr√™s fases, onde cada uma das fases √© implementada por uma fun√ß√£o:

1. uma primeira fun√ß√£o `pedirNotas` para recolher informa√ß√£o do utilizador. Como queremos devolver tr√™s n√∫meros vamos retornar esta informa√ß√£o num tuplo.

1. uma segunda fun√ß√£o `calcularMedia` para calcular e retornar uma m√©dia das notas.

1. uma terceira fun√ß√£o `imprimirRelatorio` que imprime a m√©dia calculada num formato de texto.

Eis uma implementa√ß√£o destas tr√™s fun√ß√µes:

In [None]:
def pedirNotas():
  nota1 = int( input('nota 1: ') )
  nota2 = int( input('nota 2: ') )
  nota3 = int( input('nota 3: ') )
  return (nota1, nota2, nota3)

def calcularMedia(notas):
  return sum(notas)/len(notas)

def imprimirRelatorio(media):
  print(f'A minha m√©dia √© {media:5.2f}')

Vejamos um caso de uso. Reparem como o resultado de uma fun√ß√£o √© passado como argumento da fun√ß√£o seguinte, usando para isso vari√°veis auxiliares:

In [None]:
asMinhasNotas = pedirNotas()
aMinhaMedia   = calcularMedia(asMinhasNotas)
imprimirRelatorio(aMinhaMedia)

√â normal que um programa completo tenha de interagir com o utilizador, seja para lhe pedir informa√ß√£o, seja para lhe mostrar algum relat√≥rio. Tamb√©m √© normal ter de efetuar c√°lculos a partir da informa√ß√£o dispon√≠vel.

Uma boa pr√°tica de programa√ß√£o √© tentar manter estes dois aspetos - interagir com o utilizador e realizar c√°lculos internos - separados em fun√ß√µes distintas. Esta separa√ß√£o ajuda-nos a gerir os nossos programas, seja para corrigir erros no presente, seja para adicionar novas funcionalidades no futuro.

### Vantagens no Uso de Fun√ß√µes

Antes de continuar vamos discutir um pouco a utilidade das fun√ß√µes.

Quais as vantagens de introduzir o conceito de fun√ß√£o numa linguagem de programa√ß√£o?

+ Quando se est√° a construir um programa para resolver um certo problema, √© normal ter de usar a mesma sequ√™ncia de comandos m√∫ltiplas vezes. Em vez de abusar do *copy-paste*, √© mais produtivo associar essa sequ√™ncia de comandos a uma fun√ß√£o.

+ C√≥digo associado a uma fun√ß√£o fica mais organizado. Se descobrirmos que temos de fazer uma mudan√ßa, em vez de ir √† ca√ßa de todos os s√≠tios onde o c√≥digo estaria duplicado, temos apenas de corrigir na defini√ß√£o da fun√ß√£o. A manuten√ß√£o do programa torna-se mais f√°cil.

+ Esta organiza√ß√£o tamb√©m √© conceptual. √â importante separar comandos pelos objetivos que t√™m. Se tenho um programa para resolver a tarefa A e outro para resolver a tarefa B, √© bom t√™-los separados e identificados pelos nomes das respetivas fun√ß√µes.

+ Separar o programa por tarefas ajuda-nos igualmente na tarefa de depura√ß√£o. O corpo de cada fun√ß√£o tende a ter poucos comandos, tornando-se mais f√°cil perceber se uma certa fun√ß√£o est√° ou n√£o corretamente programada.

+ As fun√ß√µes muitas vezes s√£o √∫teis em problemas futuros. Se precisarmos de uma fun√ß√£o que usamos num programa anterior, podemos facilmente reutiliz√°-la.

+ Os par√¢metros de uma fun√ß√£o d√£o-lhe um grau de flexibilidade. Significa que ela resolve n√£o s√≥ a tarefa que temos em frente, mas pode resolver tarefas similares no futuro. Para tal, basta mudar os valores que passamos na invoca√ß√£o da fun√ß√£o. As fun√ß√µes pr√©-definidas do Python foram todas pensadas nesta perspetiva.

### Exerc√≠cios

O comando `assert` √© √∫til para validarmos, num qualquer momento da computa√ß√£o, se uma dada express√£o booleana √© verdadeira.

In [None]:
assert 1+1 == 2
assert 1+1 != 3

Se a express√£o n√£o for verdadeira, √© produzido um erro de execu√ß√£o,

In [None]:
assert 1+1 == 3

AssertionError: ignored

que √© √∫til para nos informar que algo n√£o correu como o previsto. Vamos usar, a partir de agora, este comando para incluir express√µes que servem para testar as vossas resolu√ß√µes.

<font size="+4" color="blue;green"><b>?</b></font> Defina a fun√ß√£o `areaTriangulo` que recebe a base e a altura de um tri√¢ngulo e devolve a sua √°rea.

Use a fun√ß√£o para calcular a √°rea de um tri√¢ngulo de base 10 e altura 2.3.

In [None]:
def areaTriangulo(base, altura):
  pass # ponham aqui a vossa solu√ß√£o. Btw, pass √© um comando que n√£o faz nada (!)

<font size="+4" color="blue;green"><b>?</b></font> Defina a fun√ß√£o `resumo` que recebe uma lista de n√∫meros e devolve um triplo com as seguintes estat√≠sticas (somat√≥rio dos n√∫meros, m√©dia dos n√∫meros, m√°ximo dos n√∫meros).

N√£o se esque√ßam que o Python tem dispon√≠vel as fun√ß√µes `len`, `sum` e `max`.


In [None]:
def resumo(xs):
  pass # ponham aqui a vossa solu√ß√£o

None


In [None]:
algunsNumeros = [1, 3, 2, 5, 7, 1, 43, 8]

assert resumo(algunsNumeros) == (70, 8.75, 43)

<font size="+4" color="blue;green"><b>?</b></font> Defina a fun√ß√£o `listaPotencias` que dado um n√∫mero $k$ e uma lista de n√∫meros $[x_0, \ldots, x_n]$ devolva $[x_0^k, \ldots, x_n^k]$.


In [None]:
def listaPotencias(k, xs):
  pass  # ponham aqui a vossa solu√ß√£o

In [None]:
assert listaPotencias(3, [3, 1, -5, 12]) == [27, 1, -125, 1728]

## Condicionais

Como se viu anteriormente, o Python possui o tipo `bool` cujos valores resultam da avalia√ß√£o de express√µes booleanas.

√â poss√≠vel imaginar problemas que podem executar uma a√ß√£o se uma express√£o booleana for verdadeira, e outra a√ß√£o caso seja falsa. Isto √©, estamos a referir a possibilidade de haver condi√ß√µes l√≥gicas que determinam como a computa√ß√£o de um programa se desenrola.

Considere que era preciso devolver um relat√≥rio se um dado n√∫mero √© ou n√£o √© positivo. Com o que aprendemos at√© agora, como se poderia fazer?

In [None]:
def relatorio(numero):
  ePositivo    = (numero> 0) * "Positivo"     # multiplica a string 0 ou 1 vez
  eNaoPositivo = (numero<=0) * "N√£o Positivo"
  return ePositivo + eNaoPositivo

In [None]:
print(relatorio(-15))
print(relatorio(100))

Um pouco rebuscado para tarefa t√£o simples.

E se o problema fosse multiplicar um n√∫mero por -1 se fosse negativo, ou por +1 se fosse positivo? Por outras palavras, o problema √© o de implementar a fun√ß√£o valor absoluto, $f(x) = |x|$.

In [None]:
def valorAbsoluto(numero):
  return (numero>0)*numero + (numero<0)*-numero

In [None]:
print(valorAbsoluto(-15))
print(valorAbsoluto(10))

L√° funcionar funciona... Mas estamos a correr o risco de come√ßar a ter c√≥digo muito confuso se os c√°lculos forem mais complexos, se houver mais que duas op√ß√µes a considerar, etc.

Para lidar com este g√©nero de problemas o Python inclui um comando **condicional** a uma express√£o booleana. O nome desse comando √© `if`.

Vejamos os dois problemas anteriores resolvidos com o uso do `if`:

In [None]:
def relatorio(numero):
  if numero > 0:
    return "Positivo"
  else:
    return "N√£o Positivo"

def valorAbsoluto(numero):
  if numero > 0:
    return numero
  else:
    return -numero

A sintaxe do `if` tem as seguintes regras:

+ Ap√≥s a palavra reservada `if` escrevemos a express√£o booleana que define qual a a√ß√£o a realizar. N√£o esquecer o `:`

+ Esta express√£o booleana designa-se por **guarda**. Se a express√£o booleana avaliar para `True` diz-se que a guarda √© verdadeira. Se avaliar para `False`, a guarda √© falsa.

+ Nas linhas seguintes ao `if` colocamos os comandos (pode ser mais que um) que correspondem √† a√ß√£o que queremos executar se a guarda for verdadeira. Reparem que temos de respeitar a indenta√ß√£o: t√™m de deslocar estes comandos para a direita.

+ Para descrever a a√ß√£o que queremos realizar se a guarda for falsa, escrevemos `else:` e, nas linhas seguintes, colocamos os respetivos comandos que definem essa a√ß√£o.

+ Este segundo conjunto de comandos do `else` √© opcional. O Python aceita um comando condicional que descreve o que fazer apenas se a guarda for verdadeira. Nestes casos, se a guarda for falsa, o comando condicional nada executa.

No seguinte exemplo temos uma fun√ß√£o que dado um n√∫mero inteiro √≠mpar devolve o par anterior, ou se for par devolve o mesmo n√∫mero. Neste caso, o nosso comando condicional apenas precisa executar quando a fun√ß√£o recebe um n√∫mero √≠mpar. N√£o precisamos da condi√ß√£o `else`.

In [None]:
def parifica(numero):
  if numero % 2 != 0:
    numero = numero - 1
  return numero

In [None]:
print(parifica(13))
print(parifica(12))

## Itera√ß√£o

Ao contr√°rio dos seres humanos, os computadores s√£o √≥ptimos em tarefas repetitivas. Se eu quiser somar os primeiros 100000 n√∫meros primos tenho a certeza que um programa Python √© capaz de calcular o resultado eficientemente e sem margem para erro.

A itera√ß√£o √© uma forma de pensar t√£o comum que o Python at√© disponibiliza diferentes comandos para o fazer. √â costume chamar a estes comandos, *comandos de ciclo*.

### O Comando `while`

O seguinte programa apresenta o primeiro comando de ciclo, o `while`:

In [None]:
i = 1
while i < 5:
  print(i)
  i = i + 1

Se lermos o programa como se fosse Portugu√™s (ou Ingl√™s, neste caso) seria algo como:

<center><i><font size="3">Seja i=1. Enquanto o i for menor que 5, repete os seguintes comandos: imprimir i e atualizar i para o seu sucessor.</font></i></center>

Temos aqui alguns termos a introduzir:

+ A no√ß√£o de *repeti√ß√£o* (ou itera√ß√£o). H√° um conjunto de comandos que est√£o a ser repetidamente executados. Este conjunto de comandos designa-se por **corpo do ciclo**.

+ A repeti√ß√£o tem associada uma *condi√ß√£o de paragem*. Esta condi√ß√£o √© uma express√£o booleana que, enquanto for considerada verdadeira, mant√©m a repeti√ß√£o ativa. A esta express√£o booleana designamos por **guarda do ciclo**.

+ A exist√™ncia de uma vari√°vel (neste exemplo, a vari√°vel inteira `i`) que √© importante tanto para a execu√ß√£o do corpo do ciclo, como para determinar quando devemos parar. Designamo-la por **vari√°vel de progresso**.

A sintaxe do Python em rela√ß√£o ao comando `while` √©, assim

```python
while <guarda-do-ciclo>:
  <corpo-do-ciclo>
```  

No exemplo seguinte imprime-se os n√∫meros de 1 a 20 por ordem decrescente:

In [None]:
i = 20
while i>0:
  print(i, end=' ')
  i = i - 1

O ciclo termina porque a vari√°vel de progresso `i` come√ßa no valor 20 e vai descendo uma unidade de cada vez que o corpo do ciclo √© executado. Como a guarda do ciclo s√≥ se mant√©m verdade enquanto `i` for positivo, temos a garantia que o ciclo ir√° terminar.

Vamos agora definir uma fun√ß√£o que imprime a tabela da tabuada de um certo n√∫mero. Como a tabuada vai da linha 1 √† linha 10, podemos pensar num ciclo que repete dez vezes a respetiva conta.


In [None]:
def tabuada(n):
  i = 1
  while i <= 10:
    print(f'{n} vezes {i:2} igual a {n*i:2}')
    i = i + 1

In [None]:
tabuada(8)

Leiam a fun√ß√£o `tabuada` e identifiquem o corpo e a guarda do ciclo, bem como a vari√°vel de progresso.

Observemos o seguinte ciclo:

In [None]:
i = 1
while i < 2:
  print(i)

Se executarem a caixa de c√≥digo, v√£o ter de clicar no bot√£o *stop*. Qual √© o problema deste ciclo? √â que a vari√°vel de progresso n√£o est√° a ser atualizada. Assim, a guarda do ciclo √© sempre verdadeira e _o ciclo nunca termina_! A estes ciclos cuja guarda nunca √© falsa designamos por **ciclos infinitos**. Excetuando certas situa√ß√µes muito espec√≠ficas, queremos naturalmente evitar ciclos infinitos.

Considere agora o seguinte algoritmo: Seja um n√∫mero $n$. Se $n=1$ paramos. Sen√£o, se $n$ for par, dividimos $n$ por 2, e se for √≠mpar, multiplicamos $n$ por 3 e adicionamos 1. Com este novo n√∫mero, repetir o algoritmo.

A fun√ß√£o `collatz` implementa este algoritmo iterativo retornando uma lista com todos os n√∫meros produzidos a partir do argumento $n$ dado:



In [None]:
def collatz(n):
  result = [] # lista com os resultados produzidos de n at√© 1
  while n != 1:
    result.append(n)
    if n%2 == 0: # n par
      n = n//2
    else:        # n √≠mpar
      n = n*3+1
  result.append(1)
  return result

Vamos imprimir as listas resultados para os inteiros de 1 a 20:

In [None]:
n = 1
while n <= 20:
  print(collatz(n))
  n = n + 1

A [conjetura de Collatz](https://pt.wikipedia.org/wiki/Conjectura_de_Collatz) diz-nos que, para qualquer n√∫mero positivo, este algoritmo termina sempre. Ningu√©m foi ainda capaz de demonstrar que a conjetura √© verdade. Mas se fosse falsa, se houvesse um $n$ contra-exemplo, o ciclo acima nunca terminaria. Como podemos observar, a garantia que um dado ciclo termina nem sempre √© √≥bvia.

Se quisermos garantir que um dado ciclo termina, ser√° preciso analisar o algoritmo e encontrar um argumento apropriado que confirme a sua termina√ß√£o. Isto √© poss√≠vel na grande maioria das situa√ß√µes.

### O Comando `for`

O segundo comando para itera√ß√£o √© o `for`. N√≥s j√° conhecemos esta palavra reservada associada aos geradores das listas de compreens√£o. Aqui vai ter um significado um pouco diferente, mas √© como se extra√≠ssemos o gerador e o deix√°ssemos √† solta!

Um ciclo `for` atualiza a vari√°vel de progresso de acordo com os valores do tipo estruturado que lhe atribuirmos. Nos seguintes exemplos, os elementos dos tipos estruturados que fornecemos ao `for` v√£o ser gerados, um a um, e atribu√≠dos √† vari√°vel de progresso `i`:

In [None]:
for i in "abc":
  print(i)

for i in (True, 1.0, "x"):
  print(i)

for i in ["ab", "cd"]:
  print(i)

for i in range(3):
  print(i)

Vamos implementar a fun√ß√£o `filtro` que, dado um predicado `p` e uma lista `xs`, devolve a sublista apenas com os elementos de `xs` que satisfazem o predicado `p`. O uso do `for` permite ir buscar todos os elementos da lista, para verificarmos quais aqueles que satisfazem `p`.

In [None]:
def filtro(p, xs):
  resultado = []
  for elemento in xs:
    if p(elemento):
      resultado.append(elemento)
  return resultado

Um caso de uso que seleciona os elementos pares de uma lista:

In [None]:
def ePar(n):
  return n % 2 == 0

filtro(ePar, [1,2,3,4,5,6,7,8])

Como a gest√£o da vari√°vel de progresso √© autom√°tica, muitas fun√ß√µes tornam-se mais simples com o comando `for`. Comparem a reimplementa√ß√£o a fun√ß√£o `tabuada` com a vers√£o inicial:

In [None]:
def tabuada(n):
  for i in range(1,11):
    print(f"{n} vezes {i:2} igual a {n*i:2}")

tabuada(8)

### O Comando `break`

Para minorar este problema de termos de iterar at√© ao fim, o Python inclui um comando que nos pode ajudar nessas situa√ß√µes. O comando `break`, quando executado, faz a execu√ß√£o do programa sair do ciclo onde este se encontra:

In [None]:
def pesquisa(x, xs):
  resultado = len(xs)

  for i in range(len(xs)):
    if x == xs[i]:
      resultado = i
      break  # encontramos x, podemos sair de imediato do ciclo for

  return resultado

pesquisa(3, [1,3,2,4,3])

### Ciclos Encadeados

Os comandos ciclo s√£o, claro est√°, comandos. Como o corpo de um ciclo √© composto por comandos, significa que √© poss√≠vel ter ciclos no corpo de outros ciclos. Por vezes estas itera√ß√µes dentro de itera√ß√µes s√£o a melhor forma de resolver problemas.

Vamos considerar que quer√≠amos imprimir as primeiras $m$ tabuadas. J√° vimos que para imprimir *uma* tabuada us√°mos um ciclo. Podemos utilizar outro ciclo para repetir a tarefa de imprimir $m$ tabuadas.

Como sabemos exatamente quantas itera√ß√µes ter√£o de ser realizadas, escolhemos dois ciclos `for`:

In [None]:
# vamos imprimir uma tabuada na mesma linha para poupar espa√ßo
def tabuadasAt√©(m):
  for n in range(1,m+1):   # 1¬∫ciclo: iterar entre 1 e m,      vari√°vel de progresso n
    for i in range(1,11):  # 2¬∫ciclo: imprimir a tabuada do n, vari√°vel de progresso i
      print(f"{n:02}x{i:02}={n*i:03}", end='  ')
    print()                # mudar de linha

tabuadasAt√©(10)

Outro exemplo: queremos implementar uma fun√ß√£o que, dada uma lista de n√∫meros e um inteiro `x`, devolve uma lista com todos os pares de √≠ndices de n√∫meros da lista que somam `x`.

Uma primeira solu√ß√£o:

In [None]:
def pares(xs, x):
  resultado = []
  for i in range(len(xs)):    # i, indice do primeiro n√∫mero do par
    for j in range(len(xs)):  # j, indice do segundo n√∫mero do par
      if i < j and xs[i]+xs[j] == x:
        resultado.append((i,j))
  return resultado

No comando `if` usou-se `i<j` para evitar pares repetidos (onde apenas mudava a ordem dos √≠ndices) e para evitar que o mesmo n√∫mero possa ser usado duas vezes no mesmo par.

In [None]:
pares([1,2,3,-1,4,-2,-1,0], 0)

Esta solu√ß√£o tem uma inefici√™ncia que podemos remover. Se s√≥ guardamos solu√ß√µes quando as vari√°veis de progresso satisfazem `i<j`, n√£o faz muito sentido estar sempre a reiniciar a vari√°vel de progresso `j` ao √≠ndice `0`. Porque n√£o come√ßar `j` no primeiro valor poss√≠vel de nos dar uma solu√ß√£o, ou seja, `i+1`?

Vamos conseguir fazer isto porque a vari√°vel de progresso de um ciclo pode ser usada para determinar a evolu√ß√£o de vari√°vel de progresso dos seus ciclos internos (j√° era assim com os geradores sequenciais das listas por compreens√£o).

Assim, uma solu√ß√£o mais r√°pida seria esta:

In [None]:
def pares(xs, x):
  resultado = []
  for i in range(len(xs)):
    for j in range(i+1, len(xs)):
      if xs[i]+xs[j] == x:   # deixou de ser necess√°rio ter aqui o 'i<j'
        resultado.append((i,j))
  return resultado

In [None]:
pares([1,2,3,-1,4,-2,-1,0], 0)

### Exerc√≠cios

<font size="+4" color="blue;green"><b>?</b></font> Defina a fun√ß√£o `potencias2Ate(limite)` que devolve a lista de todas as pot√™ncias de dois at√© o n√∫mero limite dado (exclusive). Use um comando de ciclo.



In [None]:
def potencias2Ate(limite):
  pass # ponham aqui a vossa solu√ß√£o

In [None]:
assert potencias2Ate(5000) == [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096]

Um parque de divers√µes vende diferentes bilhetes por idade:

+ Adultos pagam 10‚Ç¨ de entrada,

+ Reformados (mais de 64 anos) pagam 5‚Ç¨

+ Jovens entre os 6 e os 17 anos (inclusive) pagam 3‚Ç¨

+ Crian√ßas com menos de 6 anos n√£o pagam bilhete

<font size="+4" color="blue;green"><b>?</b></font> Defina a fun√ß√£o `precoTotal` que recebe uma lista de idades e calcula o pre√ßo total desses bilhetes.

In [None]:
def precoTotal(idades):
  pass # ponham aqui a vossa solu√ß√£o

In [None]:
assert precoTotal([65,65,3]) == 10
assert precoTotal([35,38,12,5]) == 23

<font size="+4" color="blue;green"><b>?</b></font> Defina a fun√ß√£o `triangulares(limite)` que devolve a lista de todos os [n√∫meros triangulares](https://en.wikipedia.org/wiki/Triangular_number) at√© o n√∫mero limite dado (exclusive).



In [None]:
def triangulares(limite):
  pass # ponham aqui a vossa solu√ß√£o

In [None]:
assert triangulares(100) == [0, 1, 3, 6, 10, 15, 21, 28, 36, 45, 55, 66, 78, 91]

## Geradores

O comando `return` termina a execu√ß√£o da fun√ß√£o e devolve o valor da express√£o que se lhe segue para quem invocou a fun√ß√£o. Quando a fun√ß√£o √© novamente invocada, voltamos ao in√≠cio da fun√ß√£o e repetimos tudo outra vez.

Mas existe uma outra possibilidade que ainda n√£o fal√°mos. E se fosse poss√≠vel devolver o valor como no `return` mas sem esquecer onde est√°vamos? Ou seja, quando se invocasse a fun√ß√£o novamente, em vez de recome√ßar no in√≠cio, continuar√≠amos no local onde sa√≠mos da √∫ltima vez.

Podemos fazer isso usando o comando `yield` em vez do `return`:

In [None]:
def g(x):
  yield x * 2
  yield x * 3
  yield x * 4

print([a for a in g(2)])
print([a for a in g(100)])

O valor associado a `g` continua a ser uma fun√ß√£o,

In [None]:
type(g)

mas quando associamos um valor inicial `x` a `g`, a express√£o `g(x)` passa a ser um **gerador** de valores baseados nesse valor inicial,

In [None]:
type(g(2))

Vamos chamar a `g` uma **fun√ß√£o geradora** (em ingl√™s, _generator function_).

Quando criamos um gerador podemos ter acesso aos seus elementos, um a um, de cada vez. Os geradores s√£o um caso especial de iteradores. Por isso, podemos usar a fun√ß√£o `next` para recolher os seus valores manualmente,

In [None]:
gen = g(2)
print(next(gen))
print(next(gen))
print(next(gen))

Quando o gerador terminar, se insistirmos em invocar o `next`, o Python produz tamb√©m aqui uma exce√ß√£o `StopIteration`.

In [None]:
print(next(gen))

Podemos associar geradores √†s listas por compreens√£o, ou a ciclos `for`, que invocam o comando `next` nos bastidores:

In [None]:
print([valor for valor in g(20)])

for valor in g(20):
  print(valor, end=" ")

[40, 60, 80]
40 60 80 

Para criar geradores mais interessantes podemos gerar os seus valores atrav√©s de ciclos:

In [None]:
def potencias2(n):
  for i in range(n):
    yield 2**i

In [None]:
for valor in potencias2(12):
  print(valor, end= " ")

Mas n√≥s j√° pod√≠amos fazer isto com listas de compreens√£o normais:

In [None]:
def potencias2(n):
  return [2**i for i in range(n)]

O que se ganha com esta abordagem dos geradores?

Na vers√£o da lista por compreens√£o foi preciso calcular a lista inteira de pot√™ncias antes de devolver o primeiro resultado! Na vers√£o do gerador cada valor √© calculado apenas quando √© preciso!! A grande vantagem √© pouparmos computa√ß√£o e mem√≥ria (lembram-se do elogio √† pregui√ßa?)

A d√∫zia de valores deste exemplo n√£o parece nada de especial, mas se a lista fosse composta por milh√µes de valores, ir√≠amos poupar muita mem√≥ria...

Mas h√° outros ganhos interessantes. Podemos ter geradores infinitos! ü§î Ou seja, geradores que nunca terminam de gerar valores.	üò≤ A Matem√°tica tem montes de exemplos onde podemos aplicar esta ideia: o conjunto dos naturais, o conjunto dos n√∫meros primos, uma progress√£o aritm√©tica, a sequ√™ncia de Fibonacci...

J√° que falamos dela, vamos criar um gerador para a sequ√™ncia de Fibonacci

In [None]:
def fibonacci():
  a,b = 1,1
  while True:   # ciclo infinito!
    yield a
    a,b = b,a+b

In [None]:
fibs = fibonacci()

Se executarmos o seguinte c√≥digo v√°rias vezes:

In [None]:
for i in range(20):
  print(next(fibs), end= " ")
print('...')

vamos reparar que a gera√ß√£o de valores continua, n√£o estamos a voltar aos valores iniciais. O gerador tem mem√≥ria da computa√ß√£o que j√° foi efetuada.

E podemos manipular diferentes gera√ß√µes ao mesmo tempo, sem que haja interfer√™ncia!

In [None]:
fibs1 = fibonacci()
fibs2 = fibonacci()

print(next(fibs1), next(fibs1), next(fibs1), next(fibs1))
print(next(fibs2), next(fibs2), next(fibs2))

O que os geradores t√™m de distinto dos iter√°veis como listas, tuplos ou conjuntos? Enquanto nestes √∫ltimos iteramos sobre valores previamente armazenados numa estrutura de dados, nos geradores a itera√ß√£o de elementos prov√©m da execu√ß√£o de um algoritmo. Isto significa que a itera√ß√£o √© resultado de um processo, de uma computa√ß√£o. Da√≠ estas possibilidades de (a) poupar mem√≥ria porque geramos s√≥ os elementos necess√°rios, e (b) a exist√™ncia de geradores infinitos, onde n√£o h√° limite ao n√∫mero de valores que o gerador pode disponibilizar.

### Converter Geradores em Tipos Estruturados


Se convertermos um gerador num tuplo ou lista, o Python vai gerar todos os valores:

In [None]:
def potencias2(n):
  for i in range(n):
    yield 2**i

In [None]:
print(list(potencias2(10)))
print(tuple(potencias2(10)))

Mas aten√ß√£o: tentar converter um gerador infinito para um qualquer tipo estruturado produz uma computa√ß√£o que n√£o termina.

### Exemplos de geradores

Nos exemplos que se seguem vamos utilizar os seguintes geradores:

In [None]:
def potencias2(n):
  for i in range(n):
    yield 2**i

def fibonacci():
  a,b = 1,1
  while True:
    yield a
    a,b = b,a+b

def fatoriais():
  i, fact = 0, 1
  while True:
    yield fact
    i, fact = i+1, (i+1)*fact

Dada a exist√™ncia de geradores infinitos, vamos come√ßar por implementar a fun√ß√£o geradora `head`, que recebe um iter√°vel e um inteiro positivo $n$, e retorna um gerador que gera apenas os primeiros $n$ valores do iter√°vel dado:

In [None]:
def head(xs, n):
  it = iter(xs)
  for _ in range(n):
    yield next(it)

Esta fun√ß√£o funciona bem para geradores infinitos:

In [None]:
gen = head(fibonacci(), 12)

print(*gen)  # transforma os valores do gerador numa lista de argumentos

O que ocorre se lhe dermos um iter√°vel com menos valores que $n$?

In [None]:
gen = head(potencias2(10), 12)

print(*gen)

√â produzido um erro de execu√ß√£o pelo lan√ßamento da exce√ß√£o `StopIteration`. Este resultado n√£o nos deve surpreender. Afinal, tent√°mos gerar mais valores dos que existiam.

Podemos corrigir este problema passando a responsabilidade de gerir o iter√°vel para o comando `for`:

In [None]:
def head(xs, n):
  for i,x in enumerate(xs):
    if i==n:
      break
    yield x

In [None]:
gen = head(potencias2(10), 12)

print(*gen)

Em geral, nas pr√≥ximas solu√ß√µes, n√£o nos iremos preocupar com este aspeto para n√£o sobrecarregar o c√≥digo das fun√ß√µes geradoras. Assumiremos que n√£o ser√£o pedidos mais valores do que aqueles que existem.

Vamos definir a fun√ß√£o geradora `tail` que, dado um gerador `g`, deita fora os primeiros $n$ valores gerados de `g` para, a seguir, gerar os valores restantes.

Esta fun√ß√£o √©, de certa forma, o complemento da fun√ß√£o `head`:

In [None]:
def tail(g, n):
  for _ in range(n):  # gerar os primeiros n valores sem os usar
    next(g)
  yield from g        # agora passamos o funcionamento para g

In [None]:
gen = tail(potencias2(20), 5) # ¬´remover¬ª os primeiros cinco valores
gen = head(gen, 10)           # gerar os dez seguintes

print(*gen)

Como implementar um gerador para os n√∫meros naturais $\mathbb{N}^+$?

In [None]:
def naturais():
  i = 1
  while True:
    yield i
    i = i+1

In [None]:
gen = head(naturais(), 20)

print(*gen)

Podemos usar os naturais para gerar os inteiros $\mathbb{Z}$. Por conven√ß√£o, vamos devolver alternadamente os valores positivos e negativos.

In [None]:
def inteiros():
  yield 0
  for n in naturais():
    yield  n
    yield -n

In [None]:
gen = head(inteiros(), 20)

print(*gen)

### O m√≥dulo `itertools`

Vamos explorar algumas das fun√ß√µes geradoras dispon√≠veis neste m√≥dulo:

In [None]:
import itertools as its

A fun√ß√£o geradora `count` √© similar ao `range`, mas √© infinita:

In [None]:
gen = head(its.count(10, 3), 20) # gera 10, 10+3, 10+6, ...

print(*gen)

A fun√ß√£o `cycle` gera os valores do iter√°vel dado e, chegando ao fim, recome√ßa do in√≠cio:

In [None]:
gen = head(its.cycle('abcd*'), 23)

print(*gen)

A fun√ß√£o `chain` encadeia v√°rios geradores. Excepto o √∫ltimo, todos os geradores em cadeia t√™m de ser finitos, para haver a possibilidade de passar para o gerador seguinte:

In [None]:
gen1 = head(naturais(), 7)
gen2 = potencias2(8)
gen3 = head(fibonacci(), 6)

gen = its.chain(gen1, gen2, gen3)

print(*gen)

### Operadores Combinat√≥rios

> Para facilitar a impress√£o de valores dos pr√≥ximos iter√°veis e geradores, define-se a seguinte fun√ß√£o auxiliar:

In [None]:
#@title fun√ß√£o `printIt`
def printIt(it, is_number=True, per_line=24):
  """ imprime valores (desde que iter√°veis) gerados por 'it' """
  if is_number:
    it = map(str, it)
  join = lambda t : ''.join(str(c) for c in t) # concatenate values in a single string
  elems = map(join, it)                        # apply join() to all values of 'it'

  for i, elem in enumerate(elems):             # print elements
    if i%per_line == per_line-1:
      print(elem)
    else:
      print(elem, end='  ')

  if i%per_line < per_line-1:    # footnote report
    print()
  print(f'[{i+1} vals]')         # how many values were generated

O m√≥dulo `itertools` tem v√°rias fun√ß√µes para contagem combinatorial.

In [None]:
import itertools as its

bolas = ["üî¥","üü†","üü°","üü¢","üîµ"]    ### ,"üü§","üü£","‚ö´","‚ö™"]

Por exemplo, como posso colocar uma bola de cor diferente por caixa, com tr√™s caixas indiferenciadas e tendo cinco bolas?

In [None]:
gen = its.combinations(bolas, 3)

printIt(gen, is_number=False)

E se poder repetir as cores das bolas?

In [None]:
gen = its.combinations_with_replacement(bolas, 3)

printIt( gen, per_line=10, is_number=False)

Agora as caixas s√£o marcadas, h√° a primeira, segunda e terceira caixa.

Primeiro n√£o repetindo cores:

In [None]:
gen = its.permutations(bolas, 3)

printIt(gen, per_line=10, is_number=False )

E, segundo, podendo repetir cores:

In [None]:
gen = its.product(bolas, repeat=3) # produto cartesiano

printIt(gen, per_line=10, is_number=False )

### Exerc√≠cios

<font size="+4" color="blue;green"><b>?</b></font> Usando o gerador dos n√∫meros naturais, implemente uma fun√ß√£o geradora para o conjunto dos n√∫meros quadrados, $\{n^2 | n \in \mathbb{N}^+ \}$.



In [None]:
def quadrados():
  pass # ponham aqui a vossa solu√ß√£o

In [None]:
gQuad = quadrados()
assert [next(gQuad) for _ in range(10)] == [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

<font size="+4" color="blue;green"><b>?</b></font> Crie a fun√ß√£o geradora `nextMinute` que retorna um gerador que gera pares com as horas e minutos desde a meia-noite at√© √†s 23:59, i.e., desde o par `(0,0)` at√© `(23,59)`.



In [None]:
def nextMinute():
  pass # ponham aqui a vossa solu√ß√£o

In [None]:
minutos = nextMinute()
for n in range(10):
  print(next(minutos), end=' ')

(0, 0) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6) (0, 7) (0, 8) (0, 9) 

<font size="+4" color="blue;green"><b>?</b></font> Defina a fun√ß√£o geradora `unique` que recebe um iter√°vel e devolve um gerador sobre os elementos √∫nicos do iter√°vel dado.

In [None]:
def unique(xs):
  pass  # ponham aqui a vossa solu√ß√£o

In [None]:
for n in unique( x for x in [1,2,4,3,2,4,1,2,3] ):
  print(n, end=' ')  # 1 2 4 3

<font size="+4" color="blue;green"><b>?</b></font> Defina a fun√ß√£o geradora `mapper` que recebe uma fun√ß√£o `f` e um iter√°vel e gera todos os valores do iter√°vel ap√≥s serem aplicados a `f`

In [None]:
def mapper(f, xs):
  pass   # ponham aqui a vossa solu√ß√£o

In [None]:
def dobro(x):
  return 2*x

g = mapper(dobro, range(5))
assert list(g) == [0, 2, 4, 6, 8]