# An√°lise de Dados em Python: Introdu√ß√£o ao Python (parte I)

2023/24 -- Jo√£o Pedro Neto, DI/FCUL

## Introdu√ß√£o

Nesta primeira parte iremos apresentar um conjunto fundamental de conceitos para programar, e em particular, com o Python.

Podemos come√ßar j√° com o primeiro conceito: uma **linguagem de programa√ß√£o** √© uma ferramenta para escrever algoritmos.

Algoritmo √© um termo mais conhecido, e mais antigo que os computadores. Um **algoritmo** √© como uma receita onde se descreve, passo a passo e com detalhe, o que √© preciso fazer para resolver um dado problema.

Um algoritmo est√° sempre associado a um certo **problema**, e √© em rela√ß√£o a esse problema em particular que dizemos se o dado algoritmo est√° certo ou errado. Por exemplo, se eu escrevo um algoritmo para resolver o problema de encontrar as ra√≠zes de um polin√≥mio, ele de pouco vai servir para resolver o problema de ordenar n√∫meros.

Quando programamos em Python (ou noutra linguagem) escrevemos os nossos algoritmos obedecendo √†s *regras da linguagem*. No caso do Python vamos ter de aprender as suas regras; para al√©m disso, vamos tamb√©m aprender sobre os seus *recursos*: as funcionalidades que existem no Python para nos ajudar a escrever algoritmos. O desempenho e a produtividade de uma linguagem de programa√ß√£o s√£o muito importantes para o desempenho e a produtividade de um programador.

A escrita dos algoritmos passa por agruparmos sequ√™ncias de **comandos** (ordens, instru√ß√µes) uns a seguir aos outros. A esta sequ√™ncia de comandos chamamos um **programa**. Quando terminamos de escrever um programa (j√° l√° iremos), o Python ser√° capaz de o executar. A **execu√ß√£o** de um programa corresponde √† execu√ß√£o dos seus comandos individuais, desde o primeiro at√© ao √∫ltimo comando.

Cada comando, quando executado, corresponde a um evento, a uma a√ß√£o espec√≠fica. Uma das coisas que vamos aprender √© o conjunto de comandos dispon√≠veis no Python, que a√ß√µes b√°sicas eles produzem, e como combinar esses comandos para produzir a√ß√µes cada vez mais complexas.

√Ä sequ√™ncia das a√ß√µes produzidas durante a execu√ß√£o de um programa designamos por **computa√ß√£o**. A consequ√™ncia final de uma computa√ß√£o ser√°, se tudo correr bem, obter a resposta do problema inicial.

## Come√ßando com o Python

Um dos comandos do Python chama-se `print`. Este comando recebe uma frase e mostra-a no ecr√£:

In [None]:
print("Ol√° Mundo!")
print('üôãüèºüåé‚ùó')

Ol√° Mundo!
üôãüèºüåé‚ùó


L√° est√°, n√£o √© grande coisa.. mas √© s√≥ o primeiro exemplo!

Algumas notas:

+ Na programa√ß√£o √© costume chamar _strings_ a estas frases.

+ As _strings_ em Python t√™m de ser rodeadas por aspas (ou plicas). Esta √© uma das regras do Python.

+ O `print` √© um g√©nero de comando a que se chama **fun√ß√£o**. Voc√™s conhecem fun√ß√µes das aulas de Matem√°tica. Aqui s√£o um pouco diferentes, mas a ideia √© a mesma. As fun√ß√µes no Python recebem, entre par√™nteses, valores do seu dom√≠nio. Se houver mais que um valor a receber, eles t√™m de ser separados por v√≠rgulas. Aos valores enviados para as fun√ß√µes costumam-se chamar **argumentos**.

+ Quando a fun√ß√£o termina, ela ir√° devolver um valor e/ou efetuar uma a√ß√£o. No caso do `print` nada √© devolvido e a a√ß√£o √© imprimir os valores dos argumentos no ecr√£.


In [None]:
print('Ol√°', 'Mundo', '!') # podemos dar v√°rias strings como argumentos ao print

> ao escreverem o carater `#` tudo a seguir √© considerado como coment√°rio, n√£o sendo executado.

Podemos alternar a defini√ß√£o de *strings* entre as aspas `"` e as plicas `'`:

In [None]:
print('Preciso de usar uma "', "e tamb√©m uma '")

O Python tamb√©m serve como calculadora:

In [None]:
1+1

In [None]:
3*(2+1)

In [None]:
(3*(2+1))**2   # o operador ** √© a pot√™ncia

<font size="+4" color="blue;green"><b>?</b></font> Experimentem voc√™s a calculadora: quantos segundos existem num dia? Escrevam a express√£o na caixa seguinte e mandem executar.

In [None]:
# ponham aqui a vossa solu√ß√£o


Reparem que a fun√ß√£o `print` ou um operador como o `+` recebem informa√ß√£o e produzem um resultado. Costuma-se chamar √† informa√ß√£o recebida pelas fun√ß√µes de **input**, e √† informa√ß√£o ou a√ß√£o devolvida de **output**.


## Tipos e literais

Pelos exemplos acima podemos notar que existem, no Python, pelo menos dois tipos de informa√ß√£o: *strings* e n√∫meros.

Na programa√ß√£o usa-se precisamente o termo **tipo** (em ingl√™s, *type*) para separar diferentes g√©neros de informa√ß√£o.

Estes tipos que identific√°mos chamam-se `int` e `str`, abreviaturas de *integer* e *string*.

Se tivermos d√∫vidas podemos usar a fun√ß√£o `type` para nos esclarecer:

In [None]:
type(1)

In [None]:
type("Ol√° Mundo")

Uma experi√™ncia: vamos imprimir o n√∫mero 500.000, ou seja, meio milh√£o:

In [None]:
print(500.000)

O que aconteceu?

Vamos conhecer um terceiro tipo do Python:

In [None]:
type(500.000)

float

A informa√ß√£o de tipo `float` corresponde aos n√∫meros com parte decimal. E o ponto √© usado para separar a parte inteira da decimal, ao contr√°rio do que estamos habituados em Portugal.

Ou seja, no caso acima, o que n√≥s pedimos para imprimir foi o n√∫mero 500,000 ou seja, 500,0 j√° que os zeros mais √† direita da v√≠rgula (ponto?) n√£o valem nada.

O que temos aqui √© um exemplo de um *erro sem√¢ntico*. *A nossa interpreta√ß√£o pr√©via n√£o correspondia √† interpreta√ß√£o do Python*. Um erro sem√¢ntico n√£o √© um erro de acordo com a sintaxe do Python, nem tem de produzir um erro de execu√ß√£o. √â um equ√≠voco inesperado a resolver pelo programador.

E reparem na natureza subjetiva dos erros sem√¢nticos. A partir do momento em que est√° esclarecida a quest√£o, o significado de `500.000` e o efeito do `print` deixam de ser surpreendentes.

O Python tem sintaxes pr√≥prias para os valores destes diferentes tipos. Estas sintaxes pr√≥prias s√£o importantes para o Python saber qual o tipo que o programador quer usar. Por exemplo,

+ o valor `1` representa o inteiro um,

+ o valor `1/2` representa o float metade

+ o valor `"metade"` representa a frase composta pela palavra "metade"

Estas representa√ß√µes costumam ser chamadas de **literais**, onde cada literal representa um valor distinto do respetivo tipo.

Os diferentes valores do mesmo tipo podem relacionar-se atrav√©s de operadores. Vejamos uns exemplos:

In [None]:
print(120 + 300)
print(120.0 + 300.0)
print("Ol√° " + "Mundo")
print('---------')
print(3 * 2)
print(3.0 * 2.0)
print(3 * "Ping ")
print(20*'-')
print(5 // 2)
print(5 % 2)
print(5.0 / 2.0)
print('---------')
print(120 >= 100)     # >= √© o s√≠mbolo para maior ou igual
print('a' in 'banana')

Alguns coment√°rios:

+ Podemos compor v√°rios valores com v√°rias opera√ß√µes, para realizar contas arbitrariamente complexas. Estas combina√ß√µes de valores e opera√ß√µes, que s√£o avaliadas para dar um resultado, chamam-se **express√µes**.

+ A opera√ß√£o `+` pode ser usada com tipos diferentes. A adi√ß√£o de cada tipo corresponde uma fun√ß√£o distinta, executando comandos distintos. No caso das *strings*, por exemplo, o `+` efetua uma concatena√ß√£o (isto √©, junta as duas frases numa s√≥).

+ O mesmo ocorre com a opera√ß√£o `*`. Serve de multiplica√ß√£o para os tipos `int` e `float`, mas para *strings* concatena uma mesma frase $n$ vezes.

+ O caso da divis√£o √© problem√°tico para valores do tipo `int`. A express√£o `5/2` que divide dois inteiros resulta em `2.5`, mas este resultado n√£o √© inteiro... O Python distingue tr√™s (!) operadores para a divis√£o: a divis√£o habitual que pode resultar em n√∫meros decimais usa o operador `/`, o quociente e o resto da divis√£o inteira usam respetivamente os operadores `//` e `%`.

+ Opera√ß√µes como `+` e `/` s√£o fun√ß√µes como o `print` e `type`. S√≥ que por motivos hist√≥ricos estamos habituados a escrever os operadores no meio dos argumentos (chama-se *nota√ß√£o infixa*) e os nomes das restantes fun√ß√µes antes dos argumentos (*nota√ß√£o prefixa*). O Python satisfaz-nos este mau h√°bito notacional.

+ O operador `in` verifica se a primeira *string* est√° contida na segunda.

+ Os dois √∫ltimos exemplos produziram um resultado ainda n√£o visto. De que tipo √© o literal `True`?

In [None]:
type(True)

Eis o nosso quarto tipo Python. O tipo `bool` representa valores l√≥gicos e tem apenas dois valores poss√≠veis: os habituais 'verdadeiro' e 'falso' que conhecemos da L√≥gica. Os literais que os identificam s√£o `True` e `False`.

Alguns operadores l√≥gicos:

In [None]:
print(10 == 12)
print(10 != 12)             # != √© o s√≠mbolo para diferente
print(10 < 20 and 20 < 30)
print(not(1 != 2) or "Ol√°" != "Mundo")

O Python permite que tentem converter valores de um tipo noutro tipo:

In [None]:
print(int(1.0))
print(float(2))
print('---------')
print(bool(0))     # zero √© considerado Falso
print(bool(-1.5))  # qualquer outro valor √© considerado Verdadeiro
print(int(True))
print('---------')
print(int(1.4))    # converter de float para int resulta em perda de precis√£o
print(int(-1.6))
print('---------')
print(round(155.162,  2))  # fun√ß√£o que arrendonda a n casas decimais
print(round(153.162, -2))  # se n √© negativo, arredonda √†s 10s, 100s, 1000s...

As opera√ß√µes e as fun√ß√µes t√™m sempre um dom√≠nio de aplica√ß√£o. Se n√£o respeitarmos esses dom√≠nios, coisas estranhas podem acontecer:

In [None]:
print(1/0)

Aqui temos o nosso primeiro exemplo de *erro de execu√ß√£o*. Apesar de ser sintaticamente correto escrever `1/0`, o facto √© que a divis√£o n√£o admite zeros no denominador. Quando o Python tenta executar esta opera√ß√£o, resulta na paragem da computa√ß√£o. O que √© produzido, em vez do resultado esperado, √© uma mensagem de erro. Falaremos mais sobre estes erros no futuro.

Vejamos mais um exemplo de erro de execu√ß√£o. O Python tenta ser flex√≠vel se derem a um operador valores de tipos diferentes. Mas h√° certas combina√ß√µes que o Python n√£o consegue calcular:

In [None]:
print(1 + 2.0)    # o Python converte 1 para 1.0
print(1 + True)   # o Python converte True para 1
print(1 + "True") # o Python n√£o faz milagres

### O m√≥dulo `math`


Existem muitas fun√ß√µes Python para manipula√ß√£o num√©rica. V√°rias delas encontram-se no m√≥dulo `math`.

Um **m√≥dulo** Python √© um conjunto de funcionalidades organizadas tematicamente. No caso do `math` o tema √©, sem surpresa, a matem√°tica. Para usar as funcionalidades de um m√≥dulo temos de o importar com o comando `import`:

In [None]:
import math

print(math.floor(1.55))    # arredonda para baixo
print(math.ceil(1.55))     # arredonda para cima
print(math.factorial(50))  # fun√ß√£o fatorial
print(math.pi)             # constante matem√°tica
print(math.cos(math.pi/2)**2 + math.sin(math.pi/2)**2)  # cos(x)^2 + sin(x)^2 == 1

O Python √© uma das linguagens mais usadas no Mundo. O n√∫mero dispon√≠vel de m√≥dulos Python andar√° na ordem das dezenas de milhar. Os temas abordados cobrem basicamente todas as √°reas da Ci√™ncia e Matem√°tica (e n√£o s√≥). √â o seu ecossistema de funcionalidades que d√° enorme riqueza a uma linguagem de programa√ß√£o.

Terminamos esta sec√ß√£o conhecendo quatro tipos: `int`, `str`, `float`, e `bool`. √Ä medida que avan√ßarmos na mat√©ria iremos ver que o Python tem bastantes mais tipos.

Todos os tipos podem ser vistos da seguinte perspetiva: *um tipo √© um conjunto de valores relacionados por um conjunto de opera√ß√µes*.

## Vari√°veis

Uma das caracter√≠sticas de linguagens de programa√ß√£o, como o Python, √© a capacidade de armazenar informa√ß√£o enquanto a computa√ß√£o se desenrola. O Python permite-nos gerir essa informa√ß√£o com o uso de vari√°veis.

Uma **vari√°vel** √© identificada por um nome e est√° associada a um valor de um certo tipo.

Usa-se o operador de atribui√ß√£o `=` para criar vari√°veis e associar-lhes valores.


In [None]:
aMinhaPrimeiraVariavel = 1 + 2

A a√ß√£o que decorre de executar este comando √© a seguinte:

1. O Python avalia a express√£o √† direita do comando de atribui√ß√£o e armazena o seu resultado num espa√ßo de mem√≥ria, neste caso o resultado √© `3`.

1. O Python cria uma vari√°vel cujo nome √© `aMinhaPrimeiraVariavel` (se for a primeira vez que este nome aparece, sen√£o recicla a vari√°vel que j√° existe).

1. O Python associa √† respetiva vari√°vel, o valor criado pela avalia√ß√£o da express√£o.

Adiante no programa podemos recuperar o valor associado √† vari√°vel:

In [None]:
aMinhaSegundaVariavel = 4

print(aMinhaPrimeiraVariavel + aMinhaSegundaVariavel)

### Leitura e Escrita de Vari√°veis



Uma vari√°vel pode aparecer √† direita do operador de atribui√ß√£o, no meio de uma express√£o. Neste caso, o Python vai buscar o valor associado √† vari√°vel e usa-o na express√£o.

In [None]:
umValor = 100
oValorSeguinte = umValor + 1

print(oValorSeguinte)

E at√© pode aparecer nos dois lados ao mesmo tempo:

In [None]:
umValor = 100
umValor = 2 * umValor

print(umValor)

Vamos esclarecer uma d√∫vida comum: uma vari√°vel do Python n√£o √© uma vari√°vel matem√°tica. Quando escrevemos uma equa√ß√£o $x = x + 1$, esta equa√ß√£o n√£o pode ser satisfeita em $x \in \mathbb{R}$.

Mas em Python $x = x + 1$ n√£o tem esta sem√¢ntica. O operador `=` n√£o representa igualdade mas sim atribui√ß√£o. Quando avaliamos o comando `x = x + 1` o que estamos a dizer √© o seguinte:

1. Avaliar a express√£o `x + 1` guardando o resultado num espa√ßo de mem√≥ria

2. Associar esse resultado √† vari√°vel `x`

## Exerc√≠cios

O Python inclui as denominadas _f-strings_ que facilitam a inclus√£o de valores de vari√°veis. Eis um exemplo:

In [None]:
baseTriangulo   = 10.0
alturaTriangulo = 5.0
areaTriangulo   = baseTriangulo * alturaTriangulo / 2

report = f'A base do tri√¢ngulo √© {baseTriangulo}cm, a altura √© {alturaTriangulo}cm, ' \
         f'o que resulta numa area de {areaTriangulo}cm¬≤'               # usar \ para mudar de linha

print(report)

A base do tri√¢ngulo √© 10.0cm, a altura √© 5.0cm, o que resulta numa area de 25.0cm¬≤


<font size="+4" color="blue;green"><b>?</b></font>
Escreva um programa que produza o seguinte output

          A maria tem 165cm de altura, o que tamb√©m √© dizer que tem 1.65m
          O joao tem 170cm de altura
          A soma das suas alturas, em mm, √© de 3350mm

In [None]:
alturaMaria = 165
alturaJoao = 170

# ponham aqui a vossa solu√ß√£o

---

Podem usar a fun√ß√£o `input` para receber dados do utilizador (t√™m de premir `ENTER` no fim):

In [None]:
idade = input('Que idade tem? ')

In [None]:
anoNascimento = input('Nasceu em que ano? ')

Esta fun√ß√£o devolve o que foi escrito numa _string_.

<font size="+4" color="blue;green"><b>?</b></font> Agora complete o programa para que, baseado nos valores inseridos, se imprima uma frase como a seguinte:

`Ent√£o estamos no ano 2023 ou 2024`

In [None]:
# ponham aqui a vossa solu√ß√£o

---

<font size="+4" color="blue;green"><b>?</b></font> Considere a seguinte situa√ß√£o:

> A Ana foi ao mercado e comprou 1.5Kg de cenouras (a 0.75‚Ç¨/Kg), tr√™s alfaces (cada unidade custa 43 c√™ntimos) e 2 Kg de tomate (a 1.25‚Ç¨/Kg). Quando dinheiro gastou a Ana?

Modele e resolva este problema usando vari√°veis adequadas.

In [None]:
# ponham aqui a vossa solu√ß√£o

---

<font size="+4" color="blue;green"><b>?</b></font> Pe√ßa ao utilizador tr√™s n√∫meros inteiros. Imprima o n√∫mero do meio.

dica: o Python tem dispon√≠veis os comandos `max` e `min`.

In [None]:
# ponham aqui a vossa solu√ß√£o

## Tipos Estruturados

Anteriormente conhecemos quatro tipos do Python, o `int` e `float` para representar n√∫meros; o tipo `str` que representa frases; e o tipo `bool` que representa valores l√≥gicos.

O tipo `str` era um pouco diferente dos outros. As *strings* podem ser vistas como representando uma sequ√™ncia de caracteres; enquanto para os restantes tipos, um literal representa apenas um valor. Para salientar esta distin√ß√£o dizemos que as *strings* s√£o **tipos estruturados**.

Vamos conhecer outros tipos estruturados do Python ainda mais vers√°teis que as *strings*. As *strings* apenas podem conter caracteres, mas estes novos tipos podem conter m√∫ltiplos valores de outros tipos √† escolha do programador.

### Tuplos

O tipo **tuplo** √© inspirado no tuplo matem√°tico: corresponde uma sequ√™ncia fixa de valores, ou **componentes**, de um ou mais tipos.

A sintaxe para definir um tuplo √© usar par√™nteses, separando os valores de cada componente por v√≠rgulas.

Um exemplo: estamos todos habituados a definir um ponto a tr√™s dimens√µes como um triplo de coordenadas. Ora um triplo √© um tuplo com tr√™s componentes.

In [None]:
ponto3D = (1.0, 2.0, 3.0)

print(ponto3D)

O n√∫mero de componentes de um tuplo e o seu conte√∫do s√£o definidos no momento em que o tuplo √© avaliado.

In [None]:
umNome = ("Jo√£o", "Neto") # um par de strings

print(umNome)

Se quisermos definir um tuplo com apenas uma componente temos de usar a seguinte sintaxe:

In [None]:
singleton = ("estou sozinho", )

print(singleton)

Como referido no in√≠cio, as componentes podem ser de tipos distintos:

In [None]:
# exemplo de um registo com nome, apelido, identificador, altura e se √© docente
registoPessoa = ("Jo√£o", "Neto", 12345, 1.72, True)

Podemos usar o operador de atribui√ß√£o para aceder √†s componentes do tuplo,

In [None]:
nome, apelido, idProf, altura, eProfessor = registoPessoa

print( f"{nome} tem {altura}m de altura" )

Dado um tuplo podemos aceder √†s componentes que quisermos atrav√©s da sintaxe `tuplo[i]`. O valor `i` √© chamado de **√≠ndice**. O √≠ndice √© a posi√ß√£o da componente no tuplo que queremos. Por conven√ß√£o, a primeira componente de um tuplo tem √≠ndice zero.

In [None]:
print( f"{registoPessoa[0]} tem {registoPessoa[3]}m de altura" )

Aos tipos estruturados que podemos aceder √†s componentes via √≠ndices chamamos de **tipos indexados**.

Outro tipo indexado s√£o as *strings*. Podemos usar o mesmo mecanismo para aceder a certos caracteres da frase:

In [None]:
umaString = "Ol√° Mundo"

print(umaString[2])

O Python √© bastante uniforme como trata os seus tipos estruturados. Todos os tipos estruturados que sejam indexados usam esta sintaxe dos par√™nteses retos para aceder √†s suas componentes.

Os tuplos t√™m algumas fun√ß√µes associadas:

+ a soma de dois tuplos junta as componentes num tuplo resultado

+ a multiplica√ß√£o de um tuplo por um inteiro resulta na sucessiva soma do tuplo consigo pr√≥prio

+ `index` devolve o primeiro √≠ndice onde est√° uma dada componente

+ `count` conta quantos componentes s√£o iguais a um dado valor

+ `len` devolve o n√∫mero de componentes

In [None]:
oMeuTuplo = (1, 2, 3, 1, 1, 9)

print(oMeuTuplo + oMeuTuplo)
print(oMeuTuplo * 2)
print(oMeuTuplo.index(3)) # a primeira ocorr√™ncia de 3 est√° no √≠ndice 2
print(oMeuTuplo.count(1)) # existem tr√™s ocorr√™ncias do valor 1
print(len(oMeuTuplo))     # o tuplo tem seis componentes

Reparem que a sintaxe para executarmos estas fun√ß√µes nem sempre foi a mesma. Para o `index` e `count` us√°mos um ponto para separar o tuplo da fun√ß√£o. Ainda √© cedo para explicar o porqu√™ desta diferen√ßa.


Uma √∫ltima nota sobre os tuplos. Uma vez definido um tuplo n√£o o podemos alterar. Vamos tentar para ver o que acontece:

In [None]:
umTuplo = (1, 2, 3)

umTuplo[1] = 0

Ocorreu um erro de execu√ß√£o porque tent√°mos alterar uma das componentes do tuplo. Um tipo cujos valores n√£o se podem modificar designa-se por **imut√°vel**.

Outro tipo imut√°vel que j√° conhecemos s√£o as *strings*.

In [None]:
umaString = "ol√° Mundo"

umaString[0] = "O"

Em contraste, num tipo **mut√°vel** os seus valores podem ser modificados. Na sec√ß√£o seguinte vamos apresentar um tipo  mut√°vel, as listas.

### Listas

As listas s√£o, provavelmente, o tipo estruturado mais importante do Python.

Uma **lista** √© um tipo indexado mut√°vel que armazena uma sequ√™ncia de valores. Sendo mut√°vel significa que √© poss√≠vel alterar, durante a execu√ß√£o do programa, os elementos de uma lista.

E, enquanto um tuplo tem um n√∫mero fixo de componentes, o n√∫mero de elementos guardados numa lista pode variar.

As listas s√£o identificadas sintaticamente por par√™nteses retos `[]` sendo os v√°rios valores separados por v√≠rgulas. Apesar dos par√™nteses retos serem o mesmo elemento sint√°tico que usamos para indexar, o Python n√£o se confunde.


In [None]:
umaLista = [1, 2, 3]

print(umaLista)
print(umaLista[0])

Algumas fun√ß√µes √∫teis para manipula√ß√£o de listas:

+ o operador `+` concatena duas listas

+ o operador `*` multiplica o conte√∫do de uma lista (similar aos tuplos)

+ o operador `in` verifica se um elemento est√° numa lista

+ `len(lista)` devolve o n√∫mero de elementos da lista

+ `lista.append(x)` junta o elemento `x` ao fim da lista

+ `lista.extend(xs)` junta os elementos do tipo estruturado `xs` ao fim da lista

+ `lista.insert(i, x)` insere o elemento `x` no √≠ndice `i` (a lista cresce um elemento)

+ `lista.remove(x)` remove da lista a primeira ocorr√™ncia do elemento `x`

+ `lista.sort()` ordena a lista por ordem crescente *desde* que os elementos sejam compar√°veis entre si.

In [None]:
umaLista.append(4)
print(umaLista)

print(10 in umaLista)  # o elemento 10 pertence √† lista?

umaLista.extend ([5, 10] )
print(umaLista)

umaLista.extend( (2, True) ) # podem ter valores de tipos diferentes, como nos tuplos
print(umaLista)

umaLista.insert(1, "Ol√°!")
print(umaLista)

As listas s√£o t√£o flex√≠veis que at√© podemos ter listas de listas (de listas (de listas (...))),

In [None]:
listaDeListas = [ [3,4,5], [6,8,9] ]

Este tipo de organiza√ß√£o pode ser √∫til para representar estruturas como tabelas ou matrizes.

### Listas por Compreens√£o

As listas por compreens√£o √© uma funcionalidade do Python para criar, de forma concisa, listas baseadas em outros valores estruturados.

A ideia da nota√ß√£o que vamos aprender inspira-se na nota√ß√£o usada na Matem√°tica para definir conjuntos.

Por exemplo, este conjunto representa todos os quadrados de n√∫meros naturais menores que 20:

$$\{ x^2 : x \in \mathbb{N^+}, x < 20 \}$$

como podemos criar uma lista com os mesmos elementos?

In [None]:
lista = [ x**2 for x in range(1, 20) ]

print(lista)

Vamos olhar com aten√ß√£o para este comando.

<center><code>  <font size="+1">[ <font color='red'>x**2</font> <font color='blue'>for</font>  <font color='red'>x</font> <font color='blue'>in</font>  <font color='purple'>range(1, 20)</font> ]
</font></code></center>

+ A express√£o inicial `x**2` corresponde √† express√£o comum partilhada pelos elementos da lista final. Neste caso ser√£o quadrados de um certo n√∫mero `x`.

+ O que se escreve a seguir √† palavra reservada <font color='blue'>for</font> define como os v√°rios `x` v√£o ser gerados.

+ <font color='red'>x</font> <font color='blue'>in</font>  <font color='purple'>range(1, 20)</font> define como se geram os valores `x`. Neste caso usamos uma fun√ß√£o especial do Python `range` que gera todos os n√∫meros de 1 a 20 (exclusive).

* √Ä vari√°vel `x` que vai recebendo os valores do gerador costumamos chamar de **vari√°vel de progresso**.



Vejamos algumas varia√ß√µes:

In [None]:
print( [ x**3 for x in range(1,20)] )  # mudar a express√£o de x^2 para x^3

print( [ x**2 for x in range(5,10)] )  # mudar o range

print( [ x**2 for x in range(10) ] )   # range(n) gera 0,1,...,n-1

print( [ x for x in range(20,1,-2) ] ) # range(a,b,c) gera a,...,b com acrescentos c

Se o valor da vari√°vel de progresso n√£o for relevante para a constru√ß√£o dos valores da lista, √© costume nomear a vari√°vel de progresso por `_` :

In [None]:
print( [ 1 for _ in range(10) ] )  # lista de dez uns

O uso do *underscore* neste contexto d√° uma pista extra a quem l√™ o c√≥digo, porque indica que o valor da vari√°vel de progresso n√£o tem impacto na constru√ß√£o dos valores da lista.

A express√£o inicial n√£o precisa ser num√©rica. Alguns exemplos de outros tipos:

In [None]:
print( [ x>3 for x in range(6) ] )

print( [ (x, x>3) for x in range(6) ] )

print( [ [x, x+1] for x in range(4) ] )

<font size="+4" color="blue;green"><b>?</b></font> Escreva listas por compreens√£o para representar:

+ Todos os inteiros pares entre -10 de 10

+ Todos os tuplos $(n, 2n)$ com $0 \leq n < 8$

+ Todas as listas `[1], [1,2], [1,2,3], ... [1,2,3,4,5,6]`

In [None]:
# ponham aqui a vossa solu√ß√£o

In [None]:
#@title
print( [ x for x in range(-10,11,2) ] )
print( [ 2*x for x in range(-5,6) ] )

print( [ (n, 2*n) for n in range(0,8) ] )

print( [ [n+1 for n in range(size)] for size in range(1,7) ] )
print( [ list(range(1,size+1)) for size in range(1,7) ] ) # alternativa

### Outras opera√ß√µes sobre listas por compreens√£o

As listas por compreens√£o permitem  eliminar certos valores que n√£o queiramos.

Um **filtro** √© uma express√£o booleana que tem de ser satisfeita para que o  elemento em quest√£o fa√ßa parte da lista final. Um filtro surge depois da palavra reservada `if`.

No exemplo seguinte, vamos devolver todos os tuplos poss√≠veis $(x,y)$, onde $1 \leq x,y \leq 3$, desde que $x \neq y$:

In [None]:
[ (x, y) for x in range(1,4)
         for y in range(1,4)
         if x != y ]

As listas por compreens√£o permitem ter geradores em sequ√™ncia

In [None]:
[ (x, y) for x in range(1,4) for y in range(6,9) ]

Quando colocamos dois geradores `g1, g2` em sequ√™ncia, para cada valor gerado de `g1`, o gerador `g2` √© reiniciado para gerar todos os seus n√∫meros. Isto significa que quanto mais para o fim um gerador tiver na sequ√™ncia, mais trabalho ele vai ter:

In [None]:
[ (x, y, z) for x in range(1,3)
            for y in range(6,9)
            for z in range(-2,0) ]

Para al√©m de geradores em sequ√™ncia, existe tamb√©m a possibilidade de gerar valores em 'paralelo' com a fun√ß√£o `zip`. Neste caso, os valores dos dois (ou mais) geradores v√£o sendo gerados em simult√¢neo,

In [None]:
[ x*y for (x,y) in zip(range(1,4), range(5,8)) ]  # [1*5, 2*6, 3*7, 4*8]

### Tipos estruturados como geradores


Nas listas de compreens√£o temos usado `range` para gerar valores.

O Python tamb√©m permite usar tipos estruturados como geradores.

Alguns exemplos:

In [None]:
print( [ x for x in ("Jo√£o Neto", 41455, 1.72, True) ] )  # gerador com tuplo

print( [ x for x in "Jo√£o Neto" ] )                       # gerador com string

print( [ str(x) for x in [1, 2, 3] ] )                    # gerador com listas

A fun√ß√£o `range` pode ser usada fora das listas por compreens√£o para criar listas simples:

In [None]:
tabuadaDos9 = list(range(9,91,9))

print(tabuadaDos9)

## Estudo de um Problema

Vamos terminar este cap√≠tulo com a resolu√ß√£o de um problema mais elaborado. O tema √© o  lan√ßamento de dados.

Para representar o lan√ßamento aleat√≥rio de dados temos de usar o m√≥dulo `random` que inclui fun√ß√µes para gerar n√∫meros aleat√≥rios. No nosso caso, vamos trabalhar com a fun√ß√£o `randint(a,b)` que gera um inteiro entre `a` e `b` (inclusive).

In [None]:
import random

print([random.randint(1,6) for _ in range(10)])  # lan√ßamento de dez dados

O problema √© este. Se lan√ßarmos tr√™s dados e os somarmos, sabemos que h√° resultados mais prov√°veis que outros. Por exemplo, a soma 3 (todos os dados sa√≠ram na face um) √© mais improv√°vel de sair que a soma 10. Gostar√≠amos de saber as propor√ß√µes dos v√°rios valores poss√≠veis da soma.

Este √© uma pergunta t√≠pica de probabilidades. N√≥s aqui vamos tentar dar uma resposta aproximada atrav√©s de uma simula√ß√£o. O que significa simular neste contexto?

Podemos usar o Python para realizar a experi√™ncia de lan√ßar tr√™s dados e som√°-los:

In [None]:
numDados = 3

lancamentoDados = [random.randint(1,6) for _ in range(numDados)]
experiencia = sum(lancamentoDados)

print(experiencia)

Se fizermos esta experi√™ncia *muitas* vezes, e contabilizarmos as v√°rias somas que v√£o saindo, podemos ter uma boa ideia das propor√ß√µes para cada valor da soma.

In [None]:
numExperiencias = 100_000

# repetir muitas vezes a experi√™ncia, ie, lan√ßar os dados e somar
experiencias = [ sum([random.randint(1,6) for _ in range(numDados)])
                 for _ in range(numExperiencias) ]

# os resultados poss√≠veis de somar tr√™s dados v√£o de 3 a 18, ie, range(3,19)
somas = [ experiencias.count(resultado) for resultado in range(3,19) ]

# transformar em propor√ß√µes
proporcoes = [ soma/numExperiencias for soma in somas ]

print(proporcoes)

Podemos criar um relat√≥rio mais informativo:

In [None]:
[ print(f'propor√ß√£o de somar {resultado:2d} √© ‚âà {100*proporcoes[resultado-3]:4.1f}%')
  for resultado in range(3,19) ];

## Exerc√≠cios

<font size="+4" color="blue;green"><b>?</b></font> Dada a vari√°vel `palavras` com uma lista de *strings*, crie uma lista com as mesmas palavras mas onde adicionamos um 's' no final de cada. Usa listas por compreens√£o.

Lembre-se que pode concatenar duas *strings* com o operador `+`.

In [None]:
palavras = ['monte', 'montanha', 'vale', 'praia']

# ponham aqui a vossa solu√ß√£o

<font size="+4" color="blue;green"><b>?</b></font> Usando listas por compreens√£o crie uma lista com os primeiros 20 pares positivos.

In [None]:
# ponham aqui a vossa solu√ß√£o

<font size="+4" color="blue;green"><b>?</b></font> Dados dois inteiros $1 \leq a \leq b$, escreva uma lista por compreens√£o que contenha apenas os valores $x$ tais que $a \leq |x| \leq b$.

In [None]:
a, b = 6, 9

# ponham aqui a vossa solu√ß√£o

<font size="+4" color="blue;green"><b>?</b></font>
Implemente uma lista por compreens√£o que junta duas listas do mesmo tamanho, elemento a elemento, numa lista de pares.

Por exemplo, dadas as listas `[10,20,30]` e `[90,80,70]`, o resultado ser√° `[(10,90), (20,80), (30,70)]`.

In [None]:
lista1 = [10,20,30]
lista2 = [90,80,70]

# ponham aqui a vossa solu√ß√£o

<font size="+4" color="blue;green"><b>?</b></font> Achatar uma lista (do ingl√™s, *flatten a list*) significa converter uma lista de listas numa lista simples.

Com uma lista por compreens√£o, achate a lista `[[1,2,3], [4,5,6], [7,8,9]]`

In [None]:
lista = [[1,2,3], [4,5,6], [7,8,9]]

# ponham aqui a vossa solu√ß√£o

<font size="+4" color="blue;green"><b>?</b></font> Considere que tem uma tabela de $3 \times 4$ n√∫meros organizados numa lista de listas. Pretendemos transpor a tabela, isto √©, trocar as linhas pelas colunas. Fa√ßa-o com uma lista por compreens√£o.

In [None]:
tabela = [ [ 1,  2,  3,  4],
           [ 5,  6,  7,  8],
           [ 9, 10, 11, 12] ]

# ponham aqui a vossa solu√ß√£o
# tem de resultar em [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

## Conjuntos

O tipo **conjunto**, em Python `set`, representa a no√ß√£o de conjunto que conhecemos da Matem√°tica: uma cole√ß√£o de valores sem repeti√ß√µes nem ordem.

Este tipo tem as seguintes caracter√≠sticas:

+ N√£o existe uma ordem dos elementos, nem uma indexa√ß√£o

+ Os conjuntos n√£o admitem repeti√ß√µes. Cada valor do conjunto √©, por defini√ß√£o, √∫nico

+ S√£o valores mut√°veis, as opera√ß√µes sobre conjuntos alteram o pr√≥prio conjunto

+ Por√©m, os valores guardados num conjunto t√™m de ser imut√°veis! N√£o podemos ter, por exemplo, conjuntos de conjuntos ou conjuntos de listas

Vejamos como definir conjuntos e algumas das opera√ß√µes que podemos usar:

In [None]:
conjuntoVazio = set()

conjunto1 = { 1, 2, 3, 4 }
conjunto2 = { 1, 3, 5, 6, 7 }

In [None]:
print("conjunto1 tem", len(conjunto1), "elementos")
print("1 pertence a", conjunto1, "? ", 1 in conjunto1)
print('-'*30)
print("Uni√£o            =", conjunto1 | conjunto2 )
print("Intersec√ß√£o      =", conjunto1 & conjunto2 )
print("Diferen√ßa        =", conjunto1 - conjunto2 )
print("Ou num ou noutro =", conjunto1 ^ conjunto2 )
print('-'*30)
print(f'{conjunto1} est√° contido em {conjunto2}? {conjunto1 < conjunto2}')

Os conjuntos s√£o √∫teis no caso em que queremos remover os duplicados de uma lista. Como? Convertendo a lista para um conjunto, os duplicados s√£o removidos. Depois √© s√≥ reconverter para lista:

In [None]:
def uniques(xs):
  return list(set(xs))

lista = [4,3,2,6,5,2,3,1,3,2,6,6]

print(uniques(lista))

Podemos usar conjuntos para descobrir diferen√ßas entre duas *strings*:

In [None]:
set('abcdefg') - set('abdghij')

## Dicion√°rios

O tipo Python `dict`, designado por **dicion√°rio**, tem como objetivo organizar informa√ß√£o onde se usam valores √∫nicos (designados **chaves**) que se associam a certas informa√ß√µes.

Por exemplo, a base de dados dos alunos de uma escola pode ser armazenada num dicion√°rio. As chaves s√£o os n√∫meros de aluno e a informa√ß√£o associada a cada chave √© todo o registo do respetivo aluno (onde se inclui o seu nome completo, a morada, o telefone, etc.)

O tipo dicion√°rio tem as seguintes caracter√≠sticas:

+ S√£o estruturas mut√°veis (como as listas e conjuntos)

+ N√£o existe uma ordem dos seus valores (como nos conjuntos e ao contr√°rio das listas)

+ Guarda sempre pares (*chave*, *valor*)

+ S√£o indexados pela chave (e n√£o por um √≠ndice inteiro como era o caso nas listas e tuplos)

+ As chaves t√™m de ser imut√°veis; os valores associados n√£o possuem restri√ß√µes

+ Se colocarmos um dicion√°rio num ciclo `for`, s√£o devolvidas as chaves pela ordem em que foram inicialmente inseridas

Existe uma sintaxe pr√≥pria para criar dicion√°rios:

In [None]:
dicionarioVazio = { }

# um dicion√°rio de pa√≠ses, onde cada chave identifica um registo de pa√≠s
paises = { 'PT' : ('Portugal', 'Lisboa', 10_310_000),
           'ES' : ('Espanha',  'Madrid', 47_350_000),
           'FR' : ('Fran√ßa',   'Paris',  67_390_000) }

E temos dispon√≠vel um conjunto de comandos:

In [None]:
print( paises['PT'] ) # aceder ao valor associado √† chave 'PT'

print('-'*20)
print(f"Existem {len(paises)} pares no dicion√°rio paises")
print("As chaves do dicion√°rio s√£o:" , list(paises.keys()) )
print("Os valores do dicion√°rio s√£o:", list(paises.values()) )
print("Os pares do dicion√°rio s√£o:"  , list(paises.items()) )
print("A chave 'FR' existe no dicion√°rio?", 'FR' in paises )
print('-'*20)

for chave in paises:
  print(chave, ':', paises[chave])

O Python permite a constru√ß√£o de dicion√°rios por compreens√£o:

In [None]:
quadrados = { x : x**2 for x in range(6) }
print(quadrados)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25}


Sendo mut√°vel podemos manipular o conte√∫do de um dicion√°rio,

In [None]:
quadrados[6] = 35   # inserir novos pares
print(quadrados)

del(quadrados[0])   # apagar um par
print(quadrados)

quadrados[1] = 2    # alterar o valor de uma chave existente
print(quadrados)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 35}
{1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 35}
{1: 2, 2: 4, 3: 9, 4: 16, 5: 25, 6: 35}


### Exemplos de Uso


Podemos usar dicion√°rios para organizar informa√ß√£o complexa.

Por exemplo, seja a seguinte lista com filmes:

In [None]:
baseDadosFilmes = [
   ("Blade Runner 2049", 2017),
   ("Logan", 2017),
   ("The Insult", 2017),
   ("A Quiet Place", 2018),
   ("Joker", 2019),
   ("Parasite", 2019),
   ("Mangrove", 2020),
   ("A Hero", 2021),
   ("Pig", 2021),
   ("Dune", 2022),
   ("The Northman", 2022),
   ("Triangle of Sadness", 2022),
  ]

Podemos usar um dicion√°rio para indexar os filmes por ano:

In [None]:
filmesPorAno = {}

for nome,ano in baseDadosFilmes:
  if ano not in filmesPorAno:
    filmesPorAno[ano] = [nome]
  else:
    filmesPorAno[ano].append(nome)

In [None]:
for ano in filmesPorAno:
  print(ano, ':', filmesPorAno[ano])

A fun√ß√£o `get(chave, default)` devolve o valor associado √† chave, ou devolve o valor _default_ se a chave n√£o existir. Esta fun√ß√£o permite simplificar o ciclo anterior:

In [None]:
filmesPorAno = {}

for nome,ano in baseDadosFilmes:
  filmesPorAno[ano] = filmesPorAno.get(ano, []) + [nome]

Podemos utilizar dicion√°rios para guardar informa√ß√£o que √© indexada com tuplos de $n$ componentes. Um exemplo s√£o as [matrizes esparsas](https://en.wikipedia.org/wiki/Sparse_matrix), matrizes muito grandes que possuem poucos valores diferentes de zero. Talvez o
exemplo mais famoso sejam as folhas Excel.

In [None]:
folhaExcel = {}

folhaExcel[('B', 3)] = 10
folhaExcel[('B', 4)] = 90
folhaExcel[('B', 5)] = '=SOMA(B3:B4)'

try:
  print(folhaExcel[('B', 6)])
except KeyError:      # exce√ß√£o Python para quando a chave n√£o existe
  print(0)

print(folhaExcel.get(('B', 6), 0))  # em alternativa ao 'try'

## Exerc√≠cios

Considere os  conjuntos definidos na caixa seguinte.

In [None]:
professores = { 'ana', 'bruno', 'dulce', 'rui', 'sandra', 'z√©' }
engenheiros = { 'ana', 'diogo', 'sofia' }

<font size="+4" color="blue;green"><b>?</b></font> Responda a estas perguntas com as opera√ß√µes dispon√≠veis para conjuntos:

+ √â a Ana uma engenheira?

+ Quem √© professor e engenheiro?

+ Todas as pessoas em qualquer das categorias

+ Engenheiros que n√£o s√£o professores

+ Professores que n√£o s√£o engenheiros

+ S√£o todos os professores, engenheiros?

+ Quem √© ou professor ou engenheiro?


In [None]:
# ponham aqui a vossa solu√ß√£o

<font size="+4" color="blue;green"><b>?</b></font> Crie um dicion√°rio que representa um stock de uma loja. Este stock √© constitu√≠do por registos de produtos. Cada produto √© identificado por um c√≥digo num√©rico ao qual est√° associado: (a) um nome, (b) o custo por unidade, (c) quantas unidades existem no stock.

Considere que a loja tem quatro produtos, alperces, bananas, cerejas e di√≥spiros, com c√≥digos 1, 2, 3, e 4 respetivamente. Os respetivos custos s√£o 12.0, 5.5, 15.7 e 20.0. As respetivas quantidades s√£o 700, 500, 350, 50.

In [None]:
stock = {  }   # ponham aqui a vossa solu√ß√£o

<font size="+4" color="blue;green"><b>?</b></font> Defina um dicion√°rio que indique as quantidades de moedas e notas (at√© 50‚Ç¨) de uma caixa de supermercado. Escolha valores exemplo para as moedas e notas.

O primeiro passo a decidir √© como representar as moedas e notas nas chaves do dicion√°rio.

In [None]:
caixa = {  }   # ponham aqui a vossa solu√ß√£o