# Introdução básica ao Python (I)

**Shell virtual do curso**: https://fegalaz.usc.es/linux/  
  
**Notebook da sessão 1**: https://i.gal/python1  
**Notebook da sessão 2**: https://i.gal/python2  

**Introdução ao Jupyter Notebook**: https://programminghistorian.org/pt/licoes/introducao-jupyter-notebooks

# Instalação

## Implementação de referência

1.   **Windows**

> https://www.python.org/downloads/windows/


2.  **Linux**

- Pacotes incluídos em cada distribuição.

> `sudo apt install python3`  
> `sudo dnf install python3`   
> `sudo pacman -Ss python3`   
etc

- Compilação a partir das fontes.

> https://www.python.org/downloads/source/

3. **MacOS**

> https://www.python.org/downloads/macos/

Outras implementações:

> https://en.wikipedia.org/wiki/List_of_Python_software#Python_implementations

## Distribuição Anaconda3

Uma distribuição orientada para Data Science e que usa o `conda` como gestor de pacotes.

> https://www.anaconda.com/download#downloads

Se apenas estiver interessado no gestor conda e não na distribuição completa, uma alternativa é o `Miniconda`.

> https://docs.anaconda.com/free/miniconda/

# IDEs

- pyCharm: https://www.jetbrains.com/pycharm/
- VSCodium: https://vscodium.com
- spyder: https://www.spyder-ide.org


# Ambientes virtuais

São utilizados para criar ambientes isolados com módulos instalados.

## `venv`

Criação e ativação de um ambiente com `venv`:

> `$ python -m venv env`  
> `$ source env/bin/activate`

Uma vez criado e ativo, podemos instalar módulos através do `pip`.

> `$ pip install spacy`

Para deactivar o ambiente:

> `$ deactivate`

## `miniconda`

Instalação de `miniconda` (Windows, MacOS e Linux):

https://docs.anaconda.com/miniconda/

Criação e ativação de um ambiente com `miniconda`:

> `conda create --name env`
> `conda activate env`

Uma vez criado e ativo, podemos instalar módulos utilizando `conda`:

> `conda install spacy`

Para deactivar o ambiente:

> `conda deactivate`

# Um programa Python

Um script ou programa Python é um conjunto de definições (por exemplo, variáveis ou funções) e comandos. Para executar código Python, podemos optar por sessões interactivas (intérprete de linha de comandos, *jupyter notebooks*, Google Colab, etc) ou por guardar o código num ficheiro e depois executá-lo com o intérprete.

As linhas de código que começam por `#` são consideradas comentários e não são tidas em conta pelo intérprete.

## Interativo

In [None]:
# Imprime a sequência Olá mundo
print("Olá mundo")

Olá mundo


## Não interativo

> `$ echo 'print("Olá mundo")' > olamundo.py`  
> `$ python olamundo.py`

## Indentação

Os scripts Python mantêm uma indentação estrita: as expressões que estão ao mesmo nível (dentro do mesmo bloco) devem ter a mesma indentação, e a indentação deve ser consistente em todo o script.

In [None]:
# Correto
for x in [1, 2, 3]:
    print(x)
    print(x * x)

1
1
2
4
3
9


In [None]:
# Incorreto (erro de indentação)
for x in [1, 2, 3]:
    print(x)
       print(x * x)

In [None]:
# Bug?
for x in [1, 2, 3]:
    print(x)
print(x * x)

1
2
3
9




---



# Variáveis

As variáveis permitem guardar valores para serem utilizados mais tarde. Para as declarar utilizamos o operador de assignação `=`.

In [None]:
# Numéricas
x = 5
y = 3.98

# Cadeias curtas, rodeadas de ' ou "
text = 'amostra de cadeia'
text2 = "outra amostra de cadeia"

# Cadeias longas ou contendo " ou saltos de linha
long_text = """Lorem ipsum dolor sit amet, consectetur adipiscing elit,
sed do eiusmod tempor incididunt "ut labore et dolore
magna aliqua". Ut enim ad minim veniam."""

In [None]:
print(x * y)

19.9


In [None]:
print(long_text)

Lorem ipsum dolor sit amet, consectetur adipiscing elit,
sed do eiusmod tempor incididunt "ut labore et dolore
magna aliqua". Ut enim ad minim veniam.


# Tipos de dados


Em Python, a atribuição de dados a um nome de variável define o tipo e o intervalo de valores que um objeto pode ter.

## Tipos de dados básicos: escalares

Os escalares são dados que não podem ser subdivididos.

### Numéricos

| Subtipo     | Palavra reservada | Exemplo |
|-------------|-------------------|---------|
| Enteiros    | `int`             | 3       |
| Decimais    | `float`           | 3.89    |

In [None]:
n_int = 3
n_float = 3.89

### Cadeias


In [None]:
v_string = "Este é um exemplo"
single_q = 'Este é outro exemplo'

Podemos determinar o tamanho de uma cadeia através da função `len`.

In [None]:
len(v_string)

Para concatenar duas cadeias, podemos utilizar o operador `+`.

In [None]:
str1 = "ola"
str2 = "mundo"

print(str1 + " " + str2)

ola mundo


Este operador `+` tem efeitos diferentes conforme seja aplicado a cadeias de caracteres ou a números.

In [None]:
n1 = 2
n2 = 2
n1 + n2

4

In [None]:
s1 = "2"
s2 = "2"
s1 + s2

'22'

### Booleanos

Com apenas dois valores possíveis: `True` e `False`

In [None]:
v_boolean = True

### Indefinido (NoneType)

Têm um único valor (`NoneType`).

In [None]:
v_none = None

Com `type()` podemos conhecer o tipo de um objeto.

In [None]:
type(n_int)

int

In [None]:
type(n_float)

float

In [None]:
type(v_string)

str

In [None]:
type(v_boolean)

bool

In [None]:
type(v_none)

NoneType

In [None]:
x = 3.89
y = '3.89'

print('Tipo de x: ', end='')
print(type(x))

print('Tipo de y: ', end='')
print(type(y))

Tipo de x: <class 'float'>
Tipo de y: <class 'str'>


### Exercícios

1. Define dúas variáveis numéricas
  - *`year`* (contendo o ano atual)
  - *`pi`* (contendo o valor de PI)

2. Imprime o contido de `year`.

3. Imprime o tipo de dado de `year`.

4. Imprime o seguinte texto:

Há uma velha maldição que diz: "Que vivas em tempos interessantes".

## Tipos de dados complexos (não escalares)

### Listas

Sequências ordenadas e mutáveis de valores que podem ser acedidas através do seu índice expresso entre parênteses rectos. Este índice começa a contar a partir de zero. Se o índice for negativo, conta-se a partir do fim.

In [1]:
cores = ["amarelo", "cinzento", "verde"]
print(cores[1])
print(cores[-3])

cinzento
amarelo


É possível declarar uma lista sem a inicializar, a fim de lhe atribuir valores mais tarde, utilizando os seguintes métodos:

* `append`: acrescenta um elemento ao final da lista
* `insert`: insere um elemento na posição especificada
* `extend`: estende uma lista com os conteúdos de outra lista

In [14]:
# Declaração
mais_cores = []

In [15]:
# Asignação de valores utilizando append
mais_cores.append("laranja")
mais_cores.append(["preto", "branco"])
mais_cores.append("azul")

print(mais_cores)

['laranja', ['preto', 'branco'], 'azul']


In [16]:
# O que acontece se eu imprimo o item que está no índice 1?
print(mais_cores[1])

['preto', 'branco']


In [17]:
# Asignação de valores utilizando insert
mais_cores.insert(2, "verde")

print(mais_cores)

['laranja', ['preto', 'branco'], 'verde', 'azul']


In [18]:
# Extensão da lista utilizando extend
mais_cores.extend(["branco", "amarelo"])

In [19]:
# E agora? Que pasa se imprimo o último elemento da lista?
print(mais_cores[-1])

amarelo


In [20]:
# Impressão da lista final
print(mais_cores)

['laranja', ['preto', 'branco'], 'verde', 'azul', 'branco', 'amarelo']


Também podemos eliminar itens de uma lista:

- `pop`: elimina o índice especificado
- `remove`: elimina o valor especificado

In [12]:
cores = ['laranja', 'preto', 'branco', 'azul', 'verde']
cores.remove("preto")
print(cores)

['laranja', 'branco', 'azul', 'verde']


In [21]:
cores.pop(0)
cores.pop(-1)   # list.pop() e list.pop(-1) são equivalentes
print(cores)

['branco', 'azul']


#### Extrair subconjuntos das listas

Também é possível extrair subconjuntos das listas (*slice*) especificando o valor inicial (incluído) e o valor final (não incluído) separados por `:`

In [29]:
# original
mais_cores

['laranja', ['preto', 'branco'], 'verde', 'azul', 'branco', 'amarelo']

In [30]:
# índices 1 e 2 (o índice 3 apenas marca o fim do subconjunto, não está incluído)
mais_cores[1:3]

[['preto', 'branco'], 'verde']

O primeiro e o último elementos do subconjunto podem ser omitidos quando coincidem com o primeiro e o último elementos da lista.

In [31]:
nums = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [36]:
print("Desde o primeiro valor até o 4 (não incluído)")
print(nums[:4])

Desde o primeiro valor até o 4 (não incluído)
[0, 1, 2, 3]


In [37]:
print("Desde o sétimo valor (incluído) até o último")
print(nums[7:])

Desde o sétimo valor (incluído) até o último
[7, 8, 9, 10]


In [38]:
print("Todos os valores (devolve uma lista idêntica)")
print(nums[:])

Todos os valores (devolve uma lista idêntica)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


Se usarmos números negativos no *slice*, começa a contar polo final.

In [39]:
print("Do índice na posição -3 até ao fim")
print(nums[-3:])

Do índice na posição -3 até ao fim
[8, 9, 10]


Se incluirmos um terceiro valor no *slice*, este representa o salto (por defeito é 1).

In [40]:
print("Todos os valores contando índices de 2 en 2")
print(nums[::2])

Todos os valores contando índices de 2 en 2
[0, 2, 4, 6, 8, 10]


In [41]:
# O que acontece se o salto for negativo?
print(nums[10:2:-3])

[10, 7, 4]




---



A efectos de extraer subcadeas (*slicing*) ou uso de índices (*indexing*), **as cadeas** funcionan como as listas, sendo posíbel acceder/extraer os caracteres individuais que as compoñen mediante os índices.

In [None]:
sample = "Olá mundo"

In [None]:
# Indexing
print(sample[2])

In [None]:
# Slicing
print(sample[1:6])

In [None]:
print(sample[-4:])

In [None]:
print(sample[-1:-4:-1])

#### Exercícios



1. Cria uma lista de 5 números inteiros e com o nome `numeros`.

2. No final da lista `numeros` adiciona mais 2 números decimais (*`float`*).

3. Imprime os últimos 3 números da lista.

4. Imprime a lista do revés

5. Elimina da lista os elementos de tipo decimal

6. Extrai a cadeia *Galaxy* de `str1` utilizando a notação de *slicing*, armazena-a noutra variável (`slice1`) e imprime-a.

In [58]:
str1 = "The Hitchhiker’s Guide to the Galaxy"
# escreve a solução


### Dicionários

Estruturas de chave-valor em que a chave é um escalar e o valor pode ser escalar ou não escalar.

In [59]:
freq = {
    "medo": 1209,
    "forte": 10,
    "maior": 154
}

É possível declarar um dicionário sem o inicializar, de modo a atribuir-lhe valores mais tarde.

In [62]:
colloc = {}
colloc

{}

In [63]:
colloc.update({"medo": 1209})
colloc

{'medo': 1209}

In [64]:
colloc.update({"forte": 10})

# forma alternativa
colloc["maior"] = 154

colloc

{'medo': 1209, 'forte': 10, 'maior': 154}

Utilizando `keys()` e `values()` é possível aceder à lista de chaves e valores de um dicionário separadamente.

In [65]:
colloc.keys()

dict_keys(['medo', 'forte', 'maior'])

In [66]:
colloc.values()

dict_values([1209, 10, 154])

Com `items()` acedemos ao par chave-valor.

In [67]:
colloc.items()

dict_items([('medo', 1209), ('forte', 10), ('maior', 154)])

### Set

Um conjunto é um tipo de dados iterável, não ordenado, mutável e não duplicável. É declarado usando chaves.

In [68]:
primes = {2, 3, 5, 7, 11, 11, 13, 17}

print(type(primes))

primes


<class 'set'>


{2, 3, 5, 7, 11, 13, 17}

Depois de o conjunto ter sido inicializado, é possível adicionar mais elementos utilizando os métodos `add()` (elemento único) ou `update()` (vários).

In [69]:
primes = {2, 3, 5, 7, 11, 11, 13, 17}
primes.add(19)

primes

{2, 3, 5, 7, 11, 13, 17, 19}

In [70]:
primes.update([23, 29, 31, 31, 31])

primes

{2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31}

### Tuple

Uma tupla é um tipo de dados iterável, ordenado e imutável. É semelhante a uma lista, mas não pode ser modificada.

In [71]:
# Declaração de tupla sem elementos
tuple1 = ()

print(len(tuple1))
print(type(tuple1))

0
<class 'tuple'>


In [74]:
# Declaração de tupla com um elemento
tuple2 = (24,)

print(len(tuple2))
print(type(tuple2))


1
<class 'tuple'>


In [76]:
# Declaração de tuplas com vários elementos (também duplicados) e acesso através de índices
tuple3 = (24, 15, 15, 15, "rede galabra", 1.65, True)

print(len(tuple3))
print(type(tuple3))

tuple3[4]

7
<class 'tuple'>


'rede galabra'

## Casting

Uma operação de *casting* (conversão) altera o tipo de um objeto. Dependendo do tipo de conversão, isto pode resultar em perda de informação.

In [None]:
# De inteiro a decimal
float(8)

In [None]:
# De decimal a inteiro
int(3.9881)

In [None]:
# Casting a cadeia de texto
str(3.998)

In [None]:
# Casting de cadeia a numérico

# Inteiro
int("4")

In [None]:
# Decimal
float("4.980")

In [78]:
# Casting de lista a conjunto (set), perdem-se as informações sobre os itens duplicados
set([2, 2, 3, 5, 5, 5, 7, 11, 11, 13, 17])

{2, 3, 5, 7, 11, 13, 17}

In [79]:
# Casting de lista a tupla
tuple([2, 2, 3, 5, 5, 5, 7, 11, 11, 13, 17])

(2, 2, 3, 5, 5, 5, 7, 11, 11, 13, 17)

O que acontece se os tipos não forem os correctos quando se faz o *casting*?

In [80]:
int("isto non vai")

ValueError: invalid literal for int() with base 10: 'isto non vai'

## Tipos mutáveis e imutáveis

Os tipos de dados imutáveis são aqueles cujo estado não pode ser alterado depois de serem criados. Em Python, os tipos escalares (strings, dados numéricos) e alguns tipos não escalares (tuplas) são imutáveis. Em contrapartida, as listas, os dicionários e os conjuntos são mutáveis.

Exemplos:

**Strings**

In [85]:
cadeia = "Olá"
print(cadeia)
id(cadeia)

Olá


137565187186704

In [86]:
cadeia = cadeia + " mundo!"
print(cadeia)
id(cadeia)

Olá mundo!


137565187160272

In [88]:
cadeia[2]

'á'

In [90]:
# erro!
cadeia[2] = "a"

TypeError: 'str' object does not support item assignment

**Listas**

In [83]:
lista = [1, 4, "verde"]
print(lista)
id(lista)

[1, 4, 'verde']


137565187254720

In [84]:
lista.append(8)
lista.remove("verde")
print(lista)
id(lista)

[1, 4, 8]


137565187254720

In [91]:
lista[1]

4

In [93]:
lista[1] = 'a'
lista

[1, 'a', 8]

# Operadores

## Aritméticos

operador      |   significado
--------------|----------------
`**`          | Expoente
`%`           | Módulo (resto)
`//`	        | Divisão de números inteiros
`/`	          | Divisão
`*`	          | Multiplicação
`-`	          | Subtração
`+`           | Soma

**Exemplos**:

In [None]:
4 / 3

Na divisão de números inteiros a parte decimal é ignorada.

In [94]:
# Divisão de números inteiros
4 // 3

1

Quando uma divisão de números não inteiros é exacta, devolve um valor *float*.

In [95]:
# Divisão não inteira sem resto
4 / 2

2.0

In [96]:
# Módulo
4 % 2

0

O operador composto permite efetuar a operação e a atribuição ao mesmo tempo.

In [97]:
x = 5
x += 15       # equivale a x = x + 15
print(x)

x //= 4       # equivale a x = x // 4
print(x)

20
5


### Precedência

In [98]:
2 + 3 * 4

14

In [99]:
2 + (3 * 4)

14

In [100]:
(2 + 3) * 4

20

## Relacionais

Resulta sempre num valor booleano (`True` ou `False`).

operador       |    significado
---------------|-------------------
==             | igual
!=             | distinto
<              | menor que
>              | maior que
<=             | menor ou igual que
>=             | maior ou igual que

In [101]:
4 < 5

True

In [102]:
4 == 5

False

In [103]:
x = y = 10
x != y

False

## Lógicos

Permitem avaliar expressões que resultam num valor booleano.

- `and`

In [104]:
print(x)
x < 100 and x > 1

10


True

- or

In [105]:
x > 20 or x < 11

True

- not

In [106]:
not x > 20

True

In [110]:
txt = 'expressão'
's' in txt and len(txt) > 10

False

In [111]:
x = None
y = 5
x or y

5

In [112]:
x = 1
x or y

1

# Controlo do fluxo

## Condicional `if`

Comprova se uma expressão é certa (`True`).

In [None]:
num = 5
if num < 3:
  print("menor a 3")
elif num <= 5:
  print("menor ou igual a 5")
else:
  print("maior de 5")

## Estruturas de repetição (*loops*)

### `for`

Permite percorrer um grupo de elementos que são iteráveis (por exemplo, listas).

In [113]:
for n in [1, 2, 3]:
  print(n)

1
2
3


In [114]:
freqs = {"medo": 129, "repetição": 54, "percorrer": 2}

for key, val in colloc.items():
  print(f"chave: {key} // valor: {val}")
  print("chave: {} // valor: {}".format(key, val))

chave: medo // valor: 1209
chave: medo // valor: 1209
chave: forte // valor: 10
chave: forte // valor: 10
chave: maior // valor: 154
chave: maior // valor: 154


In [118]:
print("Fibonacci\n")

fibonacci = [1, 1, 2, 3, 5, 8, 13, 21]
for idx, num in enumerate(fibonacci):
  print(f"posición {idx}: {num}")

Fibonacci

posición 0: 1
posición 1: 1
posición 2: 2
posición 3: 3
posición 4: 5
posición 5: 8
posición 6: 13
posición 7: 21


In [119]:
print("Fibonacci ^ 2\n")

for num in fibonacci:
  print(num * num)

Fibonacci ^ 2

1
1
4
9
25
64
169
441


Podemos utilizar a função `range()` para produzir uma sequência de números e percorrê-los numa estrutura de repetição.

Sintaxe: `range([init], end, [step])`

Cria uma sequência de números começando em `init` (incluído) e terminando em `end` (não incluído), com o intervalo `step`. Se `init` não for especificado, por defeito é 0. Da mesma forma, se `step` não for especificado, o valor utilizado é 1.

In [120]:
# sequência entre 0 e 9
for num in range(10):
    print(num)

0
1
2
3
4
5
6
7
8
9


In [121]:
# sequência entre 0 e 9 de 3 en 3
for num in range(0, 10, 3):
    print(num)

0
3
6
9


In [122]:
# sequência entre 10 e 1 de 2 en 2
for num in range(10, 0, -2):
    print(num)

10
8
6
4
2


### `while`

Executa um bloco de código desde que uma condição seja satisfeita.

In [123]:
x = 0
while x < 5:
  print(f'{x} * 2 = {x * 2}')
  x += 1

0 * 2 = 0
1 * 2 = 2
2 * 2 = 4
3 * 2 = 6
4 * 2 = 8


É possível forçar a saída mediante `break` sem satisfazer a condição.

In [124]:
x = 29
while x > 0:
  print(f"x = {x}")
  if x % 5 == 0:
    break
  x -= 1

x = 29
x = 28
x = 27
x = 26
x = 25


Quando há estruturas aninhadas, o comando `break` sai da estrutura em que está, não de todas elas.

In [138]:
x = 5
while x > 0:
  for y in [1, 4, 9]:
    print(f"x: {x}    y: {y}")
  if x % 2 == 0:
    break
  x -= 1

x: 5    y: 1
x: 5    y: 4
x: 5    y: 9
x: 4    y: 1
x: 4    y: 4
x: 4    y: 9


In [139]:
x = 380
primes = [1]
while x > 1:
  for n in range(2, x + 1):
    if x % n == 0:
      primes.append(n)
      x //= n
      break

print(primes)

[1, 2, 2, 5, 19]


Utilizando `continue` podemos interromper a execução do código em um ponto e fazer com que ele passe para a próxima iteração.

In [142]:
x = 19
while x > 0:
  if x % 2 == 0:
    x -= 1
    continue

  print(f"Número ímpar {x}")
  x -= 1

Número ímpar 19
Número ímpar 17
Número ímpar 15
Número ímpar 13
Número ímpar 11
Número ímpar 9
Número ímpar 7
Número ímpar 5
Número ímpar 3
Número ímpar 1


# Funções

Permitem criar blocos de código que podem ser executados muitas vezes no programa. A sintaxe típica é:

```
def nome (arg1, arg2, argN):
   código
   código

   return valor
```

Se nenhum valor de retorno for especificado, as funções retornam `None`.

In [143]:
def factors(x):
  factors = [1]
  while x > 1:
    for n in range(2, x + 1):
      if x % n == 0:
        factors.append(n)
        x //= n
        break
  return factors


n1 = 380
n2 = 96

factors1 = factors(n1)
factors2 = factors(n2)

print(f'Fatores primos de {n1}: {factors1}')
print(f'Fatores primos de {n2}: {factors2}')

Fatores primos de 380: [1, 2, 2, 5, 19]
Fatores primos de 96: [1, 2, 2, 2, 2, 2, 3]


## Âmbito das variáveis

As variáveis declaradas dentro de uma função são locais e só podem ser acedidas desde essa função. Variáveis declaradas fora de funções pertencem ao escopo global e são visíveis de qualquer parte do código. No entanto, para que seja possível trabalhar com elas (por exemplo, modificá-las), devem ser declaradas como globais com `global`.

In [145]:
def func():
  a = 10
  global b
  print(f'(dentro func 1) a: {a}, b: {b}, c: {c}')

  a += 20
  b -= 150
  print(f'(dentro func 2) a: {a}, b: {b}, c: {c}')


a = 100
b = 200
c = 300

print(f'(fora func 1) a: {a}, b: {b}, c: {c}')
func()
print(f'(fora func 2) a: {a}, b: {b}, c: {c}')

(fora func 1) a: 100, b: 200, c: 300
(dentro func 1) a: 10, b: 200, c: 300
(dentro func 2) a: 30, b: 50, c: 300
(fora func 2) a: 100, b: 50, c: 300


# Métodos

São como as funções, mas são sempre aplicadas a um objeto utilizando o operador de ponto (`.`).

```
objeto.metodo(arg1, arg2, argN)
```

As funções partilham com as funções o facto de poderem receber diferentes argumentos e de devolverem sempre pelo menos um valor (que por defeito será `None`).

Ao contrário das funções, só podemos definir os nossos próprios métodos dentro das classes.

Como os métodos estão necessariamente ligados a um objeto, podem ser classificados de acordo com o tipo de objeto.




## `String`

Alguns dos métodos mais importantes do tipo de objeto `String`:



### `split()`

Sintaxe: `str.split([sep], [maxsplits])`

Devolve a lista de itens resultante da separação da cadeia `str` utilizando o separador `sep`.

In [146]:
sample = "135,9,6"
sample.split(",")

['135', '9', '6']

Se não for especificado `sep`, utiliza o espaço em branco por defeito.

In [149]:
sample = "Devolve a lista de elementos resultante de separar um texto com o separador por defeito."
sample.split()

['Devolve',
 'a',
 'lista',
 'de',
 'elementos',
 'resultante',
 'de',
 'separar',
 'um',
 'texto',
 'com',
 'o',
 'separador',
 'por',
 'defeito.']

\Se quisermos mudar a ordem natural dos argumentos do método ou da função, ou omitir algum, nesse caso devemos fazer explícito o nome do argumento.

In [None]:
sample.split(maxsplit=5)

In [150]:
sample = "superfície,ocupar;32;6.49363310277496"
sample.split(maxsplit=1, sep=";")

['superfície,ocupar', '32;6.49363310277496']

Esta última sería equivalente a:

In [151]:
sample.split(";", 1)

['superfície,ocupar', '32;6.49363310277496']

### `lower()`, `upper()`, `swapcase()`, `capitalize()`, `title()`

Mudam para maiúsculas ou minúsculas conforme o método utilizado, devolvendo a cadeia modificada. Não aceitam nenhum argumento.

In [152]:
sample = "Lorem ipsum dolor sit amet"
print("upper(): ", sample.upper())
print("lower(): ", sample.lower())
print("swapcase(): ", sample.swapcase())

upper():  LOREM IPSUM DOLOR SIT AMET
lower():  lorem ipsum dolor sit amet
swapcase():  lOREM IPSUM DOLOR SIT AMET


In [153]:
sample = "um método é diferente de uma função."
print("capitalize(): ", sample.capitalize())
print("title(): ", sample.title())

capitalize():  Um método é diferente de uma função.
title():  Um Método É Diferente De Uma Função.


### `islower()`, `isupper()`, `istitle()`

Alguns dos métodos acima têm o correlato para saber se uma cadeia de caracteres é maiúscula, minúscula ou um título.



In [173]:
"A".isupper()

True

Para além disso, os métodos podem geralmente ser concatenados numa única expressão. A expressão resultante deve ser lida de esquerda a direita.

In [174]:
sample.upper().isupper()      # é possível combinar mais do que um método na mesma expressão

True

In [175]:
sample.lower().isupper()

False

### `join()`

Permite unir os elementos de um iterável, devolvendo uma cadeia com o resultado.

Sintaxe: `str.join(iterable)`

In [157]:
lista = "Devolve a lista de ítens resultante".split()
print(lista)
";;".join(lista)

['Devolve', 'a', 'lista', 'de', 'ítens', 'resultante']


'Devolve;;a;;lista;;de;;ítens;;resultante'

### `strip()`, `lstrip()`, `rstrip()`

Permitem eliminar espaços em branco nos extremos (direito, esquerdo ou ambos) de uma cadeia. São muito úteis para limpar um dataset quando foi produzido manualmente.

In [158]:
sample = 'fazer,ler,devolver     '
sample.rstrip()


'fazer,ler,devolver'

Também podemos especificar os caracteres que queremos eliminar.

In [172]:
sample = ",fazer,"
sample.strip(",")

'fazer'

### `startswith()`, `endswith()`

Devolvem um booleano indicando se uma cadeia começa ou termina de uma determinada maneira.

Sintaxe: str.startswith(str)

In [177]:
sample = "Lore ipsum."
sample.startswith('lore')

False

In [178]:
sample.endswith('.')

True

### `find()`, `index()`

Estes métodos permitem localizar cadeias dentro de outras. A diferença entre eles está principalmente no facto de que `find()` devolve `-1` se não encontrar o que procura, enquanto `index()` gera uma exceção. No caso de encontrar a cadeia procurada, ambos métodos devolvem a posição do primeiro carácter.

Sintaxe:    
> `str.find(string)`   
> `str.index(string)`    

In [179]:
print(sample)
sample.index("método")

Lore ipsum.


ValueError: substring not found

In [181]:
try:
    pos = sample.index("método")
except ValueError:
    pos = None
    print("Não foi encontrada a cadeia procurada, e index() provoca uma exceção do tipo ValueError.")

Não foi encontrada a cadeia procurada, e index() provoca uma exceção do tipo ValueError.


In [182]:
sample.find("método")

-1

In [183]:
sample.index("ipsum")

5

In [185]:
sample.find("ipsum")

5

### `replace()`

Permite substituir uma sequência de caracteres por outra dentro de uma cadeia. Se especificarmos um terceiro argumento, a substituição será feita apenas `count` vezes.

Sintaxe

> `str.replace(old, new[, count])`

In [168]:
sample = "Isto é uma prova, é um teste."
sample.replace('um', 'UM')

'Isto é UMa prova, é UM teste.'

In [169]:
sample.replace('é', 'e', 1)

'Isto e uma prova, é um teste.'

### `count()`

Devolve o número de vezes que uma sequência de caracteres aparece dentro de uma cadeia.

Sintaxe:

> str.count(substring)

In [170]:
sample.count('um')

2

## `List`

Alguns dos métodos mais importantes do tipo de objeto List:


### `sort()`

Sintaxe: `list.sort([key=func()], [reverse=True|False])`

Ordena (*in-place*) uma lista alfabeticamente de menor a maior, sendo possível obter a ordem descendente usando `reverse=True`. Com `key`, é possível especificar uma função de ordenação de um argumento que é utilizada para obter uma chave de comparação para cada elemento da lista.

In [186]:
# Ordem ascendente
cores = ['laranja', 'preto', 'verde', 'azul', 'branco', 'amarelo']
cores.sort()

print(cores)

['amarelo', 'azul', 'branco', 'laranja', 'preto', 'verde']


Ordem descendente.

In [188]:
# Ordem descendente
cores = ['laranja', 'preto', 'verde', 'azul', 'branco', 'amarelo']
cores.sort(reverse=True)

print(cores)

['verde', 'preto', 'laranja', 'branco', 'azul', 'amarelo']


**Ollo:**

In [189]:
cores = ['laranja', 'preto', 'verde', 'Azul', 'branco', 'amarelo']
cores.sort()

print(cores)

['Azul', 'amarelo', 'branco', 'laranja', 'preto', 'verde']


Porque é que a ordem muda neste caso?

> https://www.ascii-code.com/  
> https://en.wikipedia.org/wiki/Basic_Latin_(Unicode_block)  
> https://docs.python.org/3/library/stdtypes.html#list.sort

Pode ser resolvido utilizando uma função de ordenação que normalize.


In [190]:
def normalize(s):
  return s.lower()

cores = ['laranxa', 'negro', 'verde', 'Azul', 'branco', 'amarelo']
cores.sort(key=normalize)

print(cores)

['amarelo', 'Azul', 'branco', 'laranxa', 'negro', 'verde']


Outros exemplos de utilização:

In [191]:
# Ordem ascendente por tamanho do elemento (utilizando função básica)
cores = ['laranja', 'preto', 'verde', 'azul', 'branco', 'amarelo']
cores.sort(key=len)

print(cores)

['azul', 'preto', 'verde', 'branco', 'laranja', 'amarelo']


In [195]:
# Ordem alfabética descendente começando pelo final do item (usando função definida).
def rev(s):
  return s[::-1].lower()

cores = ['laranja', 'preto', 'verde', 'azul', 'branco', 'AMARELO']

cores.sort(key=rev, reverse=True)

print(cores)

['preto', 'AMARELO', 'branco', 'azul', 'verde', 'laranja']


### `count(item)`

Devolve a quantidade de vezes que `item` aparece na lista.

In [196]:
cores = ['laranja', 'preto', 'verde', 'azul', 'branco', 'verde', 'amarelo']

cores.count('verde')

2

### `clear()`

Elimina todos os elementos da lista.

In [197]:
print("Antes:", cores)

cores.clear()

print("Depois:", cores)

Antes: ['laranja', 'preto', 'verde', 'azul', 'branco', 'verde', 'amarelo']
Depois: []


### `reverse()`

Inverte a ordem dos elementos numa lista.

In [198]:
cores = ['preto', 'amarelo', 'branco', 'azul', 'verde', 'laranja']

cores.reverse()

cores

['laranja', 'verde', 'azul', 'branco', 'amarelo', 'preto']

### `index()`

Sintaxe: `list.index(x, [start, end])`

Retorna o índice onde se encontra o primeiro elemento `x` da lista, começando em `start` e finalizando em `end` (por defeito, toda a lista). Se o elemento não existir, gera uma exceção.

In [199]:
cores = ['laranja', 'preto', 'verde', 'azul', 'branco', 'verde', 'amarelo']

# Índice de 'verde' na lista completa
cores.index('verde')

2

In [200]:
# Índice de 'verde' a partir do elemento 4
cores.index('verde', 4)

5

In [204]:
# Elemento não existente tratado com try:except
try:
  cores.index('cinzento')
except:
  print("O 'cinzento' não faz parte da lista.")

O 'cinzento' não faz parte da lista.


### `copy()`

Devolve unha copia da lista.

In [None]:
cores = ['laranxa', 'negro', 'verde', 'azul', 'branco', 'verde', 'amarelo']

print("Lista orixinal:", id(cores))

cores_copy = cores.copy()
print("Lista duplicada:", id(cores_copy))

Lista orixinal: 135722164642304
Lista duplicada: 135722164886016


Ollo: non se debe duplicar unha lista mediante operador de asignación.

In [None]:
cores_asign = cores

print("Lista copiada co operador de asignación:", id(cores_asign))

Lista copiada co operador de asignación: 135722164642304


In [None]:
print("Lista orixinal:            ", cores)
print("Lista duplicada con copy():", cores_copy)
print("Lista duplicada con =:     ", cores_asign)

Lista orixinal:             ['laranxa', 'negro', 'verde', 'azul', 'branco', 'verde', 'amarelo']
Lista duplicada con copy(): ['laranxa', 'negro', 'verde', 'azul', 'branco', 'verde', 'amarelo']
Lista duplicada con =:      ['laranxa', 'negro', 'verde', 'azul', 'branco', 'verde', 'amarelo']


In [None]:
print("Eliminamos 'laranxa' da lista duplicada con copy()")
cores_copy.remove('laranxa')

print("Eliminamos 'negro' da lista duplicada con =")
cores_asign.remove('negro')

Eliminamos 'laranxa' da lista duplicada con copy()
Eliminamos 'negro' da lista duplicada con =


In [None]:
print("Lista orixinal:              ", cores)
print("Lista 1 duplicada con copy():", cores_copy)
print("Lista 2 duplicada con =:     ", cores_asign)

Lista orixinal:               ['laranxa', 'verde', 'azul', 'branco', 'verde', 'amarelo']
Lista 1 duplicada con copy(): ['negro', 'verde', 'azul', 'branco', 'verde', 'amarelo']
Lista 2 duplicada con =:      ['laranxa', 'verde', 'azul', 'branco', 'verde', 'amarelo']


Isto é algo que é importante ter en conta nos tipos de datos mutábeis, co que tamén afecta aos dicionarios e conxuntos.

## Dict

Algúns dos métodos máis importantes do tipo de obxecto `Dict`:

### `clear()`

Elimina todos os elementos do dicionario.

In [None]:
word_freqs = {
  "the": 19,
  "book": 3,
  "is": 20,
  "on": 16,
  "table": 5
}

print(word_freqs)

word_freqs.clear()

print(word_freqs)

{'the': 19, 'book': 3, 'is': 20, 'on': 16, 'table': 5}
{}


### `copy()`

Devolve unha copia do dicionario.

In [None]:
word_freqs = {
  "the": 19,
  "book": 3,
  "is": 20,
  "on": 16,
  "table": 5
}

copia = word_freqs.copy()
print(id(word_freqs), word_freqs)
print(id(copia), copia)

135722164749824 {'the': 19, 'book': 3, 'is': 20, 'on': 16, 'table': 5}
135721993611136 {'the': 19, 'book': 3, 'is': 20, 'on': 16, 'table': 5}


### `fromkeys(keys, [value])`

Devolve un dicionario coas chaves especificadas como `keys` co mesmo valor (`value`). Se non se inclúe `value`, o valor asignado ás chaves é `None`.

In [None]:
words = ['in', 'a', 'hole', 'the', 'ground', 'there', 'lived', 'hobbit', '.']

freqs = dict.fromkeys(words, 0)

freqs

{'in': 0,
 'a': 0,
 'hole': 0,
 'the': 0,
 'ground': 0,
 'there': 0,
 'lived': 0,
 'hobbit': 0,
 '.': 0}

### `get(key, [fallback])`

Devolve o valor do dicionario asociado á chave `key`. Se a chave non existe, devolve `fallback` (por omisión é `None`).

In [None]:
word_freqs = {
  "the": 19,
  "book": 3,
  "is": 20,
  "on": 16,
  "table": 5
}

nouns = ["table", "chair"]
for noun in nouns:
    print(f"{noun}:", word_freqs.get(noun, f'non hai entrada para {noun}'))

table: 5
chair: non hai entrada para chair


É importante usar `get()` para recuperar elementos dun dicionario, especialmente cando exista posibilidade de que as chaves que tratamos de recuperar non existan.

In [None]:

print(word_freqs.get('chair'))
print(word_freqs['chair'])

None


KeyError: 'chair'

### `pop(key, [value])`

Elimina o elemento do dicionario con chave `key`. Se a chave non existe e non se fornece `value`, producirase un erro de tipo `KeyError`. Se a chave existe, a entrada será suprimida.

In [None]:
word_freqs = {
  "the": 19,
  "book": 3,
  "is": 20,
  "on": 16,
  "table": 5
}

In [None]:
# Chave non existente sen valor = KeyError
word_freqs.pop("chair")

KeyError: 'chair'

In [None]:
# Chave non existente con valor
word_freqs.pop("chair", "Chave non existente")

'Chave non existente'

In [None]:
# Chave existente
word_freqs.pop("table")

word_freqs

{'the': 19, 'book': 3, 'is': 20, 'on': 16}