# Capítulo 5 - Iteração

## 5.1 Atualizando Variáveis
Um modelo comum de declaração de atribuição é uma que atualiza o valor de uma variável, na qual o seu novo valor depende do seu anterior.

> x = x + 1

Isso significa “pegue o valor atual de x, adicione 1 e então atualize x com esse novo valor.”

Se você tentar atualizar uma variável que não existe, ocorrerá um erro, já que o Python avalia o lado direito da igualdade antes de atribuir um valor a x:

In [None]:
x = x + 1

Antes de se poder atualizar uma variável, é preciso __inicializá-la__, normalmente com uma simples atribuição:

In [None]:
x = 0
x = x + 1
print(x) 

Atualizar uma variável adicionando 1 é chamado de um *incremento*; subtraindo 1 é chamado de um *decremento*.

## 5.2 A declaração while

Frequentemente, computadores são utilizados para automatizar tarefas repetitivas. Repetir tarefas, idênticas ou similares, sem cometer erros, é algo que computadores fazem bem melhor que pessoas. Devido à iteração ser tão comum, Python disponibiliza diversos recursos para torná-la mais fácil.

Uma das formas de iteração em Python é a declaração while. Abaixo, temos um programa simples que faz uma contagem regressiva, partindo de cinco, e depois diz “Lançar!”.

In [None]:
# repetindo steps com while
n = 5
while(n>0):
    print(n)
    n-=1
print("Lançaçr")

__Observação:__ Loops (etapas repetidas) têm variáveis ​​de iteração que mudam a cada vez em um loop. Muitas vezes, essas variáveis ​​de iteração passam por uma sequência de números.

A declaração __while__ quase pode ser lida como se fosse um texto comum (escrito em português). Em português, teríamos algo como: *“Enquanto n for maior que 0,mostre o valor de n e então subtraia 1 desse valor. Quando atingir o valor 0, saia da declaração while e mostre a palavra Lançar!”.*

De maneira mais formal, o fluxo de execução da declaração while seria:
1. Análise da condição, retornando um valor True ou False.
2. Se a condição for falsa, saia da declaração while e prossiga com as declarações seguintes.
3. Se a condição for verdadeira, execute o bloco while e então retorne ao passo 1.

Esse bloco de instruções é chamado de laço, pois o terceiro passo faz retornar ao primeiro. Nomeamos de __iteração__ cada vez em que as instruções dentro de um laço são executadas. Para o programa anterior, podemos dizer que “ele teve cinco iterações”, ou seja, o corpo do laço foi executado cinco vezes.

O corpo do laço normalmente deve alterar o valor de uma ou de mais variáveis, de forma que, eventualmente, a condição de execução se torne falsa e a repetição se encerre. Chamamos essa variável que tem seu valor alterado em cada execução do laço e controla quando ele deve terminar de variável de iteração. Se não houver uma variável de iteração, o loop se repetirá eternamente, resultando em um laço
infinito.

## 5.3 Laços infinitos

Uma fonte de diversão sem fim para programadores é observar que as instruções no shampoo, “Ensaboe, enxague, repita”, são um laço infinito pois não há variável de iteração lhe dizendo quantas vezes executar essa sequência.

Numa contagem regressiva, nós podemos provar que o laço termina, pois sabemos que o valor de n é finito, e podemos ver que esse valor fica cada vez menor durante o laço, então eventualmente chegaremos ao 0. Outras vezes, um laço é claramente infinito, pois não existe variável de iteração.

Às vezes você não sabe que é hora de terminar o laço até chegar ao meio dele. Nesse caso você pode escrever um laço infinito de propósito e então usar o comando break para interrompê-lo.

Este laço abaixo é obviamente um laço infinito, pois a expressão lógica na estrutura while é simplesmente a a constante lógica __True__:

In [None]:
n = 10
while True:
    print(n, end=' ')
    n = n - 1
print('Pronto!')

Se você cometer o erro de executar esse código, você aprenderá rapidamente como parar um processo do Python em execução no seu sistema ou achar onde é o botão de desligar do seu computador. Esse programa rodará eternamente ou até a sua bateria acabar, pois a expressão lógica no topo do laço é sempre verdadeira, graças ao fato de que a expressão é o valor constante __True__.

Embora isso seja um laço infinito disfuncional, nós podemos continuar usando esse padrão para construir laços úteis, desde que, cuidadosamente, adicionemos um código ao corpo do laço que, utilizando `break`, explicitamente saia dele quando atingimos a condição de saída desejada.

Por exemplo, suponha que você queira entradas do usuário até que ele digite pronto. Você pode escrever:
```
while True:
    line = input("> ")
    if line == 'pronto':
        break
    print(line)
print('pronto')
```
ver aquivo __copytildone1.py__

A condição do laço é True, que sempre é verdadeira, então ele é executado repetidamente até atingir a estrutura break__.

A cada repetição, ele solicita uma entrada do usuário mostrando um sinal de “menor que”. Se o usuário digita pronto, o comando break sai do laço. Caso contrário, o programa ecoa tudo o que o usuário digita e volta para o primeiro passo. Aqui vemos um exemplo da execução:
```
> olá
olá
> encerrar
encerrar
> pronto
Pronto!
```
Essa forma de escrever laços while é comum, pois você pode checar a condição em qualquer lugar do bloco (não apenas no topo) e você pode expressar a condição de parada afirmativamente (“pare quando isso acontece”) melhor do que negativamente (“continue até que aquilo aconteça”).

## 5.4 Finalizando iterações com continue

Às vezes, você está em uma iteração de um laço e deseja finalizar essa iteração atual e pular imediatamente para a próxima. Nesse caso, você pode usar o comando `continue` para avançar para a próxima iteração sem executar as instruções restantes da iteração atual.

Aqui está um exemplo de laço que copia as entradas do usuário até ele digitar __“pronto”__, mas considera as linhas que começam com o caractere cerquilha (#) como linhas que não devem ser exibidas (como os comentários em Python).

In [None]:
while True:
    line = input('> ')
    if line[0] == '#':
        continue
    if line == 'pronto':
        break
    print(line)
print('pronto!')
# ../py42/src/copytildone2.py


Aqui temos um exemplo da execução desse novo programa com continue adicionado.
```
> olá
olá
> # não exiba isso
> exiba isso!
exiba isso!
> pronto
Pronto!
```
Todas as linhas são exibidas exceto a que começa com o sinal cerquilha, pois quando o continue é executado, ele termina a iteração atual e pula de volta para o topo do bloco while para começar a próxima iteração, pulando, portanto, o comando __print__.

## 5.5 Definindo um laço usando for

Às vezes, queremos fazer um laço por meio de um conjunto de coisas, como uma lista de palavras, as linhas em um arquivo, ou uma lista de números. Quando temos uma lista de coisas para iterar sobre, podemos construir um laço definido usando uma declaração __for__. Nós chamamos a declaração __while__ como um laço indefinido, porque ela simplesmente permanece iterando até que alguma condição se torne falsa, enquanto o laço for itera sobre um conjunto de itens conhecidos até que sejam executadas tantas iterações quanto o número de itens nesse conjunto.

A sintaxe de um laço __for__ é similar a de um laço __while__, em que há uma declaração for e um corpo de repetição:

In [None]:
amigos = ['José','Gleice', 'Sara']
for amigo in amigos:
    print(f'Feliz Ano Novo {amigo}')
print('feito!')

Em termos Python, a variável __amigos__ é uma lista [examinaremos as listas com mais detalhes em um capítulo posterior.] de três cadeias de caracteres e o laço for percorre a lista e executa o corpo uma vez para cada uma das três palavras na lista, resultando nesta saída:

```
Feliz Ano Novo: Jose
Feliz Ano Novo: Gleice
Feliz Ano Novo: Sara
Feito!
```
Traduzir esse loop for para o português não é tão direto quanto o __while__, mas se você pensar em amigos como um *lista*, ele interpreta assim: “executar as instruções no corpo do for uma vez para cada amigo *in* lista de amigos nomeados.”

Olhando para o laço __for__, for e in são palavras-chave reservadas do Python e amigo e amigos são variáveis.
```
for amigo in amigos:
Print ('Feliz Ano Novo: ', amigo)
```

Em particular, __amigo__ é a variável de iteração o laço __for__. A variável amigo muda a cada iteração do laço e controla quando o laço deve ser concluído. A __variável__ de iteração percorre sucessivamente as três palavras armazenadas na variável __amigos__.


## 5.6 Padrões de laço

Muitas vezes usamos um laço __for__ ou __while__ para percorrer uma *lista* de itens ou conteúdos de um arquivo, nesse caso nós estamos procurando por algo como o maior ou menor valor dos dados que nós percorremos.

Esses laços são geralmente construídos:

- Inicializando uma ou mais variáveis antes que o laço comece
- Realizando algum cálculo em cada item no corpo do laço, possivelmente alterando as variáveis no corpo do loop
- Olhando para as variáveis resultantes quando o loop é concluído
Utilizaremos uma lista de números para demonstrar os conceitos e a construção desses padrões de loop.

Utilizaremos uma lista de números para demonstrar os conceitos e a construção desses padrões de loop.

## 5.6.1 Contando e somando repetições
Por exemplo, para contar o número de itens em uma lista escreveríamos o seguinte laço __for__:

In [1]:
contador = 0
for intervar in [3, 41, 12, 9, 74, 15]:
    contador = contador + 1
print(f"Contagem {contador}")

Contagem 6


Nós ajustamos __contador__ para zero antes do laço começar, então nós escrevemos um laço __for__ para percorrer a lista de números. Nossa variável de iteração é chamada de __itervar__ e enquanto nós não usamos o itervar no laço, ele controla o laço e faz com que o corpo desse laço seja executado uma vez para cada um dos valores na lista.

No corpo da repetição, adicionamos 1 ao valor atual de contador para cada um dos valores na lista. Enquanto o laço está executando, o valor de contador é o número de valores que percorremos “até agora”.

Depois que a repetição é concluída, o valor de contador é o número total de itens. O número total “cai do céu” no final do ciclo. Nós construímos o laço para que tenhamos o que queremos quando ele terminar. 

Outro laço semelhante que calcula o total de um conjunto de números é o seguinte:

In [3]:
total = 0
for itevar in [3,41,12,9,74,15]:
    total = total + intervar
print(f"total: {total}")

total: 90


Nesse loop, *usamos a variável de iteração*. Em vez de simplesmente adicionar um a contagem, como na repetição anterior, nós adicionamos o número real (3, 41,12, etc.) ao total durante cada iteração de repetição. Se você pensar na variável __total__, ela contém o *“total de valores percorridos até agora”*. Então, antes que a repetição comece,__total__ é zero porque ainda não vimos nenhum valor. Durante todo o laço, __total__ é o total atualizado e, ao final do laço, __total__ é o valor de todos os valores na lista.

Conforme o laço é executado, total acumula a soma dos elementos; uma variável
usada dessa forma às vezes é chamada de *acumulador*.

Nem o laço de contagem nem o de soma são particularmente úteis na prática,
porque existem funções internas `len()` e `sum()` que calculam o número de itens em uma lista e o total dos itens em uma lista, respectivamente.

# 5.6.2 Repetições máximas e mínimas

Para achar o máximo valor em uma lista ou sequência, construímos a seguinte
repetição: 

In [None]:

maximo = None
print(f"Antes: {maximo}")
for itervar in [3, 41, 12, 9, 74, 15]:
    if maximo is None or itervar > maximo:
        maximo = itervar
    print(f"Laço: {itervar} {maximo}")
print(f"Máximo: {maximo}")

A variável __máximo__ é melhor considerada como o “maior valor que vimos até agora”. Antes da repetição, definimos máximo como a constante None. __None__ *é uma constante de valor especial que podemos armazenar em uma variável para marcá-la
como “vazia”*.

Antes do início do laço, o maior valor que temos até agora é None, já que nós
ainda não percorremos nenhum valor. Enquanto o laço está sendo executado, se o
máximo for None, então nós pegamos o primeiro valor que vemos como o maior até
agora. Você pode ver na primeira iteração quando o valor do itervar é 3, já que
máximo é None, nós imediatamente definimos máximo como sendo 3.

Após a primeira iteração, máximo não é mais None, então a __segunda__ parte da
expressão lógica composta que verifica se itervar > máximo é acionada apenas
quando vemos um valor que é maior que o “maior até agora”. Quando vemos um
novo “ainda maior”, nós levamos esse novo valor para o máximo. Você pode ver na
saída do programa que máximo progride de 3 para 41 e de 41 para 74.

No final do laço, verificamos todos os valores e a variável máximo agora contém o
maior valor da lista.

Para calcular o menor número, o código é muito semelhante com uma pequena
alteração:

In [20]:
minimo = None
print(f"Antes: {minimo}")
for itervar in [3,41,12,9,74,15]:
    if minimo is None or itervar < minimo:
        minimo = itervar
    print(f"Mínimo: {itervar:02d} - {minimo:02d}")
print(f"Minimo: {minimo:02d}")

Antes: None
Mínimo: 03 - 03
Mínimo: 41 - 03
Mínimo: 12 - 03
Mínimo: 09 - 03
Mínimo: 74 - 03
Mínimo: 15 - 03
Minimo: 03


Novamente, __mínimo__ é o “menor até agora” antes, durante e depois que o laço é
executado. Quando o laço concluir, mínimo contém o menor valor da lista.

Novamente, como na contagem e na soma, as funções incorporadas  `max()` e `min()`
fazem esses laços desnecessários.

A seguir, uma versão simples da função embutida `min()` do Python:


In [21]:
def min(valores):
    minimo= None
    for valor in valores:
        if minimo is None or valor < minimo:
            minimo= valor
    return(minimo)

Na versão da função para encontrar o menor valor, nós removemos todas os comandos print, de modo a ser equivalente à função min que já está embutida no Python.

# Capítulo 06 - Strings

## 6.1 String é uma sequência
String é uma sequência de caracteres. Você pode acessar os caracteres um de cada
vez com o operador colchetes:

In [1]:
fruta = 'banana'
letra = fruta[1]

In [3]:
#como indice começa em zero a inidce 1 é a e não b
print(letra)

a


In [4]:
letra = fruta[0]
print(letra)

b


## 6.2 Obtendo o comprimento de uma string utilizando *len*

In [5]:
fruta = 'banana'
len(fruta)

6

In [7]:
# obtendo a última letra da string
comprimento = len(fruta)
ultima  = fruta[comprimento-1]

## 6.3 Travessia de strings usando laço

In [8]:
indice = 0
while indice < len(fruta):
    letra = fruta[indice]
    print(letra)
    indice = indice + 1

b
a
n
a
n
a


## 6.4 Segmentos de strings

Um segmento de uma string é chamado `slice`.

In [9]:
s = 'Monty Python'
print(s[0:5])

Monty


In [10]:
print(s[6:12])

Python


In [11]:
fruta = 'banana'
fruta[:3]

'ban'

In [12]:
fruta[3:]

'ana'

In [14]:
print(fruta[3:3])




## 6.5 Strings são imutáveis

In [16]:
saudacao = "Alô Mundo!"
saudacao[0] ='O'

TypeError: 'str' object does not support item assignment

In [18]:
saudacao = "Alô Mundo"
nova_saudacao = 'O' + saudacao[1:]
print(nova_saudacao)

Olô Mundo


## 6.6 Laços e contagem

In [1]:
palavra = 'banana'
contagem = 0
for letra in palavra:
    if letra == 'a':
        contagem = contagem + 1
print(contagem)

3


## 6.7 O operador *in*

In [2]:
'a' in 'banana'

True

In [3]:
'semente' in 'banana'

False

## 6.8 Comparação de strings

## 6.9 Métodos da String

In [2]:
# Dir -> lista os métodos disponiveis para um objeto
# type -> Mostra o tipo de objeto
coisa = "Olá Mundo"
type(coisa)

str

In [3]:
dir(coisa)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isascii',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'removeprefix',
 'removesuffix',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',


In [4]:
help(str.capitalize)

Help on method_descriptor:

capitalize(self, /)
    Return a capitalized version of the string.
    
    More specifically, make the first character have upper case and the rest lower
    case.



In [7]:
# upper - converte todas as letras para maiusculas
palavra = "banana"
nova_palavra = palavra.upper()
print(nova_palavra)


BANANA


In [8]:
#find -> procura um posição de uma string dentro da outra
palavra = 'banana' 
indice = palavra.find('a')
print(indice)

1


In [9]:
#porcurando substring com find
palavra.find("na")

2

In [11]:
# procurando a partir de um indice
print(palavra.find('na',3))

4


In [13]:
# strip -> remove espaços em branco do começo e do final da string 
linha = '  Aqui vamos nós  '
print(linha.strip())


Aqui vamos nós


In [14]:
# startswith retorna um booelano se a sbtring começar com o paramentro informado
linha = 'Tenha um bom dia'
linha.startswith('Tenha')

True

In [15]:
linha.startswith('t')

False

In [16]:
# Lower -> converte todos os caracteres para minúsculos
linha = 'Tenha um bom dia'
linha.startswith('t')

False

In [17]:
print(linha.lower())
print(f"\n{linha.lower().startswith('t')}")

tenha um bom dia

True


## 6.10 Particionando strings

Frequentemente, nós precisamos analisar o que há dentro de uma string e encontrar uma substring. Por exemplo, se nos for apresentada uma sequência de linhas formatadas da seguinte forma:

From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008

e nós quisermos particionar somente a segunda metade do endereço (i.e.,uct.ac.za)
de cada linha, podemos fazer isso utilizando o método find e o fatiamento de
strings.

Primeiramente, acharemos a posição do sinal arroba (@) na string. Depois, achare-
mos a posição do primeiro espaço após o arroba. Só então utilizaremos o fatiamento
para extrair a parte da string que estamos buscando.

In [24]:
data = 'From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008'
antes_pos = data.find('@')
print(atpos)

21


In [21]:
depois_pos = data.find(' ', atpos)
print(sppos)

31


In [25]:
host = data[antes_pos+1:depois_pos]
print(host)

uct.ac.za


## 6.11 Operador de Formatação
O *operador de formatação %* nos permite construir strings, substituindo partes
destas strings pela informação contida em variáveis. Quando aplicamos à inteiros,

In [2]:
camelos = 42
print('%d' % camelos)

42


In [5]:
camelos = 42
print('Eu vi %d camelos' % camelos)

Eu vi 42 camelos


In [23]:
data = 'From stephen.marquard@uct.ac.za Sat Jan  5 09:14:16 2008'
pos = data.find('.')
print(data[pos:pos+3])

.ma


In [7]:
# usando %d para formatar inteiros e g% para formatar ponto flutuante
'Em %d anos eu vi %g %s.' %(3,0.1,'camelos')

'Em 3 anos eu vi 0.1 camelos.'

## Capítulo 7 Arquivos

Até agora, aprendemos como escrever programas e comunicar nossas intenções para a ***Unidade Central de Processamento*** usando a execução condicional, funções e iterações. Aprendemos como criar e usar estruturas de dados na Memória Principal. A CPU e a memória são onde o nosso software funciona e é executado, é onde todoo “pensamento” acontece.

Mas se você se lembrar de nossas discussões de arquitetura de hardware, uma vez que a energia é desligada, qualquer coisa armazenada na CPU ou memória principal é apagada. Então, até agora, nossos programas foram apenas exercícios divertidos para aprender Python.

![SecundaryMemory](figura_7.1.png)

Neste capítulo, começamos a trabalhar com ***Memória Secundária*** (ou arquivos). Esta não é apagada quando a energia é desligada. Ou, no caso de uma unidade flash USB, os dados que escrevemos de nossos programas podem ser removidos do sistema e transportados para outro sistema.


## 7.2 Abrindo um arquivo

In [2]:
#para ler um arquivo devemos abri-lo com o comando "open"
#Se openfor bem-sucedido, o sistema operacional retornará um identificador de arquivo.
arquivo = open('mbox.txt')
print(arquivo)

<_io.TextIOWrapper name='mbox.txt' mode='r' encoding='UTF-8'>


Se openfor bem-sucedido, o sistema operacional retornará um __identificador__ de arquivo.

![File Jandle](figura_7.2.png)


Se o arquivo não existir, open falhará com um Traceback e você não receberá um
identificador para acessar o conteúdo dele:


In [3]:
fhand = open('stuff.txt')

FileNotFoundError: [Errno 2] No such file or directory: 'stuff.txt'

## 7.3 Arquivos de texto e linhas

In [4]:
'''
Em Python, representamos o caractere * newLine * como \n em strings constantes.
Mesmo que pareça ser dois caracteres, é na verdade um só. Quando olhamos para
a variável inserindo “algo” no intérprete, ele nos mostra o \n na string, mas quando
usamos ‘print’ para mostrá-la, nós vemos a string quebrada em duas linhas pelo
newline.
'''

algo = 'Olá\nmundo!'
algo

'Olá\nmundo!'

In [5]:
print(algo)

Olá
mundo!


In [8]:
algo = 'Z\nY'
print(algo)

Z
Y


In [10]:
#Você também pode ver que o comprimento da string X\nY é * três * porque o
#newline é um único caractere.

len(algo)

3

## 7.4 Lendo arquivos

In [11]:
# Contando o númemro de linhas do arquivo
fhand = open('mbox-short.txt')
count = 0
for line in fhand:
    count = count + 1
    
print('Line Count:', count)


Line Count: 1910


Se você sabe que o tamanho do arquivo é relativamente pequeno comparado ao da sua memória principal, então pode ler o arquivo todo em uma string usando o método read do identificador de arquivo.

In [17]:
#Lendo o arquivo com read
fhand = open('mbox-short.txt')
inp = fhand.read()
print(inp)

From stephen.marquard@uct.ac.za Sat Jan  5 09:14:16 2008
Return-Path: <postmaster@collab.sakaiproject.org>
Received: from murder (mail.umich.edu [141.211.14.90])
	 by frankenstein.mail.umich.edu (Cyrus v2.3.8) with LMTPA;
	 Sat, 05 Jan 2008 09:14:16 -0500
X-Sieve: CMU Sieve 2.3
Received: from murder ([unix socket])
	 by mail.umich.edu (Cyrus v2.2.12) with LMTPA;
	 Sat, 05 Jan 2008 09:14:16 -0500
Received: from holes.mr.itd.umich.edu (holes.mr.itd.umich.edu [141.211.14.79])
	by flawless.mail.umich.edu () with ESMTP id m05EEFR1013674;
	Sat, 5 Jan 2008 09:14:15 -0500
Received: FROM paploo.uhi.ac.uk (app1.prod.collab.uhi.ac.uk [194.35.219.184])
	BY holes.mr.itd.umich.edu ID 477F90B0.2DB2F.12494 ; 
	 5 Jan 2008 09:14:10 -0500
Received: from paploo.uhi.ac.uk (localhost [127.0.0.1])
	by paploo.uhi.ac.uk (Postfix) with ESMTP id 5F919BC2F2;
	Sat,  5 Jan 2008 14:10:05 +0000 (GMT)
Message-ID: <200801051412.m05ECIaH010327@nakamura.uits.iupui.edu>
Mime-Version: 1.0
Content-Transfer-Encoding: 7bit
R

In [18]:
#Lendo o arquivo com read
fhand = open('mbox-short.txt')
inp = fhand.read()
print(len(inp))

94626


In [19]:
print(inp[:20])

From stephen.marquar


## 7.5. PESQUISAR EM UM ARQUIVO


Por exemplo, se queremos ler um arquivo e apenas mostrar as linhas que começam
com o prefixo “From:”, podemos usar o método startswith para selecionar apenas
as linhas que possuem o prefixo desejado:


In [21]:
fhand = open('mbox-short.txt')
count = 0
for line in fhand:
    if line.startswith('From: '):
        print(line)
# scr/search1.py

From: stephen.marquard@uct.ac.za

From: louis@media.berkeley.edu

From: zqian@umich.edu

From: rjlowe@iupui.edu

From: zqian@umich.edu

From: rjlowe@iupui.edu

From: cwen@iupui.edu

From: cwen@iupui.edu

From: gsilver@umich.edu

From: gsilver@umich.edu

From: zqian@umich.edu

From: gsilver@umich.edu

From: wagnermr@iupui.edu

From: zqian@umich.edu

From: antranig@caret.cam.ac.uk

From: gopal.ramasammycook@gmail.com

From: david.horwitz@uct.ac.za

From: david.horwitz@uct.ac.za

From: david.horwitz@uct.ac.za

From: david.horwitz@uct.ac.za

From: stephen.marquard@uct.ac.za

From: louis@media.berkeley.edu

From: louis@media.berkeley.edu

From: ray@media.berkeley.edu

From: cwen@iupui.edu

From: cwen@iupui.edu

From: cwen@iupui.edu



In [28]:
# rstrip method which tira os espaços em branco do lado direito da
# stirng, como pode ser observado:
fhand = open('mbox-short.txt')
for line in fhand:
    line  = line.rstrip()
    if line.startswith('From:'):
        print(line)
#scr/search2.py

From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: gsilver@umich.edu
From: gsilver@umich.edu
From: zqian@umich.edu
From: gsilver@umich.edu
From: wagnermr@iupui.edu
From: zqian@umich.edu
From: antranig@caret.cam.ac.uk
From: gopal.ramasammycook@gmail.com
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: louis@media.berkeley.edu
From: ray@media.berkeley.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu


Uma vez que seus programas de processamento de arquivos ficam mais complicados,você deve querer estruturar seus laços de pesquisa usando continue. A ideia básica
dos laços de pesquisa é procurar por linhas “interessantes” e efetivamente pular as “desinteressantes”. E então, quando encontramos uma de nosso interesse, fazemos algo com aquela linha.
Podemos estruturar o laço seguindo o padrão de pular as linhas desinteressantes seguindo o modelo:

In [30]:
fhand = open('mbox-short.txt')
for line in fhand:
    line = line.strip()
    if not line.startswith('From:'):
        continue
    print(line)
# src;search3.py

From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: gsilver@umich.edu
From: gsilver@umich.edu
From: zqian@umich.edu
From: gsilver@umich.edu
From: wagnermr@iupui.edu
From: zqian@umich.edu
From: antranig@caret.cam.ac.uk
From: gopal.ramasammycook@gmail.com
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: louis@media.berkeley.edu
From: ray@media.berkeley.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu


# Chapter 8 - Lists

## 8.1 - A list is a sequence (Uma lista é uma sequência)

Como uma string, uma lista é uma sequência de valores. Em uma string, os valores são caracteres; em uma lista, eles podem ser de qualquer tipo. Os valores na lista são chamados de elementos ou, às vezes, de itens.

Existem várias maneiras de criar uma nova lista; o mais simples é colocar os elementos entre colchetes ([" __and__ “]):

__Exemplo__:

[10, 20, 30, 40]


['crunchy frog', 'ram bladder', 'lark vomit']

Uma lista dentro de outra lista é aninhada:
['spam', 2.0, 5, [10, 20]]

Uma lista que não contém elementos é chamada de lista vazia; você pode criar um com colchetes vazios, `[]`.

Como você pode esperar, você pode atribuir valores de lista a variáveis:

In [None]:
cheeses = ['Cheddar', 'Edam', 'Gouda']
numbers = [17,123]
empty = []
print(cheeses, numbers, empty)

## 8.2. - As listas são mutáveis
A sintaxe para acessar os elementos de uma lista é a mesma para acessar os caracteres de uma string: o operador colchete. A expressão dentro dos colchetes especifica o índice. `Lembre-se que os índices começam em 0`:

In [None]:
print(cheeses[0])

Ao contrário das strings, as listas são mutáveis ​​porque você pode alterar a ordem dos itens em uma lista ou reatribuir um item em uma lista. Quando o operador de colchetes aparece no lado esquerdo de uma atribuição, ele identifica o elemento da lista que será atribuído.

In [None]:
numbers = [17,123]
numbers

In [None]:
numbers[1] = 5
print(numbers)

O elemento um dos números, que costumava ser 123, agora é 5.
Você pode pensar em uma lista como uma relação entre índices e elementos. Esse relacionamento é chamado de mapeamento; cada índice “mapeia” para um dos elementos.

Os índices de lista funcionam da mesma maneira que os índices de string:
- Qualquer expressão inteira pode ser usada como índice.
- Se você tentar ler ou escrever um elemento que não existe, receberá um IndexError.
- Se um índice tiver um valor negativo, ele conta para trás a partir do final da lista.

O operador in também funciona em listas.

In [None]:
cheeses = ['Cheddar', 'Edam', 'Gouda']
'Edam'in cheeses

In [None]:
'Brie' in cheeses

## 8.3. Percorrendo uma lista
A maneira mais comum de percorrer os elementos de uma lista é com um loop __for__. A sintaxe é a mesma das strings:

In [None]:
for cheese in cheeses:
    print(cheese)

## 8.4. LISTA DE OPERAÇÕES

Isso funciona bem se você precisar apenas ler os elementos da lista. Mas se você quiser escrever ou atualizar os elementos, precisará dos índices. Uma maneira comum de fazer isso é combinar as funções `range` e `len`:

In [None]:

for i in range(len(numbers)):
    numbers[i]= numbers[i] * 2
numbers

Este loop percorre a lista e atualiza cada elemento. len retorna o número de elementos na lista. range retorna uma lista de índices de 0 a n − 1, onde n é o comprimento da lista. Cada vez que passa pelo loop, __i__ obtém o índice do próximo elemento. A instrução de atribuição no corpo usa __i__ para ler o valor antigo do elemento e atribuir o novo valor.

Um loop for sobre uma lista vazia nunca executa o corpo:

In [None]:
for x in empty:
    print("isso nunca acontecerá")

Embora uma lista possa conter outra lista, a lista aninhada ainda conta como um único elemento. O comprimento desta lista é quatro:

In [None]:
list = ['spam', 1, ['Brie', 'Roquefort', 'Pol le Veq'], [1, 2, 3]]
len(list)

List operations
O operador + concatena listas:

In [None]:
a = [1,2,3]
b = [4,5,6]
c = a + b
print(c)

Da mesma forma, o operador * repete uma lista um determinado número de vezes:

In [None]:
[0] * 4

In [None]:
[1,2,3] * 3

O primeiro exemplo se repete quatro vezes. O segundo exemplo repete a lista de três
horas.

## 8.5. List slices (Listar fatias)
O operador slice também funciona em listas:

In [None]:
t = ['a','b','c','d','e','f']
t[1:3]

In [None]:
t[:4]

In [None]:
t[3:]

Se você omitir o primeiro índice, a fatia começará no início. Se você omitir o segundo,
a fatia vai até o fim. Portanto, se você omitir ambos, a fatia será uma cópia de toda a lista.

In [None]:
t[:]

Como as listas são mutáveis, geralmente é útil fazer uma cópia antes de executar operações que dobram, giram ou mutilam listas.

Um operador de fatia no lado esquerdo de uma atribuição pode atualizar vários elementos:

In [None]:
t = ['a', 'b', 'c', 'd', 'e', 'f']
t

In [None]:
t[1:3] = ['x','y']
print(t)

## 8.6 List methods

Python fornece métodos que operam em listas. Por exemplo, `append` adiciona um novo elemento ao final de uma lista:

In [None]:
t = ['a','b','c']
t

In [None]:
t.append('d')
print(t)

`extend` recebe uma lista como argumento e anexa todos os elementos:

In [None]:
t1 = ['a', 'b', 'c']
t2 = ['d','e']
t1.extend(t2)
print(t1)

Este exemplo deixa t2 inalterado. `sort` organiza os elementos da lista de baixo para cima:

In [None]:
t = ['d','c','e','b','a']
print(f"lista original\n{t}")

In [None]:
t.sort()
print(f"lista ordenada\n{t}")

## 8.7. Deleting elements

Existem várias maneiras de excluir elementos de uma lista. Se você conhece o índice do elemento que deseja, pode usar `pop`:

In [None]:
t = ['a','b','c']
print(t)

In [None]:
x = t.pop(1)
print(f"Conteúdo de t: \n {t}")
print(f"Conteúdo de x: \n {x}")


`pop` modifica a lista e retorna o elemento que foi removido. Se você não fornecer um índice, ele excluirá e retornará o último elemento.

Se você não precisar do valor removido, poderá usar a instrução del:

In [None]:
asynct = ['a','b','c']
print(t)

In [None]:
del t[1]
print(t)

If you know the element you want to remove (but not the index), you can use `remove`:

In [None]:
t = ['a','b','c']
print(t)

In [None]:
t.remove('b')
print(t)

To remove more than one element, you can use del with a slice index:


In [None]:
t = ['a', 'b', 'c', 'd', 'e', 'f']
print(t)

In [None]:
del t[1:5]
print(t)

## 8.8. Lists and functions

Existem várias funções internas que podem ser usadas em listas que permitem que você examine rapidamente uma lista sem escrever seus próprios loops:

In [None]:
nums = [3, 41, 12, 9, 74, 15]
print(nums)

In [None]:
print(f"len: {len(nums)}")
print(f"max: {max(nums)}")
print(f"min: {min(nums)}")
print(f"sum: {sum(nums)}")
print(f"media:{sum(nums)/len(nums)}")

__OBS:__
Existem várias funções internas que podem ser usadas em listas que permitem que você examine rapidamente uma lista sem escrever seus próprios loops:

We could rewrite an earlier program that computed the average of a list of numbers
entered by the user using a list.

First, the program to compute an average without a list: `avenum.py`

## 8.9 Lists and strings

Converter uma string em um lista

In [None]:
s = 'spam'
print(s)

In [None]:
t = list(s)
print(t)

- Usando `split` para armazenar as palavras em uma frase em uma lista

In [None]:
s = "pining for the fjords"
print(s)

In [None]:
t = s.split()
print(t)
print(t[2])

- Usando `split` com um delimitador (*delimiter*)

In [None]:
s = "spam-spam-spam"
delimiter = "-"
print(s)
print(delimiter)

In [None]:
s.split(delimiter )

- Usando `join`para juntar elementos de um lista em uma string

In [None]:
t = [ 'pining', 'for','the','fjords']
delimiter = " "
s  = delimiter.join(t)
print(s)

## 8.10. Analisando linhas
Normalmente, quando estamos lendo um arquivo, queremos fazer algo nas linhas além de imprimir a linha inteira. Muitas vezes, queremos encontrar as "linhas interessantes" e, em seguida, analisar a linha para encontrar alguma parte interessante da linha. E se quiséssemos imprimir o dia da semana daquelas linhas que começam com `"from"`?

veja o arquivo *../src/search5.py*

8.11. Objects and values

In [None]:
a = 'banana'
b = 'banana'

In [None]:
# validando se as variaveis são iguais
a is b

In [None]:
a = [1, 2, 3]
b = [1, 2, 3]
a is b

Neste caso diríamos que as duas listas são equivalentes, pois possuem os mesmos elementos, mas não idênticas, pois não são o mesmo objeto. Se dois objetos são idênticos, eles também são equivalentes, mas se são equivalentes, não são necessariamente idênticos.

Até agora, usamos "objeto" e "valor" de forma intercambiável, mas é mais preciso dizer que um objeto tem um valor. Se você executar a = [1,2,3], a refere-se a um objeto de lista cujo valor é uma determinada sequência de elementos. Se outra lista tiver os mesmos elementos, diríamos que ela tem o mesmo valor.

## 8.12. Aliasing

In [None]:
a = [1, 2, 3]
b = a
b is a

A associação de uma variável com um objeto é chamada de referência. Neste exemplo, há duas referências ao mesmo objeto. Um objeto com mais de uma referência tem mais de um nome, então dizemos que o objeto é __aliased__.

Se o objeto __aliased__ for mutável, as alterações feitas com um alias afetarão o outro:

In [None]:
b[0] = 17
print(a)

Embora esse comportamento possa ser útil, é propenso a erros. Em geral, é mais seguro evitar o alias ao trabalhar com objetos mutáveis.

Para objetos imutáveis ​​como strings, o alias não é um problema. Neste exemplo:

In [None]:
a = 'banana'
b ='banana'

quase nunca faz diferença se a e b se referem à mesma string ou não.

## 8.13. List arguments

When you pass a list to a function, the function gets a reference to the list. If
the function modifies a list parameter, the caller sees the change. For example,
delete_head removes the first element from a list:

In [None]:
def delete_head(t):
    del t[0]
    
letters = ['a', 'b', 'c']
delete_head(letters)
print(letters)

O parâmetro te a variável __letters__ são aliases para o mesmo objeto.

É importante distinguir entre operações que modificam listas e operações que criam novas listas. Por exemplo, o método append modifica uma lista, mas o operador + cria uma nova lista:

In [None]:
#modificando
t1 =  [1,2]
t2 =  t1.append(3)
print(t1)
print(t2)

In [None]:
# concatenado
t3 = t1 +[3]
print(t3)
print(t2 is t1)


Essa diferença é importante quando você escreve funções que deveriam modificar listas. Por exemplo, esta função não exclui o cabeçalho de uma lista:

In [None]:
def bad_delete_head(t):
    t =t[1:]  # errado

O operador slice cria uma nova lista e a atribuição faz com que t se refira a ela, mas nada disso tem efeito na lista que foi passada como argumento.

Uma alternativa é escrever uma função que cria e retorna uma nova lista. __Para__ exemplo, __tail__ retorna todos, exceto o primeiro elemento de uma lista:


In [None]:
def tail(t):
    return t[1:]

Esta função deixa a lista original inalterada. Veja como ele é usado:

In [None]:
letters = ['a','b','c']
rest = tail(letters)
print(f"rest: {rest}")
print(f"letters: {letters}")

In [None]:
t = [9, 41, 12, 3, 74, 15]
t[2:4]