## 0. Objetivo

Ao estudarmos os diferentes assuntos até agora, todos foram apresentados de forma relativamente artificial para que pudéssemos enfatizar as características de cada um deles.

Voltaremos agora aos assuntos já tratados, porém misturando as diferentes funcionalidades para a análise de dados em casos mais reais.

## 1. Variáveis

As variáveis podem ser pensadas como caixas que guardam um conteúdo e nos permitem fazer referência à esse conteúdo diversas vezes.

In [88]:
string_1 = 'Conteúdo'

print(string_1)

Conteúdo


Porém, tal metáfora é incompleta. Pois em python podemos nos referir ao mesmo conteúdo por diferentes nomes de variáveis. Podemos melhorar nossa metáfora pensando assim nas variáveis como etiquetas ao conteúdo que nos permitem referir à eles

In [85]:
string_2 = string_1
print(string_2)

Conteúdo


In [86]:
string_1 = 'Conteúdo modificado'

print(string_1)
print(string_2)

Conteúdo modificado
Conteúdo


Quanto aos tipos numéricos (float e int), os operadores matemáticos fornecem uma notação curta para modificá-los.

Tal notação é muito útil para modificar a variável diversas vezes.

In [87]:
valor_inicial = 0
valor_inicial += 1

print(valor_inicial)

1


## 2. Strings

As strings são sequências de caracteres. O nome string, fio em inglês, pode ser compreendido em uma imagem: uma série de caracterese, como miçangas, presas por uma corda que as transpassa.

Nos exemplos anteriores, nossas strings estavam presentes no próprio arquivo python. Uma situação mais comum, porém, é que ela seja lida de um arquivo externo. Veremos agora como fazê-lo.

In [63]:
arquivo = open("no_meio_do_caminho.txt", "r", encoding="utf-8")
conteudo_arquivo = arquivo.read()
print(conteudo_arquivo)

No meio do caminho tinha uma pedra
tinha uma pedra no meio do caminho
tinha uma pedra
no meio do caminho tinha uma pedra.

Nunca me esquecerei desse acontecimento
na vida de minhas retinas tão fatigadas.
Nunca me esquecerei que no meio do caminho
tinha uma pedra
tinha uma pedra no meio do caminho
no meio do caminho tinha uma pedra.



## Novas funções para Strings (Métodos)

Revisitando agora as strings com conhecimentos sobre funções, podemos conhecer algumas de suas funções mais clássicas. As funções que são utilizadas por alguma classe são conhecidas como 'métodos'. Alguns métodos da classe string são: replace e split

### Replace
O método replace substitui a palavra utilizada no primeiro argumento pela palavra utilizada no segundo argumento


In [106]:
conteudo_modificado = conteudo_arquivo.replace('pedra', 'podre')
print(conteudo_modificado)

No meio do caminho tinha uma podre
tinha uma podre no meio do caminho
tinha uma podre
no meio do caminho tinha uma podre.

Nunca me esquecerei desse acontecimento
na vida de minhas retinas tão fatigadas.
Nunca me esquecerei que no meio do caminho
tinha uma podre
tinha uma podre no meio do caminho
no meio do caminho tinha uma podre.



In [109]:
# O terceiro argumento, opcional, indica quantas vezes a substituição deve ocorrer
conteudo_modificado_2 = conteudo_arquivo.replace('pedra', 'podre', 1) 
print(conteudo_modificado_2)

No meio do caminho tinha uma podre
tinha uma pedra no meio do caminho
tinha uma pedra
no meio do caminho tinha uma pedra.

Nunca me esquecerei desse acontecimento
na vida de minhas retinas tão fatigadas.
Nunca me esquecerei que no meio do caminho
tinha uma pedra
tinha uma pedra no meio do caminho
no meio do caminho tinha uma pedra.



In [122]:
print(conteudo_arquivo.strip('pedra'))

No meio do caminho tinha uma pedra
tinha uma pedra no meio do caminho
tinha uma pedra
no meio do caminho tinha uma pedra.

Nunca me esquecerei desse acontecimento
na vida de minhas retinas tão fatigadas.
Nunca me esquecerei que no meio do caminho
tinha uma pedra
tinha uma pedra no meio do caminho
no meio do caminho tinha uma pedra.



### 2.1 Caracteres especiais

Ao utilizarmos a função print para um texto, os caracteres especiais são formatados. Vejamos o que acontence por trás da cortina.

In [110]:
print('Hello World')

Hello World


In [111]:
print('Hello \n World')

Hello 
 World


In [112]:
print('Hello \t World')

Hello 	 World


Para fazer o print de uma string sem formatação de seus caracteres especiais, adicionamos o caracter r antes da string. Este r é a inicial da palavra raw em inglês, pois significa que a string está crua, sem formatação.

In [113]:
print(r'Hello \n World')

Hello \n World


Tendo em vista os caracteres especiais, voltemos ao poema de Drummond para conhecer o método split, que separa uma string em uma lista, utilizando como delimitador o caracter passado como argumento.

### Listas e o método split

In [123]:
linhas = conteudo_arquivo.split('\n')
print(linhas)

['No meio do caminho tinha uma pedra', 'tinha uma pedra no meio do caminho', 'tinha uma pedra', 'no meio do caminho tinha uma pedra.', '', 'Nunca me esquecerei desse acontecimento', 'na vida de minhas retinas tão fatigadas.', 'Nunca me esquecerei que no meio do caminho', 'tinha uma pedra', 'tinha uma pedra no meio do caminho', 'no meio do caminho tinha uma pedra.', '']


Nosso texto agora está dividido por linhas em uma lista, cada linhaa é um um elemento dessa lista e uma string

In [124]:
print(type(linhas)) #Tipo da variável linhas
print(len(linhas)) #Quantos elementos há na lista

<class 'list'>
12


### For loops

In [125]:
for linha in linhas:
    print(linha) #Print linha a linha

No meio do caminho tinha uma pedra
tinha uma pedra no meio do caminho
tinha uma pedra
no meio do caminho tinha uma pedra.

Nunca me esquecerei desse acontecimento
na vida de minhas retinas tão fatigadas.
Nunca me esquecerei que no meio do caminho
tinha uma pedra
tinha uma pedra no meio do caminho
no meio do caminho tinha uma pedra.



Vamos começar a fazer perguntas à esses dados.

Quantas linhas há no arquivo? 

_(Este é um arquivo pequeno, o utilizamos como exemplo para ter um feedback visual do que o nosso código faz. Mas conhecendo os métodos, podemos lidar com dados que são grande demais para serem visualizados)_

In [126]:
print(len(linhas))

12


In [None]:
Qual é o tamanho médio das linhas, em quantidade de caracteres?

In [128]:
def media_caracteres(lista_linhas):
    quantidade_caracteres = 0
    n_linhas = 0
    
    for linha in lista_linhas:
        quantidade_caracteres += len(linha)
        n_linhas += 1

        media = quantidade_caracteres/n_linhas
        
        return media    

In [129]:
print(media_caracteres(linhas))

34.0


### While loops

Em nossa aula de loops utilizamos principalmente os loops do tipo for, combinados com as expressões de controle de fluxo continue, pass e break. Há ainda um outro tipo de loop, chamado while (enquanto), que a cada vez que o loop é reiniciado avalia se uma expressão é verdadeira e continua se essa expressão for True

In [133]:
n_linha = 0

while n_linha < 2:
    print(linhas[n_linha])
    n_linha += 1

No meio do caminho tinha uma pedra
tinha uma pedra no meio do caminho
