# Aula \#5 - Desafio em Grupo & Checkpoint \#1 - Desafio: estruturas de fluxo e controle de fluxo

Nesse desafio, o objetivo é usar algumas estruturas de dados comuns em Python conjuntamente com o que já vimos sobre estruturas de fluxo.

Que estruturas são essas?

* strings (sequência de caracteres ordenada imutável)

* listas (sequência de objetos ordenada)

* tuplas (sequência de objetos ordenada imutável)

* conjuntos (sequência de objetos)

* dicionários (sequência de itens, em que cada item é composto de uma chave e um valor)

In [None]:
from utils.hints import give_me_a_hint

## Imutabilidade

** strings **

In [2]:
my_name = 'cinthia'

Ah, eu esqueci de colocar a letra maiúscula! Vamos tentar mudar só o primeiro caractere

In [3]:
my_name[0] = 'C'

TypeError: 'str' object does not support item assignment

Como resolver o problema? Redefinindo a variável `my_name`

In [4]:
my_name = 'Cinthia'
my_name

'Cinthia'

** tupla **

In [2]:
itens_a_comprar = ('bichinho de pelúcia', 'laranja', 'granola', 'iogurte', 'aveia')

In [3]:
print('Tipo: {0}'.format(type(itens_a_comprar)))

Tipo: <class 'tuple'>


Retornando o último item (índice `-1`)

In [5]:
itens_a_comprar[-1]

"<class 'tuple'>"

In [8]:
itens_a_comprar[-1] = 'chá mate'

TypeError: 'tuple' object does not support item assignment

Note que com um objeto do tipo `list` é possível fazer a operação, sem problemas

In [9]:
lista_de_itens_a_comprar = ['bichinho de pelúcia', 'laranja', 'granola', 'iogurte', 'aveia']
lista_de_itens_a_comprar[-1] = 'chá mate'
lista_de_itens_a_comprar

['bichinho de pelúcia', 'laranja', 'granola', 'iogurte', 'chá mate']

Será que é por isso que dizemos `lista de compras`, e não `tupla de compras`?

<img src="data/pun.gif" width="200"/>

\* Também existe um tipo em Python para conjuntos imutáveis, que são os [frozensets](http://thomas-cokelaer.info/tutorials/python/frozensets.html), mas aqui vamos concentrar nos conjuntos do tipo `set`.

## Exemplo prático

Vamos definir uma função que coloca a primeira letra de uma string em letra maiúscula

In [None]:
def capitalize_string(term):
    if term[0] == 'a':
        new_term = 'A' + term[1:]
    elif term[0] == 'b':
        new_term = 'B' + term[1:]
    elif term[0] == 'c':
        new_term = 'C' + term[1:]
    elif term[0] == 'd':
        new_term = 'D' + term[1:]
    elif term[0] == 'e':
        new_term = 'E' + term[1:]
    elif term[0] == 'f':
        new_term = 'F' + term[1:]
    elif term[0] == 'g':
        new_term = 'G' + term[1:]
    elif term[0] == 'h':
        new_term = 'H' + term[1:]
    elif term[0] == 'i':
        new_term = 'I' + term[1:]
    elif term[0] == 'j':
        new_term = 'J' + term[1:]
    elif term[0] == 'k':
        new_term = 'K' + term[1:]
    elif term[0] == 'l':
        new_term = 'L' + term[1:]
    elif term[0] == 'm':
        new_term = 'M' + term[1:]
    elif term[0] == 'n':
        new_term = 'N' + term[1:]
    elif term[0] == 'o':
        new_term = 'O' + term[1:]
    elif term[0] == 'p':
        new_term = 'P' + term[1:]
    elif term[0] == 'q':
        new_term = 'Q' + term[1:]
    elif term[0] == 'r':
        new_term = 'R' + term[1:]
    elif term[0] == 's':
        new_term = 'S' + term[1:]
    elif term[0] == 't':
        new_term = 'T' + term[1:]
    elif term[0] == 'u':
        new_term = 'U' + term[1:]
    elif term[0] == 'v':
        new_term = 'V' + term[1:]
    elif term[0] == 'w':
        new_term = 'W' + term[1:]
    elif term[0] == 'x':
        new_term = 'X' + term[1:]
    elif term[0] == 'y':
        new_term = 'Y' + term[1:]
    elif term[0] == 'z':
        new_term = 'Z' + term[1:]
    else:
        new_term = term
    return new_term

Teste a função rodando a célula abaixo. O resultado deve ser `True`

In [None]:
capitalize_string('que tal formatar umas strings?') == 'Que tal formatar umas strings?'

Parece que a função funcionou!

Mas ela parece um pouco comprida e _repetitiva_. Será que conseguimos reescrevê-la usando um `for` sobre a lista de letras do alfabeto?

Além disso, escrever todas as letras do alfabeto foi um pouco tedioso... Gostaria de evitar ter que escrever "na mão" essa lista.

Será que o Python já tem essa lista lá dentro? Podemos procurar (dando um `google` ou `ducking it`):

<img src="data/search_for_alphabet.jpeg" alt="drawing" width="500"/>

Primeiro, vamos fazer o import dessa lib chamada `string`

In [None]:
import string

In [None]:
string.ascii_lowercase

Existiria um `ascii_uppercase`? Vamos testar...
(na verdade, no jupyter, vocês têm acesso a autocomplete da api do módulo. Basta apertar `Tab` - depois do ponto)

In [None]:
string.ascii_uppercase

Agora já podemos reescrever nossa função:

In [None]:
def capitalize_string_v2(term):
    new_term = term
    for i, ch in enumerate(string.ascii_lowercase):
        if term[0] == ch:
            new_term = string.ascii_uppercase[i] + term[1:]
    return new_term

Note que aqui usamos a função `enumerate`, que recebe com um argumento um objeto iterável e retorna tuplas contendo o índice (começando do zero) e o elemento do objeto iterável.

Como no caso da função que fizemos antes, podemos testar `capitalize_string_v2` com nosso exemplo e checar se ela realmente funciona.

In [None]:
capitalize_string_v2('que tal formatar umas strings?') == 'Que tal formatar umas strings?'

Também existe um método que transforma uma letra em letra maiúscula. Ele se chama [upper](http://www.tutorialspoint.com/python/string_upper.htm). Clique no link para ler um pouco sobre ela. Que tal construir uma função `capitalize_string_v3` usando-a?

In [27]:
def capitalize_string_v3(term):
    return term[0].upper() + term[1:]

In [28]:
capitalize_string_v3('que tal formatar umas strings?') == 'Que tal formatar umas strings?'

True

Foi fácil?

Que tal agora ler um pouco sobre o método [capitalize](http://www.tutorialspoint.com/python/string_capitalize.htm)?

Modifique a célula abaixo para que `capitalized_string` contenha a string que estamos usando para teste com a inicial maiúscula (use o método `capitalize`)

In [None]:
capitalized_string = 'que tal formatar umas strings?'

Ao rodar a célula abaixo, o resultado deve ser `True`

In [None]:
capitalized_string == 'Que tal formatar umas strings?'

## Desafio: "limpeza" de dados

A vida de _data scientist_ muitas vezes envolve trabalhar com datasets que estão mal formatados ("sujos"). Normalmente, um dos primeiros passos antes de qualquer análise ou de criar um modelo é limpar os dados.

Imagine que temos um arquivo com as buscas 

Imagine que você recebeu um texto com letras maiúsculas e minúsculas misturadas. Queremos que esse texto esteja em letra minúscula para facilitar certos processamentos a serem feitos depois. Você pode ajudar nessa tarefa?

Obs.: sobre formatação de strings, leia mais no [link](https://www.digitalocean.com/community/tutorials/how-to-use-string-formatters-in-python-3).

In [None]:
mensagem = """
[FREELA DESIGN REMOTO]
Oi, meninas! Tudo bem?

Estou precisando de uma designer para um freela de redes sociais. Criação de posts para Facebook, Instagram, LinkedIn e Instagram em formatos diversos. Até 20 posts por mês.

Quem tiver interesse, por favor, coloca o e-mail e o link do portfólio aqui nos comentários. Entrarei em contato com mais informações.

Obrigada!
"""

** Descomente (apagando o símbolo `#`) e rode a célula abaixo SOMENTE se quiser uma dica **

In [None]:
#give_me_a_hint('limpeza_mensagem')

Formate `mensagem` para que ela fique em letras minúsculas e a coloque na variável `mensagem_letra_minuscula`

In [None]:
mensagem_letra_minuscula = ###

Ao rodar a célula abaixo, o resultado deve ser `True`

In [None]:
mensagem_letra_minuscula == '\n[freela design - remoto]\noi, meninas! tudo bem?\n\nestou precisando de uma designer para um freela de redes sociais. criação de posts para facebook, instagram, linkedin e instagram em formatos diversos. até 20 posts/mês.\n\nquem tiver interesse, por favor, coloca o e-mail e o link do portfólio aqui nos comentários. entrarei em contato com mais informações :)\n\nobrigada!\n'

Agora que temos o texto em letra minúscula, vamos tentar calcular o número de palavras no texto de `mensagem_letra_minuscula`?

Atenção: não é necessário se preocupar com os caracteres especiais, por enquanto.

Se você ainda não tem uma ideia do que fazer, e quiser uma dica, descomente e execute a célula abaixo. Do contrário, siga em frente!

In [None]:
#give_me_a_hint('limpeza_mensagem_count_words')

In [None]:
###

Quantas e quais palavras você encontrou?

In [None]:
###

Esse resultado mudaria, se quiséssemos saber a quantidade de palavras ÚNICAS? Como você adaptaria o algoritmo que descobriu para encontrar esse número?

In [None]:
###