# Desafio 1

**Referências**:
- [# 1 pendulum](https://pendulum.eustace.io/docs/#attributes-and-properties)
- [# 2 DictReader()](https://docs.python.org/pt-br/3.7/library/csv.html#csv.DictReader)
- [# 3 setdefault()](https://acervolima.com/dicionario-python-metodo-setdefault/)
- [# 4 List Comprehensions](https://pythoniluminado.netlify.app/listas#list-comprehension)

### Importe as bibliotecas que usuará no código

In [34]:
import pandas as pd
import csv
import pendulum  # 1

# configurações do pandas
pd.options.display.float_format = '{:.2f}'.format  # 2 casas decimais p/ floats
pd.options.display.max_columns = None              # exibir todas as colunas

### Determine sua idade

In [None]:
print('Informe sua data de nascimento: ')

ano = int(input('Ano (AAAA): '))
mes = int(input('Mês (MM): '))
dia = int(input('Dia (DD): '))

my_age = pendulum.datetime(ano, mes, dia).age

print(f'Idade: {my_age}')

## Resolução com python *puro*

### Leia o csv e converta para dicionário

In [29]:
leitor = csv.DictReader(open('consulta_cand_2020_PE_desafio1.csv'))  # 2

# Transforma o objeto `DictReader` em dicionário
candidatos = {}
for linha in leitor:
    for coluna, celula in linha.items():
        # Se a coluna (key) já existir, a lista recebe o valor da célula (value)
        candidatos.setdefault(coluna, []).append(celula)  # 3

###  Quantas pessoas candidatas no estado de Pernambuco seriam mais novas do que você 

In [30]:
# Usa compreensão de lista com condicional para filtrar os valores
qtd_candidatos_mais_novos = [int(x) for x in candidatos['NR_IDADE_DATA_POSSE'] if int(x) < my_age]  # 4

In [31]:
print(f'{len(qtd_candidatos_mais_novos)} são mais novos que eu.')

6361 são mais novos que eu.


### Quantos porcentos isso representa em relação ao total de pessoas candidatas.

In [32]:
pct_mais_novos = (len(qtd_candidatos_mais_novos) / len(candidatos['NR_IDADE_DATA_POSSE'])) * 100

In [33]:
print(f'{pct_mais_novos:.2f}% dos candidatos são mais novos que eu.')

30.15% dos candidatos são mais novos que eu.


## Resolução com *pandas*

### Leia o csv em um dataframe

In [44]:
candidaturas = pd.read_csv('consulta_cand_2020_PE_desafio1.csv', sep=',', encoding='latin_1')

###  Quantas pessoas candidatas no estado de Pernambuco seriam mais novas do que você 

In [59]:
# O método `sum` é aplicado a uma "lista" (Serie) de booleanos, onde True==1 e False==0
qtd_candidatos_mais_novos = sum(candidaturas['NR_IDADE_DATA_POSSE'] < my_age)

print(f'{qtd_candidatos_mais_novos} são mais novos que eu.')

6361 são mais novos que eu.


### Quantos porcentos isso representa em relação ao total de pessoas candidatas.

In [60]:
pct_mais_novos = (qtd_candidatos_mais_novos / candidaturas.shape[0]) * 100

print(f'{pct_mais_novos:.2f}% dos candidatos são mais novos que eu.')

30.15% dos candidatos são mais novos que eu.
