In [1]:
import pandas as pd

# Ler o arquivo Excel ignorando as primeiras 4 linhas
df = pd.read_excel('tabela9514_grupo_idade_BR_GR_UF.xlsx', skiprows=5)

# Redefinir os nomes das colunas
novos_nomes = {
    'Unnamed: 0': 'Unidade da Federação e Município',
    'Unnamed: 1': 'Forma de declaração da idade',
    'Total': 'População Total',
    'Total.1': 'População Total Homens',
    'Total.2': 'População Total Mulheres'
}

df.rename(columns=novos_nomes, inplace=True)

# Converter as faixas etárias para valores numéricos
faixas_etarias = df.iloc[:, 2:].apply(pd.to_numeric, errors='coerce')

# Calcular a soma da população masculina e feminina para cada faixa etária
soma_por_faixa_etaria_homem = faixas_etarias.iloc[:, ::2].sum()
soma_por_faixa_etaria_mulher = faixas_etarias.iloc[:, 1::2].sum()

# Identificar a faixa etária com a maior população masculina e feminina
max_faixa_etaria_homem = soma_por_faixa_etaria_homem.idxmax()
max_populacao_homem = soma_por_faixa_etaria_homem[max_faixa_etaria_homem]

max_faixa_etaria_mulher = soma_por_faixa_etaria_mulher.idxmax()
max_populacao_mulher = soma_por_faixa_etaria_mulher[max_faixa_etaria_mulher]

# Questão A
print(f"Faixa etária com maior população masculina: {max_faixa_etaria_homem}, população: {max_populacao_homem}")
print(f"Faixa etária com maior população feminina: {max_faixa_etaria_mulher}, população: {max_populacao_mulher}")

# Questão B
indice_max_homens_25_29 = faixas_etarias['25 a 29 anos.1'].idxmax()
municipio_max_homens_25_29 = df.loc[indice_max_homens_25_29, 'Unidade da Federação e Município']
populacao_max_homens_25_29 = faixas_etarias.loc[indice_max_homens_25_29, '25 a 29 anos.1']

print(f"Município com mais homens na faixa etária entre 25 e 29 anos: {municipio_max_homens_25_29}, população: {populacao_max_homens_25_29}")

# Questão C
indice_min_homens_25_29 = faixas_etarias['25 a 29 anos.1'].idxmin()
municipio_min_homens_25_29 = df.loc[indice_min_homens_25_29, 'Unidade da Federação e Município']
populacao_min_homens_25_29 = faixas_etarias.loc[indice_min_homens_25_29, '25 a 29 anos.1']

print(f"Município com menos homens na faixa etária entre 25 e 29 anos: {municipio_min_homens_25_29}, população: {populacao_min_homens_25_29}")

# Criar um DataFrame com os resultados
resultados = pd.DataFrame({
    'Questão': ['Faixa etária com maior população masculina',
                'Faixa etária com maior população feminina',
                'Município com mais homens na faixa etária entre 25 e 29 anos',
                'Município com menos homens na faixa etária entre 25 e 29 anos'],
    'Resultado': [f"{max_faixa_etaria_homem}, população: {max_populacao_homem}",
                  f"{max_faixa_etaria_mulher}, população: {max_populacao_mulher}",
                  f"{municipio_max_homens_25_29}, população: {populacao_max_homens_25_29}",
                  f"{municipio_min_homens_25_29}, população: {populacao_min_homens_25_29}"]
}

# Salvar os resultados em um arquivo Excel
resultados.to_excel('erick_vidotto.xlsx', index=False)

# Salvar os resultados em um arquivo JSON
resultados.to_json('erick_vidotto.json', orient='records', force_ascii=False, indent=4)

print("Resultados salvos nos arquivos erick_vidotto.xlsx e erick_vidotto.json")


Faixa etária com maior população masculina: População Total, população: 609242268.0
Faixa etária com maior população feminina: 40 a 44 anos, população: 48216510.0
Município com mais homens na faixa etária entre 25 e 29 anos: Brasil, população: 7627458.0
Município com menos homens na faixa etária entre 25 e 29 anos: Roraima, população: 27568.0
Resultados salvos nos arquivos erick_vidotto.xlsx e erick_vidotto.json
