In [None]:
pip install requests

In [None]:
import requests
import pandas as pd
from zipfile import ZipFile
from io import BytesIO

# Criar a função para baixar e extrair os dados

In [None]:
def baixar_e_extrair_dados(url):

    # Envia uma requisição para baixar o arquivo
    response = requests.get(url)

    # Checa se a requisição foi bem sucedida
    if response.status_code == 200:

        # Usa BytesIO para ler o arquivo ZIP da memória
        arquivo_zip = ZipFile(BytesIO(response.content))

        # Extraí os nomes dos arquivos dentro do ZIP
        nomes_dos_arquivos = arquivo_zip.namelist()

        # Assume que há apenas um arquivo CSV e o extrai
        with arquivo_zip.open(nomes_dos_arquivos[0]) as arquivo_csv:

            # Lê o CSV para um DataFrame
            # Definir o tamanho do chunk
            chunk_size = 50000  # Número de linhas a serem lidas por vez

            # Criar um objeto iterável para ler em partes
            # reader = pd.read_csv('caminho/para/seu/arquivo.csv', chunksize=chunk_size)
            df = pd.read_csv(arquivo_csv, sep=';', encoding='ISO-8859-1')
                
            return df
        
    else:
        print("Falha no download do arquivo: Status", response.status_code)
        return None

# URL do arquivo em janeiro

In [None]:
url = 'https://portaldatransparencia.gov.br/download-de-dados/novo-bolsa-familia/202401'

# Baixar, extrair e ler os dados - janeiro de 2024

In [None]:
dataframe = baixar_e_extrair_dados(url)

# Verifica se o Dataframe carregou

In [None]:
if dataframe is not None:
    print("Dados carregados com sucesso.")
else:
    print("Nenhum dado foi carregado.")

# Mostra a Estrutura do DataFrame

In [None]:
dataframe

In [None]:
df_filtrado_municipio = dataframe[dataframe["NOME MUNICÍPIO"] == "WANDERLANDIA"]
df_filtrado_municipio

# Tentativa errada (o campo está vindo com vírgula e não ponto)

In [None]:
soma_parcelas = df_filtrado_municipio["VALOR PARCELA"].sum()
soma_parcelas

# Tentativa correta

In [None]:
soma_parcelas = df_filtrado_municipio['VALOR PARCELA'].str.replace(',', '.').astype(float)
total = soma_parcelas.sum()
total

# # URL do arquivo em março de 2024

In [None]:
url = 'https://portaldatransparencia.gov.br/download-de-dados/novo-bolsa-familia/202403'

# Baixar, extrair e ler os dados - março de 2024

In [None]:
dataframe = baixar_e_extrair_dados(url)

# Mostra a Estrutura do DataFrame

In [None]:
dataframe

# Filtra a coluna UF

In [None]:
df_filtrado_uf = dataframe["UF"]
df_filtrado_uf

# Conta cada UF

In [None]:
frequencia_uf = df_filtrado_uf.value_counts()

# Mostra o mais frequente

In [None]:
uf_mais_frequente = frequencia_uf.idxmax()
uf_mais_frequente