# Tarefa 03

- Leia os enunciados com atenção
- Saiba que pode haver mais de uma resposta correta
- Insira novas células de código sempre que achar necessário
- Em caso de dúvidas, procure os Tutores
- Divirta-se :)

In [31]:
import pandas as pd
import requests

####  1) Lendo de APIs
Vimos em aula como carregar dados públicos do governo através de um API (*Application Programming Interface*). No exemplo de aula, baixamos os dados de pedidos de verificação de limites (PVL) realizados por estados, e selecionamos apenas aqueles referentes ao estado de São Paulo.

1. Repita os mesmos passos feitos em aula, mas selecione os PVLs realizados por municípios no estado do Rio de Janeiro.
2. Quais são os três *status* das solicitações mais frequentes na base? Quais são suas frequências?
3. Construa uma nova variável que contenha o ano do **status**. Observe que ```data_status``` vem como tipo *object* no **DataFrame**. Dica: você pode usar o método ```.str``` para transformar o tipo da variável em string, em seguida um método como [**slice()**](https://pandas.pydata.org/docs/reference/api/pandas.Series.str.slice.html) ou [**split()**](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.split.html).
4. Indique a frequência de cada ano do campo construído no item (3).

In [32]:
# Carregando os dados

url = 'https://apidatalake.tesouro.gov.br/ords/sadipem/tt/pvl'
response = requests.get(url)
data = response.json()
df = pd.json_normalize(data['items'])

# Filtrando para PVLs realizados por municípios no estado do Rio de Janeiro
df_rj = df[df['uf'] == 'RJ']

df_rj.head()

Unnamed: 0,id_pleito,tipo_interessado,interessado,cod_ibge,uf,num_pvl,status,num_processo,data_protocolo,tipo_operacao,finalidade,tipo_credor,credor,moeda,valor,pvl_assoc_divida,pvl_contradado_credor,data_status
126,13784,Município,Santo Antônio de Pádua,3304706,RJ,,Deferido,19405.000084/2002-27,2002-12-19T02:00:00Z,Operação contratual interna,PMAT,Instituição Financeira Nacional,Banco do Brasil S/A,Real,648124.0,0,0,06/02/2003
139,13574,Município,Rio de Janeiro,3304557,RJ,,Deferido,19405.000028/2006-16,2007-04-30T03:00:00Z,Operação contratual interna,Saneamento básico,Instituição Financeira Nacional,Caixa Econômica Federal,Real,39528049.81,1,0,25/05/2007
219,13653,Município,Duque de Caxias,3301702,RJ,,Deferido,19405.000044/2006-17,2007-02-28T03:00:00Z,Operação contratual interna,PMAT,Instituição Financeira Nacional,Banco Nacional de Desenvolvimento Econômico e ...,Real,15172020.0,0,0,13/03/2007
324,9990,Município,Barra do Piraí,3300308,RJ,,Arquivado,17944.001095/2008-97,2008-08-18T03:00:00Z,Operação contratual interna,PAC - Saneamento - 2008 B,Instituição Financeira Nacional,Caixa Econômica Federal,Real,1472500.0,0,0,30/10/2008
329,10290,Município,Tanguá,3305752,RJ,,Arquivado,17944.001163/2007-37,2007-07-24T03:00:00Z,Operação contratual interna,PNAFM,Instituição Financeira Nacional,Caixa Econômica Federal,Real,300381.0,0,0,01/11/2007


In [33]:
# 2) Determinando os três status mais frequentes das solicitações

status_counts = df['status'].value_counts()
top_three_status = status_counts.head(3)
print(top_three_status)

Deferido             2613
Deferido (PVL-IF)    1163
Arquivado             363
Name: status, dtype: int64


In [34]:
# Aqui criamos uma cópia do DataFrame ao selecionar a fatia, para poder modificar o df_rj sem afetar df e sem gerar o aviso de warning.

df_rj = df[df['uf'] == 'RJ'].copy()

In [38]:
# Cria a coluna 'ano_status' extraindo o ano da coluna 'data_status'
df_rj['ano_status'] = pd.to_datetime(df_rj['data_status'], format='%d/%m/%Y').dt.year

# Exibe as primeiras linhas do DataFrame
df_rj.head()

Unnamed: 0,id_pleito,tipo_interessado,interessado,cod_ibge,uf,num_pvl,status,num_processo,data_protocolo,tipo_operacao,finalidade,tipo_credor,credor,moeda,valor,pvl_assoc_divida,pvl_contradado_credor,data_status,ano_status
126,13784,Município,Santo Antônio de Pádua,3304706,RJ,,Deferido,19405.000084/2002-27,2002-12-19T02:00:00Z,Operação contratual interna,PMAT,Instituição Financeira Nacional,Banco do Brasil S/A,Real,648124.0,0,0,06/02/2003,2003
139,13574,Município,Rio de Janeiro,3304557,RJ,,Deferido,19405.000028/2006-16,2007-04-30T03:00:00Z,Operação contratual interna,Saneamento básico,Instituição Financeira Nacional,Caixa Econômica Federal,Real,39528049.81,1,0,25/05/2007,2007
219,13653,Município,Duque de Caxias,3301702,RJ,,Deferido,19405.000044/2006-17,2007-02-28T03:00:00Z,Operação contratual interna,PMAT,Instituição Financeira Nacional,Banco Nacional de Desenvolvimento Econômico e ...,Real,15172020.0,0,0,13/03/2007,2007
324,9990,Município,Barra do Piraí,3300308,RJ,,Arquivado,17944.001095/2008-97,2008-08-18T03:00:00Z,Operação contratual interna,PAC - Saneamento - 2008 B,Instituição Financeira Nacional,Caixa Econômica Federal,Real,1472500.0,0,0,30/10/2008,2008
329,10290,Município,Tanguá,3305752,RJ,,Arquivado,17944.001163/2007-37,2007-07-24T03:00:00Z,Operação contratual interna,PNAFM,Instituição Financeira Nacional,Caixa Econômica Federal,Real,300381.0,0,0,01/11/2007,2007


In [39]:
# Determina a frequência de cada ano
ano_status_counts = df_rj['ano_status'].value_counts()
print(ano_status_counts)

2008    8
2007    8
2019    7
2014    6
2012    5
2023    5
2011    4
2013    2
2009    2
2015    2
2022    2
2010    2
2016    2
2017    1
2004    1
2003    1
2020    1
2006    1
2002    1
Name: ano_status, dtype: int64


####  2) Melhorando a interação com o API
Observe dois URLs de consultas diferentes, por exemplo o URL utilizado em aula, e o URL feito no exercício anterior. Compare-os e observe as diferenças.

1. Faça uma função em Python que recebe como argumento o UF da consulta e o tipo de interessado (```'Estado'```ou ```Município```), e que devolve os dados da consulta no formato *DataFrame*.
2. Quantas solicitações para o Estado podem ser consultadas para Minas Gerais com *status* em 'Arquivado por decurso de prazo' estão registradas?
3. Qual é o município da Bahia com mais solicitações deferidas?
4. Salve um arquivo .csv com os dados de solicitações da Bahia, com interessado = 'Estado'

In [44]:
def consulta_api(uf, tipo_interessado):
    url = 'https://apidatalake.tesouro.gov.br/ords/sadipem/tt/pvl'
    response = requests.get(url)
    data = response.json()
    df = pd.json_normalize(data['items'])
    df_uf = df[(df['uf'] == uf) & (df['tipo_interessado'] == tipo_interessado)]
    return df_uf

df_rj = consulta_api('RJ', 'Município')

# Mostra as primeiras 5 linhas do DataFrame
df_rj.head()


Unnamed: 0,id_pleito,tipo_interessado,interessado,cod_ibge,uf,num_pvl,status,num_processo,data_protocolo,tipo_operacao,finalidade,tipo_credor,credor,moeda,valor,pvl_assoc_divida,pvl_contradado_credor,data_status
126,13784,Município,Santo Antônio de Pádua,3304706,RJ,,Deferido,19405.000084/2002-27,2002-12-19T02:00:00Z,Operação contratual interna,PMAT,Instituição Financeira Nacional,Banco do Brasil S/A,Real,648124.0,0,0,06/02/2003
139,13574,Município,Rio de Janeiro,3304557,RJ,,Deferido,19405.000028/2006-16,2007-04-30T03:00:00Z,Operação contratual interna,Saneamento básico,Instituição Financeira Nacional,Caixa Econômica Federal,Real,39528049.81,1,0,25/05/2007
219,13653,Município,Duque de Caxias,3301702,RJ,,Deferido,19405.000044/2006-17,2007-02-28T03:00:00Z,Operação contratual interna,PMAT,Instituição Financeira Nacional,Banco Nacional de Desenvolvimento Econômico e ...,Real,15172020.0,0,0,13/03/2007
324,9990,Município,Barra do Piraí,3300308,RJ,,Arquivado,17944.001095/2008-97,2008-08-18T03:00:00Z,Operação contratual interna,PAC - Saneamento - 2008 B,Instituição Financeira Nacional,Caixa Econômica Federal,Real,1472500.0,0,0,30/10/2008
329,10290,Município,Tanguá,3305752,RJ,,Arquivado,17944.001163/2007-37,2007-07-24T03:00:00Z,Operação contratual interna,PNAFM,Instituição Financeira Nacional,Caixa Econômica Federal,Real,300381.0,0,0,01/11/2007


In [45]:
df_mg = consulta_api('MG', 'Estado')

In [47]:
df_mg = consulta_api('MG', 'Estado')
solicitacoes_arquivadas = df_mg[df_mg['status'] == 'Arquivado por decurso de prazo']
num_solicitacoes_arquivadas = len(solicitacoes_arquivadas)

In [48]:
df_ba = consulta_api('BA', 'Município')
solicitacoes_deferidas = df_ba[df_ba['status'] == 'Deferido']
municipio_com_mais_solicitacoes = solicitacoes_deferidas['interessado'].value_counts().idxmax()

In [51]:
import os

df_ba_estado = consulta_api('BA', 'Estado')
nome_arquivo = 'solicitacoes_bahia_estado.csv'
df_ba_estado.to_csv(nome_arquivo, index=False)

# Verifica se o arquivo foi criado
if os.path.exists(nome_arquivo):
    print(f'O arquivo {nome_arquivo} foi gerado com sucesso.')
else:
    print('O arquivo não foi gerado corretamente.')

O arquivo solicitacoes_bahia_estado.csv foi gerado com sucesso.
