## Projeto Final Coder

#### Primeira etapa - Importação das Bases

Escolher uma API da lista disponível; Fazer a extração de pelo menos 3 tabelas; Criar um alerta de erro usando a função alerta() do desafio da aula Fundamentos de programação III.

Formato: O entregável é um link do GitHub para um arquivo .py ou .ipynb com a resolução proposta; Utilizar o mesmo repositório criado na aula de GIT.   

Observações: Não é necessário fazer tratamentos das tabelas, salvar no banco de dados ou documentação nesta etapa do projeto.

In [1]:
# Importação das Bibliotecas
import requests
import pandas as pd
from plyer import notification
import sqlite3

In [2]:
# URL's trabalhadas no projeto:
url_feriados24 = 'https://brasilapi.com.br/api/feriados/v1/2024' # lista dos feriados nacionais em 2024.
url_pix = 'https://brasilapi.com.br/api/pix/v1/participants' # lista de instituções bancárias que utilizam o pix no país.
url_corretoras = 'https://brasilapi.com.br/api/cvm/corretoras/v1' # corretoras de valores do país.

In [3]:
# Criação da DEF que analisa a URL e importa em DF se não houver erros.
def df_result_req(url):
    '''
    Mostra um alerta por 10 segundos na tela, informando o status da URL
    O primeiro argumento é a URL a ser analisada. O segundo argumento é o nome de saída do DF.
    '''

    req = requests.get(url)
    reqsts = req.status_code
    reqrea = req.reason

    if reqsts == 200:
        df_result = pd.DataFrame(requests.get(url).json())
        df_result = df_result.replace(['NA', 'N/A', 'None', ''], pd.NA)
        msg = f'A conexão foi estabelecida com sucesso! Criado o DF.'
    else:
        msg = "Falha na conexão!"
    
    notification.notify(
    title=f'STATUS DA CONEXÃO',
    message=f'{msg} Cod: {reqsts}. Info: {reqrea}',
    app_name=" ",
    timeout=10)

    return df_result

1.1. Importa primeiro DF de Feriados, salva DF original e verifica as infos do DF.

In [4]:
df_feriados24 = df_result_req(url_feriados24)
df_feriados24

Unnamed: 0,date,name,type
0,2024-01-01,Confraternização mundial,national
1,2024-02-13,Carnaval,national
2,2024-03-29,Sexta-feira Santa,national
3,2024-03-31,Páscoa,national
4,2024-04-21,Tiradentes,national
5,2024-05-01,Dia do trabalho,national
6,2024-05-30,Corpus Christi,national
7,2024-09-07,Independência do Brasil,national
8,2024-10-12,Nossa Senhora Aparecida,national
9,2024-11-02,Finados,national


In [5]:
df_feriados24.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   date    12 non-null     object
 1   name    12 non-null     object
 2   type    12 non-null     object
dtypes: object(3)
memory usage: 420.0+ bytes


1.2. Importa segundo DF de Pix, salva DF original e verifica as infos do DF.

In [6]:
df_pix = df_result_req(url_pix)
df_pix.head()

Unnamed: 0,ispb,nome,nome_reduzido,modalidade_participacao,tipo_participacao,inicio_operacao
0,0,BANCO DO BRASIL S.A.,BCO DO BRASIL S.A.,PDCT,DRCT,2020-11-03T09:30:00.000Z
1,208,BRB - BANCO DE BRASILIA S.A.,BRB - BCO DE BRASILIA S.A.,PDCT,DRCT,2020-11-03T09:30:00.000Z
2,68987,COOPERATIVA DE CRÉDITO ARACREDI LTDA. - SICOOB...,CC ARACREDI LTDA.,PDCT,IDRT,2020-11-03T09:30:00.000Z
3,75847,COOPERATIVA DE CRÉDITO UNICRED CENTRO-SUL LTDA...,CC UNICRED CENTRO-SUL LTDA - UNICRED CENTRO-SUL,PDCT,IDRT,2020-11-03T09:30:00.000Z
4,106180,CENTRAL DAS COOPERATIVAS DE CRÉDITO DOS ESTADO...,"CCC DOS EST DE MT, MS E MUN DE CACOAL/RO",PDCT,IDRT,2020-11-03T09:30:00.000Z


In [7]:
df_pix.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 806 entries, 0 to 805
Data columns (total 6 columns):
 #   Column                   Non-Null Count  Dtype 
---  ------                   --------------  ----- 
 0   ispb                     806 non-null    object
 1   nome                     806 non-null    object
 2   nome_reduzido            806 non-null    object
 3   modalidade_participacao  806 non-null    object
 4   tipo_participacao        806 non-null    object
 5   inicio_operacao          806 non-null    object
dtypes: object(6)
memory usage: 37.9+ KB


1.3. Importa terceiro DF de Corretoras, salva DF original e verifica as infos do DF.

In [8]:
df_corretoras = df_result_req(url_corretoras)
df_corretoras.head()

Unnamed: 0,cnpj,type,nome_social,nome_comercial,status,email,telefone,cep,pais,uf,municipio,bairro,complemento,logradouro,data_patrimonio_liquido,valor_patrimonio_liquido,codigo_cvm,data_inicio_situacao,data_registro
0,76621457000185,CORRETORAS,4UM DTVM S.A.,4UM INVESTIMENTOS,CANCELADA,controle@4um.com.br,33519966.0,80420210,BRASIL,PR,CURITIBA,CENTRO,4º ANDAR,R. VISCONDE DO RIO BRANCO 1488,2005-12-31,4228660.18,2275,2006-10-05,1968-01-15
1,33817677000176,CORRETORAS,ABC BRASIL DISTRIBUIDORA DE TÍTULOS E VALORES ...,ABC BRASIL CORRETORA,CANCELADA,complianceregulatorio@abcbrasil.com.br,31702172.0,1453000,EGITO,SP,SÃO PAULO,ITAIM BIBI,2º ANDAR,"AV. CIDADE JARDIM, 803",2002-12-31,0.0,3514,2002-10-14,2002-10-14
2,10664027000132,CORRETORAS,ABERTURA CCVM LTDA,ABERTURA CCVM LTDA,CANCELADA,,,50010240,BRASIL,PE,RECIFE,,,R DO IMP.D.PEDRO II 239/CJ.102,1989-12-31,5995252.29,329,1990-06-12,1986-07-08
3,44527444000155,CORRETORAS,ABN AMRO CORRETORA DE T-TULOS E VALORES MOBILI...,,EM FUNCIONAMENTO NORMAL,canal.comunicacao@br.abnamro.com,30737417.0,4551010,,SP,SÃO PAULO,VILA OLIMPIA,"11¦ ANDAR, CJ. 111","RUA FIDÛNCIO RAMOS, N¦ 302, TORRE B",2022-12-31,3729687.41,3794,2022-06-20,2022-06-20
4,33819590000138,CORRETORAS,AÇÃO S.A. CORRETORA DE VALORES E CÂMBIO,ACAO SA CVC,CANCELADA,,5095755.0,20040040,BRASIL,RJ,RIO DE JANEIRO,CENTRO,,"PRAÇA OLAVO BILAC, 28/ SL. 608",2000-12-31,291862.38,1112,2001-04-11,1968-04-19


In [9]:
df_corretoras.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 374 entries, 0 to 373
Data columns (total 19 columns):
 #   Column                    Non-Null Count  Dtype 
---  ------                    --------------  ----- 
 0   cnpj                      374 non-null    object
 1   type                      374 non-null    object
 2   nome_social               374 non-null    object
 3   nome_comercial            333 non-null    object
 4   status                    374 non-null    object
 5   email                     214 non-null    object
 6   telefone                  333 non-null    object
 7   cep                       373 non-null    object
 8   pais                      308 non-null    object
 9   uf                        373 non-null    object
 10  municipio                 373 non-null    object
 11  bairro                    271 non-null    object
 12  complemento               190 non-null    object
 13  logradouro                373 non-null    object
 14  data_patrimonio_liquido   

#### Segunda etapa - Tratamento das Bases

Descrição: Realizar o tratamento das bases coletadas via API do projeto final na aula 12.

Aspectos a incluir: Ajuste os nomes das colunas e linhas, Filtros de linhas e colunas, se necessário, Unstack e/ou stack, Tratamento do tipo das variáveis, Ajuste de missing, Tratamento de colunas string. 

Observações: Você pode criar novas tabelas, salvando as bases brutas e as bases tratadas, As bases finais precisam estar totalmente ajustadas (da melhor forma possível) e salvas no banco de dados.

2.1. Tratamento do DF Feriados e info do DF pós tratado:

In [10]:

df_feriados24_n = df_feriados24.rename(columns={'date': 'Data', 'name': 'Feriado Nacional'})
df_feriados24_n = df_feriados24_n.drop(columns=['type'])
df_feriados24_n['Data'] = pd.to_datetime(df_feriados24_n['Data'])
df_feriados24_n = df_feriados24_n.set_index('Feriado Nacional')
df_feriados24_n

Unnamed: 0_level_0,Data
Feriado Nacional,Unnamed: 1_level_1
Confraternização mundial,2024-01-01
Carnaval,2024-02-13
Sexta-feira Santa,2024-03-29
Páscoa,2024-03-31
Tiradentes,2024-04-21
Dia do trabalho,2024-05-01
Corpus Christi,2024-05-30
Independência do Brasil,2024-09-07
Nossa Senhora Aparecida,2024-10-12
Finados,2024-11-02


In [11]:
df_feriados24_n.info()

<class 'pandas.core.frame.DataFrame'>
Index: 12 entries, Confraternização mundial to Natal
Data columns (total 1 columns):
 #   Column  Non-Null Count  Dtype         
---  ------  --------------  -----         
 0   Data    12 non-null     datetime64[ns]
dtypes: datetime64[ns](1)
memory usage: 192.0+ bytes


2.2. Tratamento do DF Pix e info do DF pós tratado:

In [12]:
df_pix_n = df_pix.rename(columns={'nome': 'Razão Social', 'nome_reduzido': 'Nome', 'ispb': 'ISPB', 'modalidade_participacao': 'Modalidade',
                                  'tipo_participacao': 'Tipo', 'inicio_operacao': 'Inicio da Operação'})
df_pix_n['Inicio da Operação'] = df_pix_n['Inicio da Operação'].str.slice(start=0, stop=10)
df_pix_n['Inicio da Operação'] = pd.to_datetime(df_pix_n['Inicio da Operação'])
df_pix_n = df_pix_n.set_index('ISPB')
df_pix_n

Unnamed: 0_level_0,Razão Social,Nome,Modalidade,Tipo,Inicio da Operação
ISPB,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
00000000,BANCO DO BRASIL S.A.,BCO DO BRASIL S.A.,PDCT,DRCT,2020-11-03
00000208,BRB - BANCO DE BRASILIA S.A.,BRB - BCO DE BRASILIA S.A.,PDCT,DRCT,2020-11-03
00068987,COOPERATIVA DE CRÉDITO ARACREDI LTDA. - SICOOB...,CC ARACREDI LTDA.,PDCT,IDRT,2020-11-03
00075847,COOPERATIVA DE CRÉDITO UNICRED CENTRO-SUL LTDA...,CC UNICRED CENTRO-SUL LTDA - UNICRED CENTRO-SUL,PDCT,IDRT,2020-11-03
00106180,CENTRAL DAS COOPERATIVAS DE CRÉDITO DOS ESTADO...,"CCC DOS EST DE MT, MS E MUN DE CACOAL/RO",PDCT,IDRT,2020-11-03
...,...,...,...,...,...
95213211,"COOPERATIVA DE CRéDITO, POUPANçA E INVESTIMENT...",COOP SICREDI CAMINHO DAS ÁGUAS RS,PDCT,IDRT,2020-11-03
95424891,"COOPERATIVA DE CRÉDITO, POUPANÇA E INVESTIMENT...",COOP SICREDI VALE DO RIO PARDO,PDCT,IDRT,2020-11-03
95594941,"COOPERATIVA DE CRÉDITO, POUPANÇA E INVESTIMENT...",COOP SICREDI REG CENTRO RS/MG,PDCT,IDRT,2020-11-03
97259253,COOPERATIVA E ECONOMIA E CRÉDITO MÚTUO DOS MÉD...,CECM MÉDICOS PLANALTO MÉDIO RS - CREDISIS/CRED...,PDCT,IDRT,2021-10-04


In [13]:
df_pix_n.info()

<class 'pandas.core.frame.DataFrame'>
Index: 806 entries, 00000000 to 97489280
Data columns (total 5 columns):
 #   Column              Non-Null Count  Dtype         
---  ------              --------------  -----         
 0   Razão Social        806 non-null    object        
 1   Nome                806 non-null    object        
 2   Modalidade          806 non-null    object        
 3   Tipo                806 non-null    object        
 4   Inicio da Operação  806 non-null    datetime64[ns]
dtypes: datetime64[ns](1), object(4)
memory usage: 37.8+ KB


2.3. Tratamento do DF Corretoras e info do DF pós tratado:

In [14]:
df_corretoras_n = df_corretoras.rename(columns={'nome_social': 'Razão Social', 'nome_comercial': 'Nome Comercial', 'cnpj': 'CNPJ',
                                  'status': 'Status', 'email': 'E-Mail', 'telefone': 'Telefone', 'cep': 'CEP', 'pais': 'País', 'uf': 'UF',
                                  'municipio': 'Município', 'bairro': 'Bairro', 'logradouro': 'Endereço', 'complemento': 'Complemento',
                                  'valor_patrimonio_liquido': 'Valor PL', 'codigo_cvm': 'Cod. CVM', 'data_registro': 'Data Registro',
                                  'data_inicio_situacao': 'Data Mudança Status'})
df_corretoras_n = df_corretoras_n.drop(columns=['type', 'data_patrimonio_liquido'])
df_corretoras_n['Data Registro'] = pd.to_datetime(df_corretoras_n['Data Registro'])
df_corretoras_n['Data Mudança Status'] = pd.to_datetime(df_corretoras_n['Data Mudança Status'])
df_corretoras_n = df_corretoras_n.set_index('Cod. CVM')
ordem_das_colunas = ['CNPJ','Razão Social','Nome Comercial','Data Registro','Valor PL','Telefone','E-Mail','Endereço',
                     'Complemento','Bairro','Município','UF','País','CEP','Status','Data Mudança Status']
df_corretoras_n = df_corretoras_n[ordem_das_colunas]
df_corretoras_n[['Telefone', 'E-Mail','Nome Comercial']] = df_corretoras_n[['Telefone', 'E-Mail','Nome Comercial']].fillna('Não informado')
df_corretoras_n[['Endereço', 'Bairro', 'Município', 'UF', 'País', 'CEP', 'Complemento']] = df_corretoras_n[['Endereço', 'Bairro', 'Município', 'UF', 'País', 'CEP', 'Complemento']].fillna('-')
df_corretoras_n[['Valor PL']] = df_corretoras_n[['Valor PL']].fillna('0.00')
df_corretoras_n['Valor PL'] = pd.to_numeric(df_corretoras_n['Valor PL'])
df_corretoras_n.head()

Unnamed: 0_level_0,CNPJ,Razão Social,Nome Comercial,Data Registro,Valor PL,Telefone,E-Mail,Endereço,Complemento,Bairro,Município,UF,País,CEP,Status,Data Mudança Status
Cod. CVM,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1
2275,76621457000185,4UM DTVM S.A.,4UM INVESTIMENTOS,1968-01-15,4228660.18,33519966,controle@4um.com.br,R. VISCONDE DO RIO BRANCO 1488,4º ANDAR,CENTRO,CURITIBA,PR,BRASIL,80420210,CANCELADA,2006-10-05
3514,33817677000176,ABC BRASIL DISTRIBUIDORA DE TÍTULOS E VALORES ...,ABC BRASIL CORRETORA,2002-10-14,0.0,31702172,complianceregulatorio@abcbrasil.com.br,"AV. CIDADE JARDIM, 803",2º ANDAR,ITAIM BIBI,SÃO PAULO,SP,EGITO,1453000,CANCELADA,2002-10-14
329,10664027000132,ABERTURA CCVM LTDA,ABERTURA CCVM LTDA,1986-07-08,5995252.29,Não informado,Não informado,R DO IMP.D.PEDRO II 239/CJ.102,-,-,RECIFE,PE,BRASIL,50010240,CANCELADA,1990-06-12
3794,44527444000155,ABN AMRO CORRETORA DE T-TULOS E VALORES MOBILI...,Não informado,2022-06-20,3729687.41,30737417,canal.comunicacao@br.abnamro.com,"RUA FIDÛNCIO RAMOS, N¦ 302, TORRE B","11¦ ANDAR, CJ. 111",VILA OLIMPIA,SÃO PAULO,SP,-,4551010,EM FUNCIONAMENTO NORMAL,2022-06-20
1112,33819590000138,AÇÃO S.A. CORRETORA DE VALORES E CÂMBIO,ACAO SA CVC,1968-04-19,291862.38,5095755,Não informado,"PRAÇA OLAVO BILAC, 28/ SL. 608",-,CENTRO,RIO DE JANEIRO,RJ,BRASIL,20040040,CANCELADA,2001-04-11


In [15]:
df_corretoras_n.info()

<class 'pandas.core.frame.DataFrame'>
Index: 374 entries, 2275 to 3247
Data columns (total 16 columns):
 #   Column               Non-Null Count  Dtype         
---  ------               --------------  -----         
 0   CNPJ                 374 non-null    object        
 1   Razão Social         374 non-null    object        
 2   Nome Comercial       374 non-null    object        
 3   Data Registro        374 non-null    datetime64[ns]
 4   Valor PL             374 non-null    float64       
 5   Telefone             374 non-null    object        
 6   E-Mail               374 non-null    object        
 7   Endereço             374 non-null    object        
 8   Complemento          374 non-null    object        
 9   Bairro               374 non-null    object        
 10  Município            374 non-null    object        
 11  UF                   374 non-null    object        
 12  País                 374 non-null    object        
 13  CEP                  374 non-null   

2.4. Salvar os DF's como banco de dados

In [19]:
conn = sqlite3.connect('Banco_ProjetoCoder.bd')

In [23]:
df_feriados24_n.to_sql('df_feriados24_n', conn, if_exists='replace', index=True)
df_pix_n.to_sql('df_pix_n', conn, if_exists='replace', index=True)
df_corretoras_n.to_sql('df_corretoras_n', conn, if_exists='replace', index=True)

374

In [27]:
## Teste BD

query = 'SELECT * FROM df_feriados24_n'
squema = pd.read_sql_query(query, conn)
squema

Unnamed: 0,Feriado Nacional,Data
0,Confraternização mundial,2024-01-01 00:00:00
1,Carnaval,2024-02-13 00:00:00
2,Sexta-feira Santa,2024-03-29 00:00:00
3,Páscoa,2024-03-31 00:00:00
4,Tiradentes,2024-04-21 00:00:00
5,Dia do trabalho,2024-05-01 00:00:00
6,Corpus Christi,2024-05-30 00:00:00
7,Independência do Brasil,2024-09-07 00:00:00
8,Nossa Senhora Aparecida,2024-10-12 00:00:00
9,Finados,2024-11-02 00:00:00


In [None]:
conn.close()

#### Terceira Etapa - Criando README.md e Virtual Environment

Documentação: Adicionar e escrever um arquivo README.md documentando sobre o projeto.

Virtual Environment: Criar um virtual environment para execução do projeto final, Salvar o arquivo requirements.txt na pasta do projeto com as bibliotecas e suas versões utilizadas.

In [17]:
# No terminal do PowerShell: python -m venv PCoder
# No terminal do PowerShell: . PCoder\Scripts\Activate.ps1
# Instalado o pandas, numpy, plyer, requests e o updrade do pip no env PCoder
# Criado o arquivo "requirements.txt" com as versões dos pacotes instalados
# Criação do README.md