# Análise de Dados Abertos


In [130]:
import numpy as np
import pandas as pd
from babel.numbers import format_compact_currency
import matplotlib.pyplot as plt
import locale
import tabulate

locale.setlocale(locale.LC_ALL, "pt_BR")
plt.style.use("grayscale")
excelsheet = "../data/criptoativos_dados_abertos_07082023.xls"

# Carrega a planilha excel
with pd.ExcelFile(excelsheet) as xls:
    df1 = pd.read_excel(
        xls,
        "Relatorio1",
        skiprows=9,
        decimal=",",
        parse_dates=[0],
        date_format="%B de %Y",
        usecols=[0, 3, 6, 7, 8],
    )
    df2 = pd.read_excel(
        xls,
        "Relatorio2",
        skiprows=5,
        parse_dates=[0],
        date_format="%B de %Y",
        decimal=".",
    )
    df3 = pd.read_excel(
        xls,
        "Relatório3",
        skiprows=5,
        parse_dates=[0],
        date_format="%B de %Y",
        header=[0, 1],
    )
    df4 = pd.read_excel(
        xls,
        "Relatorio4",
        skiprows=13,
        decimal=",",
        parse_dates=[1],
        date_format="%B de %Y",
    )


# Utilitários
def format_cols(data):
    for i in data.columns:
        if data[i].dtype == np.float64:
            data[i] = data[i].apply(
                lambda x: format_compact_currency(
                    x, currency="BRL", locale="pt_BR", fraction_digits=2
                )
            )

## Total de Valores Declarados por Ano


In [131]:
# Renderiza Relatório1
df1 = df1.rename(
    columns={
        "Unnamed: 0": "Ano",
        "Subtotal": "Exchanges no Exterior",
        "Subtotal.1": "Sem Exchanges",
        "Somente PJ": "Exchanges",
        "Unnamed: 8": "Total",
    }
)

df1_new = df1.groupby(pd.Grouper(key=df1.columns[0], freq="Y")).sum()
format_cols(df1_new)
df1_new

Unnamed: 0_level_0,Exchanges no Exterior,Sem Exchanges,Exchanges,Total
Ano,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2019-12-31,"R$ 6,51 mil","R$ 7,12 mil","R$ 14,25 mil","R$ 27,89 mil"
2020-12-31,"R$ 27,73 mil","R$ 14,96 mil","R$ 49,38 mil","R$ 92,07 mil"
2021-12-31,"R$ 21,43 mil","R$ 33,2 mil","R$ 152,03 mil","R$ 206,65 mil"
2022-12-31,"R$ 14,64 mil","R$ 29,01 mil","R$ 123,04 mil","R$ 166,69 mil"
2023-12-31,"R$ 12,03 mil","R$ 14,71 mil","R$ 83,87 mil","R$ 110,6 mil"


## Quantidade de CPF/CNPJ Únicos


In [132]:
# Renderiza Relatório2
df2_new = df2.groupby(pd.Grouper(key=df2.columns[0], freq="Y")).sum()
df2_new

Unnamed: 0_level_0,CNPJ,CPF
MÊS/ANO,Unnamed: 1_level_1,Unnamed: 2_level_1
2019-12-31,12121,680054
2020-12-31,37611,1500287
2021-12-31,78290,6030838
2022-12-31,406008,11868506
2023-12-31,409524,11432616


## Número de Operações, por gênero


In [133]:
# Renderiza Relatório3, parte 1
df3.head()

Unnamed: 0_level_0,Período,% Nº Operações,% Nº Operações,% Valor Operações,% Valor Operações
Unnamed: 0_level_1,Unnamed: 0_level_1,Feminino,Masculino,Feminino,Masculino
0,2019-08-01,11.233751,88.766249,17.890321,82.109679
1,2019-09-01,9.873888,90.126112,10.459351,89.540649
2,2019-10-01,11.209669,88.790331,8.230889,91.769111
3,2019-11-01,10.445219,89.554781,14.204341,85.795659
4,2019-12-01,10.927001,89.072999,11.719094,88.280906


## Valor das Operações, por gênero


In [134]:
# Renderiza Relatório 3, parte 2

## Criptoativos Declarados


In [162]:
# Renderiza Relatório 4
# https://stackoverflow.com/questions/39922986/how-do-i-pandas-group-by-to-get-sum
# df4.info()
# df4_new = df4.groupby(["CRIPTOATIVO", 'MÊS/ANO'])['VALOR TOTAL DAS OPERAÇÕES'].sum()
df4_new = df4.groupby(['MÊS/ANO','VALOR TOTAL DAS OPERAÇÕES'])["CRIPTOATIVO"].sum()
df4_new.head()

MÊS/ANO     VALOR TOTAL DAS OPERAÇÕES
2023-06-01  9.535897e+08                 USDC
            1.013031e+09                  BTC
            1.488496e+10                 USDT
2023-07-01  4.132042e+04                  BTC
            9.610571e+05                 USDT
Name: CRIPTOATIVO, dtype: object