**A /confidencial/ é um dos maiores Multifamily Offices do país, especializada na distribuição do portfólio de seus clientes entre diferentes ativos Onshore e Offshore.**

Neste teste, fornecido via e-mail junto com o dataset nomeado `Dataset_Teste_Python`, você deverá analisar os dados disponibilizados e responder às perguntas que se seguem.

Este dataset detalha o patrimônio no Brasil e no exterior, por integrante de família, com atualizações diárias ao longo do ano de 2023. Além disso, fornece informações detalhadas sobre as estratégias de alocação. As estratégias Onshore são identificadas pelo sufixo (ON) nas colunas, enquanto as estratégias Offshore apresentam o sufixo (OFF). Todos os valores estão expressos em reais (R$).

Todas as estratégias são monitoradas por um sistema proprietário da /confidencial/, que acompanha a evolução das alocações para assegurar sua conformidade com os relatórios e extratos enviados pelos bancos custodiantes. As colunas intituladas Financeiro Banco seguidas pelo nome da estratégia indicam o patrimônio reportado pelo banco custodiante para a estratégia específica na data correspondente.

Este teste pode ser realizado utilizando principalmente as bibliotecas `pandas` e `numpy`. Contudo, fique à vontade para empregar quaisquer outras bibliotecas que julgar necessárias.

In [None]:
import pandas as pd
import numpy as np

**Questão 1**: Importação do Dataset

Importe o dataset `Dataset_Teste_Python` para este notebook. Utilize as bibliotecas necessárias para a leitura do arquivo. Lembre-se de que, neste caso, não é necessário se preocupar com o caminho específico do arquivo no seu computador; a avaliação se concentrará na abordagem adotada para a importação.

In [None]:
# Insira seu código aqui para importar o dataset
import chardet
path = '/content/Dataset_Teste_Python(in).csv'
# Aqui eu to basicamente descobrindo qual é o encoding para ler corretamente o arquivo
with open(path, 'rb') as arquivocsv:
    resultadoEncd = chardet.detect(arquivocsv.read(10000))
# Agora eu uso o resultado no encoding, nesse caso acabou sendo o padrão latin1
data = pd.read_csv(path, encoding=resultadoEncd['encoding'])

**Questão 2.1:** Visualização do Dataset

Exiba as 10 primeiras e as 10 últimas linhas do dataset para entender a estrutura dos dados.

In [None]:
# Insira seu código aqui para as 10 primeiras linhas
data.head(10)
# Insira seu código aqui para as 10 últimas linhas
data.tail(10)

# Mas no Jupyter ou no Colab pode ter um problema onde só a última tabela é exibida, resolvo isso com o seguinte código
dezprimeiras = data.head(10)
dezultimas = data.tail(10)
dezprimplusdezult = pd.concat([dezprimeiras, dezultimas])
dezprimplusdezult

**Questão 2.2:** Visualização do Dataset

Mostre quantas linhas e quantas colunas tem no dataset.

In [None]:
# Insira seu código aqui para mostrar as dimensões do dataset
data.shape

**Questão 3**: Criação das Colunas de Conciliação.

Para cada par de colunas correspondente a uma estratégia e seu respectivo valor no financeiro do banco, crie uma nova coluna para conciliação. Esta coluna deve ser nomeada como 'Conciliação + Nome da Estratégia', e inicialmente estará vazia, pronta para receber os resultados de uma eventual conciliação.

Por exemplo, para a estratégia 'Renda Fixa (ON)', a nova coluna deve ser chamada 'Conciliação Renda Fixa (ON)'.

In [None]:
# Insira seu código aqui para adicionar as colunas de conciliação ao dataset
colunas = data.columns[3::2]

for estrategia in colunas:
    conciliacao = 'Conciliação ' + estrategia
    data.insert(data.columns.get_loc(estrategia) + 1, conciliacao, None)


**Questão 4**: Realização da Conciliação.

A conciliação financeira é um processo crítico para assegurar a precisão entre os valores registrados internamente e aqueles reportados pelos bancos custodiantes. Este processo envolve comparar o patrimônio registrado no sistema da Turim com os valores fornecidos pelos bancos para cada estratégia de investimento. O objetivo é identificar e quantificar quaisquer discrepâncias entre estes valores.

Para cada estratégia de investimento, você deverá calcular a diferença entre o valor financeiro registrado no sistema da /confidencial/ ('Nome da Estratégia') e o valor correspondente informado pelo banco ('Financeiro Banco Nome da Estratégia'). Essa diferença deve ser registrada nas novas colunas de conciliação criadas anteriormente ('Conciliação Nome da Estratégia').

In [None]:
# Insira seu código aqui para realizar a conciliação dos valores financeiros
colunas = data.columns[4::3]

for conciliacao in colunas:
    estrategia = data.columns.get_loc(conciliacao) - 1
    financeiro = data.columns.get_loc(conciliacao) + 1
    data[conciliacao] = data.iloc[:, estrategia] - data.iloc[:, financeiro]


**Questão 5**: Exiba as linhas com diferenças.

Após concluir o processo de conciliação, é importante focar naquelas divergências que excedem um limiar específico, indicando possíveis inconsistências significativas entre os registros internos e as informações fornecidas pelos bancos custodiantes.

Para esta etapa, filtre e exiba todas as linhas do dataset em que a conciliação de qualquer estratégia de investimento apresente uma divergência, em módulo, superior a R$10,00.

In [None]:
# Insira seu código aqui para filtrar e exibir as linhas com divergências significativas
linhas_divergentes = data[(data[colunas].abs() > 10).any(axis=1)]
linhas_divergentes

Unnamed: 0,Data,ID Família,Nome Integrante,Renda Fixa (ON),Conciliação Renda Fixa (ON),Financeiro Banco Renda Fixa (ON),Ações (ON),Conciliação Ações (ON),Financeiro Banco Ações (ON),FII (ON),...,Financeiro Banco Fixed Income (OFF),Equity (OFF),Conciliação Equity (OFF),Financeiro Banco Equity (OFF),Inflation-Linked (OFF),Conciliação Inflation-Linked (OFF),Financeiro Banco Inflation-Linked (OFF),Alternatives (OFF),Conciliação Alternatives (OFF),Financeiro Banco Alternatives (OFF)
19,2023-01-20,1,Cathy,3769657.78,2864.661724,3.766793e+06,9536424.92,-927.331256,9.537352e+06,7334392.46,...,1.572096e+06,1576381.92,1799.173561,1.574583e+06,598488.46,947.652286,5.975408e+05,8669034.32,307.361940,8.668727e+06
36,2023-02-06,1,Cathy,3748365.04,-2805.036461,3.751170e+06,9529575.15,-724.897666,9.530300e+06,7333107.43,...,1.575151e+06,1576039.62,1637.920885,1.574402e+06,599072.93,-1057.037681,6.001300e+05,8669399.09,2792.861800,8.666606e+06
63,2023-03-05,1,Cathy,3747029.87,-59.380454,3.747089e+06,9514255.37,-1978.075340,9.516233e+06,7312668.30,...,1.574596e+06,1574573.56,-2239.426403,1.576813e+06,600311.60,2014.770214,5.982968e+05,8661787.86,2087.353143,8.659701e+06
80,2023-03-22,1,Cathy,3748815.31,1767.729207,3.747048e+06,9501124.60,-1768.369338,9.502893e+06,7310642.83,...,1.578071e+06,1574418.48,2311.079275,1.572107e+06,600974.73,1758.017910,5.992167e+05,8662140.55,-1293.739362,8.663434e+06
99,2023-04-10,1,Cathy,3752888.07,639.684855,3.752248e+06,9535617.96,1788.617433,9.533829e+06,7330081.44,...,1.575913e+06,1573367.06,2071.789508,1.571295e+06,600670.39,-1765.180275,6.024356e+05,8653577.35,266.006178,8.653311e+06
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
10124,2023-09-27,10,Carol,5281888.56,904.813906,5.280984e+06,4235028.45,-2940.101579,4.237969e+06,2195047.99,...,8.625597e+06,8845495.66,1552.080894,8.843944e+06,5462388.82,-1601.610146,5.463990e+06,3706194.41,-2256.153436,3.708451e+06
10129,2023-10-02,10,Carol,5279822.71,-2209.066738,5.282032e+06,4239549.79,385.888705,4.239164e+06,2198132.61,...,8.616568e+06,8825200.83,718.168186,8.824483e+06,5471864.19,-175.198396,5.472039e+06,3702490.00,-760.964484,3.703251e+06
10186,2023-11-28,10,Carol,5285413.89,-1213.214154,5.286627e+06,4231247.01,2578.039808,4.228669e+06,2191737.85,...,8.613849e+06,8820022.02,1557.866149,8.818464e+06,5477673.93,-915.174603,5.478589e+06,3692089.91,-2125.005604,3.694215e+06
10190,2023-12-02,10,Carol,5278314.54,2545.936719,5.275769e+06,4236730.79,445.717710,4.236285e+06,2190876.23,...,8.619705e+06,8839918.32,-1047.608776,8.840966e+06,5472537.62,1782.864551,5.470755e+06,3702352.69,2302.160356,3.700051e+06


**Questão 6**: Tratamento das divergências.

Quando divergências significativas são identificadas, é essencial aplicar correções para garantir a integridade e precisão dos dados financeiros registrados. Nesta etapa, você deverá atualizar o valor patrimonial na coluna de estratégia para cada caso onde a divergência excedeu o limiar estabelecido, utilizando como referência o valor informado pelo banco custodiante.

Para isso, substitua o valor na coluna de estratégia pelo valor correspondente na coluna de "Financeiro Banco" para todas as divergências superiores a R$10,00. Este procedimento visa alinhar os registros internos com as informações oficiais fornecidas pelos bancos, assegurando uma base de dados consistente e confiável.

In [None]:
# Insira seu código aqui para realizar o tratamento das divergências
for conciliacao in colunas:
    financeiro = data.columns.get_loc(conciliacao) + 1
    estrategia = data.columns.get_loc(conciliacao) - 1
    filtro = data[conciliacao].abs() > 10
    data.loc[filtro, data.columns[estrategia]] = data.loc[filtro, data.columns[financeiro]]


**Questão 7**: Verificação de divergências após correção.

Após realizar o tratamento das divergências conforme instruído na questão anterior, é fundamental conferir se o processo de correção foi efetivamente bem-sucedido. Portanto, nesta etapa, você deve realizar novamente a busca por divergências superiores a R$10,00 entre as colunas de estratégia e as respectivas colunas de "Financeiro Banco". Se a correção foi realizada corretamente, esta nova verificação não deverá exibir nenhuma linha, indicando que todas as divergências significativas foram devidamente ajustadas.

In [None]:
# Insira seu código aqui para verificar se ainda existem divergências superiores a R$10,00 após a correção
divergencias = []

for conciliacao in colunas:
    financeiro = data.columns.get_loc(conciliacao) + 1
    estrategia = data.columns.get_loc(conciliacao) - 1
    filtro = (data[data.columns[estrategia]] - data[data.columns[financeiro]]).abs() > 10
    divergencias.append(data[filtro])

divergencias_df = pd.concat(divergencias)
divergencias_df

Unnamed: 0,Data,ID Família,Nome Integrante,Renda Fixa (ON),Conciliação Renda Fixa (ON),Financeiro Banco Renda Fixa (ON),Ações (ON),Conciliação Ações (ON),Financeiro Banco Ações (ON),FII (ON),...,Financeiro Banco Fixed Income (OFF),Equity (OFF),Conciliação Equity (OFF),Financeiro Banco Equity (OFF),Inflation-Linked (OFF),Conciliação Inflation-Linked (OFF),Financeiro Banco Inflation-Linked (OFF),Alternatives (OFF),Conciliação Alternatives (OFF),Financeiro Banco Alternatives (OFF)


**Questão 8**: Montagem do Extrato do Cliente

Para montar o extrato dos clientes, utilizaremos os dados financeiros contidos nas colunas de estratégia, focando especificamente nos valores registrados no último dia de cada mês do ano de referência. O objetivo é consolidar uma visão clara do patrimônio do cliente, estratégia por estratégia, ao final de cada período mensal.

Monte uma tabela que contenha apenas os dados financeiros de cada cliente no último dia de cada mês. (Não utilize as colunas de Financeiro Banco)

In [None]:
# Insira seu código aqui para montar o extrato do cliente
data['Data'] = pd.to_datetime(data['Data'])
extrato = data[data['Data'].dt.is_month_end]

**Questão 9**: Tabela Resumo

Para finalizar, construiremos uma tabela resumo que consolida o financeiro por família, agregando os valores por estratégia de cada cliente pertencente a uma mesma família. Adicionalmente, incluiremos duas colunas: uma para o patrimônio total onshore (soma de todas as estratégias onshore por família) e outra para o patrimônio total offshore (soma de todas as estratégias offshore por família).

In [None]:
# Insira seu código aqui para montar a tabela resumo
# Dicas:
# 1. Utilize a tabela obtida na questão anterior como base.
# 2. O resultado será uma tabela resumo com o financeiro consolidado por família, incluindo as colunas de patrimônio total onshore e offshore.

tabelaUltimoExtrato = extrato[extrato['Data'].dt.is_year_end].copy()
colunas_relevantes = tabelaUltimoExtrato.loc[:, ~tabelaUltimoExtrato.columns.str.contains('Financeiro|Conciliação')]

resumoPCliente = tabelaUltimoExtrato[colunas_relevantes.columns].copy()

resumoPCliente['Total_ON'] = resumoPCliente.filter(regex='ON').sum(axis=1)
resumoPCliente['Total_OFF'] = resumoPCliente.filter(regex='OFF').sum(axis=1)
resumoFinal = resumoPCliente.groupby('ID Família').sum(numeric_only=True).reset_index()

resumoFinal



# Pessoal
Achei um desafio muito interessante que me fez voltar lá pras minhas bases no segundo período da faculdade onde tive contato pela primeira vez com Python. A necessidade de criar filtros, agregações e manipular o dataset me deixou empolgado e curioso pra saber como é a rotina em uma empresa como a /confidencial/. Espero que os códigos tenham satisfeito o requisitado e adianto que estou muito empolgado para continuar aprendendo com situações reais como essa.