<img src="https://github.com/Databricks-BR/openfinance/blob/main/images/openfinance_head.png?raw=true">

### Version Code Control

| versão | data | autor | e-mail | alterações |
| --- | --- | --- | --- | --- |
| 1.0 | 10-ago-2023 | Luis Assunção | luis.assuncao@databricks.com | Primeira versão |

### Description

| projeto | aplicação | módulo | objetivo |
| --- | --- | --- | --- | 
| Open Finance Lakehouse | Finance | Ingestão | Ingestão arquivo CSV |

In [0]:
%sql

-- Criacao do catalogo 
CREATE CATALOG IF NOT EXISTS openfinance COMMENT 'Open Finance Lakehouse';;

use catalog openfinance;

-- Criacao dos Databases

CREATE SCHEMA IF NOT EXISTS internal_data COMMENT 'Dados internos da Instituição';

CREATE SCHEMA IF NOT EXISTS external_data COMMENT 'Dados externos e dados compartilhados por consentimento de outras Instituição';

CREATE SCHEMA IF NOT EXISTS data_science COMMENT 'Resultados de Modelos de Machine Learning, recomendações e dados analisados';



In [0]:
%python
import pandas as pd
from pyspark.sql import SparkSession

url = f"https://raw.githubusercontent.com//Databricks-BR/openfinance/main/dados/"

catalog_name = f"openfinance"
schema_name =  f"external_data"
prefix_table = f"gold"



In [0]:
%python

entity_name  = f"fundos_previdencia"

table_name   = f"{catalog_name}.{schema_name}.{prefix_table}_{entity_name}"
file_name = f"{url}{entity_name}.csv"

df = pd.read_csv(file_name)                          # leitura arquivo CSV utilizando Dataframe Pandas
s_df = spark.createDataFrame(df)                     # converte Dataframe Pandas em Spark Dataframe
s_df.write.mode("overwrite").saveAsTable(table_name) # grava o DataFrame na Tabela Delta

In [0]:
%sql

use catalog openfinance;
use external_data;

ALTER TABLE gold_fundos_previdencia ALTER COLUMN cnpj_fundo COMMENT 'numero do CNPJ do fundo';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN sigla_instituicao COMMENT 'sigla da instituicao financeira';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN nome_abreviado COMMENT 'nome abreviado do ativo';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN nome_ativo COMMENT 'nome do ativo';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN nome_gestor COMMENT 'nome do gestor do fundo';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN classificacao_cvm COMMENT 'classificação do fundo pela CVM';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN perfil_fundo COMMENT 'perfil do fundo (conservador, agressivo)';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN tipo_fundo COMMENT 'tipo do fundo';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN taxa_adm COMMENT 'taxa de administração';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN taxa_performance COMMENT 'taxa de performance';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN qde_meses_positivo COMMENT 'qde de meses com rentabilidade positiva';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN perc_meses_positivos COMMENT 'percentual de meses no ano com rentabilidade positiva';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN qde_meses_negativo COMMENT 'qde de meses com rentabilidade negativa';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN perc_meses_negativo COMMENT 'percentual de meses no ano com rentabilidade negativa';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN perc_meses_acima_cdi COMMENT 'percentual de meses no ano com rentabilidade a cima do CDI';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN qde_meses_acima_cdi COMMENT 'quantidade de meses no ano com rentabilidade a cima do CDI';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN qde_meses_abaixo_cdi COMMENT 'percentual de meses no ano com rentabilidade abaixo do CDI';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN perc_meses_abaixo_cdi COMMENT 'quantidade de meses no ano com rentabilidade abaixo do CDI';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN val_pl_atual COMMENT 'valor do patrimonio liquido atual do fundo';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN qde_cotistas COMMENT 'quantidade de cotistas do fundo';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN maior_retorno_mensal COMMENT 'maior taxa de retorno mensal';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN menor_retorno_mensal COMMENT 'menor  taxa de retorno mensal';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN rentabilidade_no_mes COMMENT 'rentabilidade acumulada no mês';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN rentabilidade_no_ano COMMENT 'rentabilidade acumulada no ano';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN rentabilidade_6_meses COMMENT 'rentabilidade acumulada em 6 meses';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN rentabilidade_12_meses COMMENT 'rentabilidade acumulada em 12 meses';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN rentabilidade_24_meses COMMENT 'rentabilidade acumulada em 24 meses';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN rentabilidade_36_meses COMMENT 'rentabilidade acumulada em 36 meses';
ALTER TABLE gold_fundos_previdencia ALTER COLUMN rentabilidade_48_meses COMMENT 'rentabilidade acumulada em 48 meses';

