# Introducao

Neste projeto, vamos construir um pipeline de dados utilizando a plataforma Databricks para coletar, transformar e analisar dados financeiros históricos de empresas do índice IBXX. Usaremos uma API para obter os dados necessários, focando em indicadores financeiros e desempenho das ações ao longo do tempo.

#### Objetivo

Nosso objetivo é desenvolver um pipeline robusto que permita entender e analisar a saúde financeira e o desempenho de ações das empresas do IBXX. As principais perguntas que pretendemos responder incluem:

1. **Como os indicadores financeiros evoluíram ao longo do tempo?**
2. **Quais indicadores têm maior influência no preço das ações?**
3. **Quais empresas apresentam maior estabilidade financeira?**
4. **Como a dívida impacta o desempenho das empresas?**
5. **Quais empresas utilizam seus ativos de forma mais eficiente?**


## Busca e coleta de dados

In [0]:
import os
import requests
from dotenv import load_dotenv
import time
from pyspark.sql import SparkSession
from pyspark.sql import Row
from pyspark.sql.functions import col, count, when
from tqdm import tqdm

load_dotenv()

api_token = os.getenv('Token')

spark = SparkSession.builder.appName("API Data Collector").getOrCreate()

In [0]:
# Função para obter a lista de empresas com base nos tickers
def get_companies(tickers):
    url = "https://api.dadosdemercado.com.br/v1/companies"
    headers = {
        "Authorization": f"Bearer {api_token}"
    }
    
    response = requests.get(url, headers=headers)
    
    if response.status_code == 200:
        companies = response.json()
        return [company for company in companies if company['b3_issuer_code'] in tickers]
    else:
        print(f"Erro ao acessar a API: {response.status_code}")
        return None


In [0]:
# Função para coletar indicadores de mercado
def get_market_ratios(cvm_code, statement_type, period_init, period_end):
    url = f"https://api.dadosdemercado.com.br/v1/companies/{cvm_code}/market_ratios"
    headers = {
        "Authorization": f"Bearer {api_token}"
    }
    params = {
        "statement_type": statement_type,
        "period_init": period_init,
        "period_end": period_end
    }
    
    response = requests.get(url, headers=headers, params=params)
    
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Erro ao acessar a API: {response.status_code}")
        return None


In [0]:
# Função para coletar indicadores financeiros
def get_ratios(cvm_code, statement_type, period_type, period_init, period_end):
    url = f"https://api.dadosdemercado.com.br/v1/companies/{cvm_code}/ratios"
    headers = {
        "Authorization": f"Bearer {api_token}"
    }
    params = {
        "statement_type": statement_type,
        "period_type": period_type,
        "period_init": period_init,
        "period_end": period_end
    }
    
    response = requests.get(url, headers=headers, params=params)
    
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Erro ao acessar a API: {response.status_code}")
        return None


In [0]:
statement_type = "con"  # Tipo de resultado
period_init = "2003-01-01"  # Data de início dos indicadores
period_end = "2023-12-31"  # Data de fim dos indicadores

#Lista das empresas do IBXX
tickers = [
    "ABEV", "ALOS", "ALPA", "ARZZ", "ASAI", "AZUL",
    "BBAS", "BBDC", "BBSE", "BEEF", "B3SA", "BPAC",
    "BRAP", "BRFS", "BRKM", "CCRO", "CIEL", "CMIG",
    "CMIN", "COGN", "CPFE", "CPLE", "CRFB", "CSAN",
    "CSMG", "CSNA", "CVCB", "CYRE", "ELET", "EMBR",
    "ECOR", "ENEV", "ENGI", "EQTL", "EZTC", "FLRY",
    "GMAT", "GOAU", "GGBR", "HAPV", "HYPE", "IGTI",
    "IRBR", "ITSA", "ITUB", "JBSS", "KLBN", "LREN",
    "LWSA", "MDIA", "MGLU", "MOVI", "MRFG", "MRVE",
    "MULT", "NTCO", "POMO", "PCAR", "PETR", "PETZ",
    "PSSA", "PRIO", "RADL", "RAIZ", "RAIL", "RDOR",
    "RECV", "RENT", "RRRP", "SANB", "SBSP", "SMFT",
    "SMTO", "SOMA", "STBP", "SUZB", "TAEE", "TEND",
    "TIMS", "TOTS", "TRPL", "UGPA", "USIM", "VALE",
    "VAMO", "VBBR", "VIVA", "VIVT", "WEGE", "YDUQ",
]

companies = get_companies(tickers)
time.sleep(2)

all_market_ratios = []
all_financial_ratios = []

#Percorre a lista das emrpresas, baixa os indicadores e grava em uma tabela
if companies:
    for company in tqdm(companies, desc="Processando Empresas", unit="empresa"):
        cvm_code = company['cvm_code']
        ticker = company['b3_issuer_code']

        print(f"Acessando empresa com Ticker: {ticker}")

        market_ratios = get_market_ratios(cvm_code, statement_type, period_init, period_end)
        time.sleep(2)
        financial_ratios = get_ratios(cvm_code, statement_type, "ttm", period_init, period_end)
        time.sleep(2)
        
        if market_ratios:
            for ratio in market_ratios:
                all_market_ratios.append(Row(company=company['b3_issuer_code'], **ratio))
        
        if financial_ratios:
            for ratio in financial_ratios:
                all_financial_ratios.append(Row(company=company['b3_issuer_code'], **ratio))
        
    


Processando Empresas:   0%|          | 0/91 [00:00<?, ?empresa/s]

Acessando empresa com Ticker: BBDC
Erro ao acessar a API: 400


Processando Empresas:   1%|          | 1/91 [00:05<07:46,  5.18s/empresa]

Acessando empresa com Ticker: BBAS
Erro ao acessar a API: 400


Processando Empresas:   2%|▏         | 2/91 [00:09<07:21,  4.97s/empresa]

Acessando empresa com Ticker: ELET


Processando Empresas:   3%|▎         | 3/91 [00:17<08:57,  6.11s/empresa]

Acessando empresa com Ticker: CMIG


Processando Empresas:   4%|▍         | 4/91 [00:24<09:31,  6.57s/empresa]

Acessando empresa com Ticker: GGBR


Processando Empresas:   5%|▌         | 5/91 [00:31<09:42,  6.77s/empresa]

Acessando empresa com Ticker: CSNA


Processando Empresas:   7%|▋         | 6/91 [00:37<09:05,  6.42s/empresa]

Acessando empresa com Ticker: VALE


Processando Empresas:   8%|▊         | 7/91 [00:43<08:38,  6.17s/empresa]

Acessando empresa com Ticker: BRKM


Processando Empresas:   9%|▉         | 8/91 [00:50<08:49,  6.38s/empresa]

Acessando empresa com Ticker: RADL
Erro ao acessar a API: 400


Processando Empresas:  10%|▉         | 9/91 [00:54<08:04,  5.91s/empresa]

Acessando empresa com Ticker: WEGE


Processando Empresas:  11%|█         | 10/91 [01:01<08:07,  6.02s/empresa]

Acessando empresa com Ticker: ITSA


Processando Empresas:  12%|█▏        | 11/91 [01:07<08:19,  6.24s/empresa]

Acessando empresa com Ticker: LREN


Processando Empresas:  13%|█▎        | 12/91 [01:13<07:59,  6.07s/empresa]

Acessando empresa com Ticker: POMO


Processando Empresas:  14%|█▍        | 13/91 [01:21<08:25,  6.49s/empresa]

Acessando empresa com Ticker: GOAU


Processando Empresas:  15%|█▌        | 14/91 [01:28<08:36,  6.71s/empresa]

Acessando empresa com Ticker: IGTI


Processando Empresas:  16%|█▋        | 15/91 [01:33<08:05,  6.38s/empresa]

Acessando empresa com Ticker: PETR


Processando Empresas:  18%|█▊        | 16/91 [01:40<08:07,  6.50s/empresa]

Acessando empresa com Ticker: ALPA


Processando Empresas:  19%|█▊        | 17/91 [01:47<08:17,  6.73s/empresa]

Acessando empresa com Ticker: KLBN


Processando Empresas:  20%|█▉        | 18/91 [01:56<08:41,  7.15s/empresa]

Acessando empresa com Ticker: SUZB


Processando Empresas:  21%|██        | 19/91 [02:01<07:56,  6.62s/empresa]

Acessando empresa com Ticker: CPLE


Processando Empresas:  22%|██▏       | 20/91 [02:10<08:37,  7.29s/empresa]

Acessando empresa com Ticker: USIM


Processando Empresas:  23%|██▎       | 21/91 [02:18<08:43,  7.47s/empresa]

Acessando empresa com Ticker: SBSP
Erro ao acessar a API: 400


Processando Empresas:  24%|██▍       | 22/91 [02:23<07:40,  6.68s/empresa]

Acessando empresa com Ticker: CYRE


Processando Empresas:  25%|██▌       | 23/91 [02:28<07:11,  6.35s/empresa]

Acessando empresa com Ticker: PCAR


Processando Empresas:  26%|██▋       | 24/91 [02:33<06:44,  6.04s/empresa]

Acessando empresa com Ticker: ENGI


Processando Empresas:  27%|██▋       | 25/91 [02:42<07:18,  6.65s/empresa]

Acessando empresa com Ticker: BRFS


Processando Empresas:  29%|██▊       | 26/91 [02:47<06:55,  6.39s/empresa]

Acessando empresa com Ticker: PSSA


Processando Empresas:  30%|██▉       | 27/91 [02:53<06:36,  6.19s/empresa]

Acessando empresa com Ticker: RAIL


Processando Empresas:  31%|███       | 28/91 [02:58<06:12,  5.91s/empresa]

Acessando empresa com Ticker: VIVT


Processando Empresas:  32%|███▏      | 29/91 [03:04<06:00,  5.81s/empresa]

Acessando empresa com Ticker: STBP


Processando Empresas:  33%|███▎      | 30/91 [03:10<05:56,  5.85s/empresa]

Acessando empresa com Ticker: COGN


Processando Empresas:  34%|███▍      | 31/91 [03:15<05:40,  5.68s/empresa]

Acessando empresa com Ticker: TRPL


Processando Empresas:  35%|███▌      | 32/91 [03:22<05:49,  5.92s/empresa]

Acessando empresa com Ticker: UGPA


Processando Empresas:  36%|███▋      | 33/91 [03:27<05:39,  5.86s/empresa]

Acessando empresa com Ticker: CPFE


Processando Empresas:  37%|███▋      | 34/91 [03:33<05:28,  5.77s/empresa]

Acessando empresa com Ticker: BRAP


Processando Empresas:  38%|███▊      | 35/91 [03:40<05:46,  6.19s/empresa]

Acessando empresa com Ticker: CCRO


Processando Empresas:  40%|███▉      | 36/91 [03:46<05:31,  6.03s/empresa]

Acessando empresa com Ticker: ITUB
Erro ao acessar a API: 400


Processando Empresas:  41%|████      | 37/91 [03:51<05:16,  5.86s/empresa]

Acessando empresa com Ticker: CSMG


Processando Empresas:  42%|████▏     | 38/91 [03:57<05:07,  5.80s/empresa]

Acessando empresa com Ticker: ECOR


Processando Empresas:  43%|████▎     | 39/91 [04:03<05:01,  5.81s/empresa]

Acessando empresa com Ticker: RENT


Processando Empresas:  44%|████▍     | 40/91 [04:08<04:50,  5.69s/empresa]

Acessando empresa com Ticker: CSAN


Processando Empresas:  45%|████▌     | 41/91 [04:14<04:46,  5.73s/empresa]

Acessando empresa com Ticker: TOTS


Processando Empresas:  46%|████▌     | 42/91 [04:20<04:40,  5.72s/empresa]

Acessando empresa com Ticker: EQTL


Processando Empresas:  47%|████▋     | 43/91 [04:25<04:35,  5.74s/empresa]

Acessando empresa com Ticker: EMBR


Processando Empresas:  48%|████▊     | 44/91 [04:31<04:29,  5.73s/empresa]

Acessando empresa com Ticker: TAEE


Processando Empresas:  49%|████▉     | 45/91 [04:38<04:42,  6.13s/empresa]

Acessando empresa com Ticker: MDIA


Processando Empresas:  51%|█████     | 46/91 [04:44<04:29,  5.98s/empresa]

Acessando empresa com Ticker: IGTI


Processando Empresas:  52%|█████▏    | 47/91 [04:50<04:24,  6.01s/empresa]

Acessando empresa com Ticker: SMTO


Processando Empresas:  53%|█████▎    | 48/91 [04:55<04:10,  5.83s/empresa]

Acessando empresa com Ticker: SANB


Processando Empresas:  54%|█████▍    | 49/91 [05:04<04:39,  6.64s/empresa]

Acessando empresa com Ticker: JBSS


Processando Empresas:  55%|█████▍    | 50/91 [05:09<04:19,  6.32s/empresa]

Acessando empresa com Ticker: EZTC


Processando Empresas:  56%|█████▌    | 51/91 [05:15<04:02,  6.05s/empresa]

Acessando empresa com Ticker: MRFG


Processando Empresas:  57%|█████▋    | 52/91 [05:20<03:47,  5.84s/empresa]

Acessando empresa com Ticker: MRVE


Processando Empresas:  58%|█████▊    | 53/91 [05:27<03:49,  6.05s/empresa]

Acessando empresa com Ticker: BEEF


Processando Empresas:  59%|█████▉    | 54/91 [05:32<03:41,  5.98s/empresa]

Acessando empresa com Ticker: MULT


Processando Empresas:  60%|██████    | 55/91 [05:38<03:29,  5.83s/empresa]

Acessando empresa com Ticker: YDUQ


Processando Empresas:  62%|██████▏   | 56/91 [05:43<03:17,  5.64s/empresa]

Acessando empresa com Ticker: TEND


Processando Empresas:  63%|██████▎   | 57/91 [05:48<03:07,  5.52s/empresa]

Acessando empresa com Ticker: ENEV


Processando Empresas:  64%|██████▎   | 58/91 [05:54<03:00,  5.47s/empresa]

Acessando empresa com Ticker: HYPE


Processando Empresas:  65%|██████▍   | 59/91 [05:59<02:55,  5.49s/empresa]

Acessando empresa com Ticker: B3SA


Processando Empresas:  66%|██████▌   | 60/91 [06:04<02:46,  5.37s/empresa]

Acessando empresa com Ticker: CIEL
Erro ao acessar a API: 400


Processando Empresas:  67%|██████▋   | 61/91 [06:09<02:35,  5.19s/empresa]

Acessando empresa com Ticker: FLRY


Processando Empresas:  68%|██████▊   | 62/91 [06:15<02:34,  5.34s/empresa]

Acessando empresa com Ticker: PRIO


Processando Empresas:  69%|██████▉   | 63/91 [06:20<02:30,  5.39s/empresa]

Acessando empresa com Ticker: ARZZ


Processando Empresas:  70%|███████   | 64/91 [06:26<02:25,  5.38s/empresa]

Acessando empresa com Ticker: ALOS


Processando Empresas:  71%|███████▏  | 65/91 [06:31<02:19,  5.35s/empresa]

Acessando empresa com Ticker: MGLU


Processando Empresas:  73%|███████▎  | 66/91 [06:37<02:17,  5.51s/empresa]

Acessando empresa com Ticker: BPAC
Erro ao acessar a API: 400


Processando Empresas:  74%|███████▎  | 67/91 [06:42<02:07,  5.30s/empresa]

Acessando empresa com Ticker: BBSE


Processando Empresas:  75%|███████▍  | 68/91 [06:47<02:02,  5.32s/empresa]

Acessando empresa com Ticker: ABEV


Processando Empresas:  76%|███████▌  | 69/91 [06:53<01:59,  5.41s/empresa]

Acessando empresa com Ticker: CVCB


Processando Empresas:  77%|███████▋  | 70/91 [06:58<01:56,  5.52s/empresa]

Acessando empresa com Ticker: MOVI


Processando Empresas:  78%|███████▊  | 71/91 [07:04<01:51,  5.55s/empresa]

Acessando empresa com Ticker: AZUL


Processando Empresas:  79%|███████▉  | 72/91 [07:09<01:44,  5.48s/empresa]

Acessando empresa com Ticker: CRFB


Processando Empresas:  80%|████████  | 73/91 [07:15<01:38,  5.45s/empresa]

Acessando empresa com Ticker: IRBR


Processando Empresas:  81%|████████▏ | 74/91 [07:20<01:33,  5.49s/empresa]

Acessando empresa com Ticker: SMFT


Processando Empresas:  82%|████████▏ | 75/91 [07:25<01:25,  5.36s/empresa]

Acessando empresa com Ticker: VBBR


Processando Empresas:  84%|████████▎ | 76/91 [07:31<01:20,  5.37s/empresa]

Acessando empresa com Ticker: HAPV


Processando Empresas:  85%|████████▍ | 77/91 [07:36<01:15,  5.39s/empresa]

Acessando empresa com Ticker: VAMO


Processando Empresas:  86%|████████▌ | 78/91 [07:41<01:08,  5.29s/empresa]

Acessando empresa com Ticker: NTCO


Processando Empresas:  87%|████████▋ | 79/91 [07:46<01:03,  5.25s/empresa]

Acessando empresa com Ticker: VIVA


Processando Empresas:  88%|████████▊ | 80/91 [07:52<00:58,  5.28s/empresa]

Acessando empresa com Ticker: RDOR


Processando Empresas:  89%|████████▉ | 81/91 [07:57<00:51,  5.19s/empresa]

Acessando empresa com Ticker: LWSA


Processando Empresas:  90%|█████████ | 82/91 [08:02<00:46,  5.16s/empresa]

Acessando empresa com Ticker: TIMS
Erro ao acessar a API: 400


Processando Empresas:  91%|█████████ | 83/91 [08:07<00:40,  5.02s/empresa]

Acessando empresa com Ticker: SOMA


Processando Empresas:  92%|█████████▏| 84/91 [08:12<00:35,  5.04s/empresa]

Acessando empresa com Ticker: PETZ
Erro ao acessar a API: 400


Processando Empresas:  93%|█████████▎| 85/91 [08:16<00:29,  4.95s/empresa]

Acessando empresa com Ticker: GMAT


Processando Empresas:  95%|█████████▍| 86/91 [08:21<00:24,  4.99s/empresa]

Acessando empresa com Ticker: RRRP


Processando Empresas:  96%|█████████▌| 87/91 [08:27<00:20,  5.05s/empresa]

Acessando empresa com Ticker: ASAI
Erro ao acessar a API: 400


Processando Empresas:  97%|█████████▋| 88/91 [08:31<00:14,  4.94s/empresa]

Acessando empresa com Ticker: CMIN


Processando Empresas:  98%|█████████▊| 89/91 [08:36<00:09,  4.97s/empresa]

Acessando empresa com Ticker: RECV


Processando Empresas:  99%|█████████▉| 90/91 [08:41<00:04,  4.98s/empresa]

Acessando empresa com Ticker: RAIZ


Processando Empresas: 100%|██████████| 91/91 [08:46<00:00,  4.97s/empresa]Processando Empresas: 100%|██████████| 91/91 [08:46<00:00,  5.79s/empresa]


In [0]:
# Criar DataFrames do Spark
df_market_ratios = spark.createDataFrame(all_market_ratios)
df_financial_ratios = spark.createDataFrame(all_financial_ratios)


In [0]:
df_market_ratios.show()

+-------+----------------+--------+------------------+--------------+----------------+-------------------+-----+--------------+-------------+------------------+--------------+--------------+----------+------+
|company|assets_per_share|cvm_code|earnings_per_share|ebit_per_share|equity_per_share|net_sales_per_share|price|price_earnings|price_to_book|price_to_cash_flow|price_to_sales|reference_date|    shares|ticker|
+-------+----------------+--------+------------------+--------------+----------------+-------------------+-----+--------------+-------------+------------------+--------------+--------------+----------+------+
|   ELET|          59.689|    2437|            0.3951|         1.756|         30.0145|            11.1964|17.95|       45.4349|        0.598|            4.7011|        1.6032|    2010-01-04|2307099812| ELET3|
|   ELET|          59.689|    2437|            0.3951|         1.756|         30.0145|            11.1964|17.95|       45.4349|        0.598|            4.7011|    

In [0]:
df_financial_ratios.show()

+-------+--------------+--------------+-----------------+--------+-----------+------+-------------+----------+------------+--------+----------+----------------+----------+-----------+-----------+---------------+----------------+----------------+--------------+----------+---------------+
|company|asset_turnover|cash_liquidity|current_liquidity|cvm_code|ebit_margin|ebitda|ebitda_margin|gross_debt|gross_margin|net_debt|net_margin|operating_margin|period_end|period_init|period_type|quick_liquidity|return_on_assets|return_on_equity|statement_type|total_debt|working_capital|
+-------+--------------+--------------+-----------------+--------+-----------+------+-------------+----------+------------+--------+----------+----------------+----------+-----------+-----------+---------------+----------------+----------------+--------------+----------+---------------+
|   BBDC|        0.1264|          null|             null|     906|       null|  null|         null|      null|     53.3612|    null|   1

In [0]:
# Salvar os dados em tabelas Delta no Databricks
df_market_ratios.write.format("delta").mode("overwrite").saveAsTable("market_ratios")
df_financial_ratios.write.format("delta").mode("overwrite").saveAsTable("financial_ratios")

print("Dados salvos com sucesso no Databricks!")

Dados salvos com sucesso no Databricks!


In [0]:
print(f"A tabela market_ratios tem {df_market_ratios.count()} linhas.")
print(f"A tabela financial_ratios tem {df_financial_ratios.count()} linhas.")

A tabela market_ratios tem 418057 linhas.
A tabela financial_ratios tem 4297 linhas.


## Modelagem dos dados

Como a tabela market_ratios, que contém dados históricos diários, possui uma quantidade substancial de dados. Em contraste, a tabela financial_ratios contém dados trimestrais e, consequentemente, tem menos registros disponíveis. Para trabalhar com uma visão completa dos dados disponíveis, precisamos combinar essas tabelas.

In [0]:
# Ler as tabelas Delta
df_market_ratios = spark.read.format("delta").table("market_ratios")
df_financial_ratios = spark.read.format("delta").table("financial_ratios")

# Alterando o nome para fazer o merge
df_financial_ratios = df_financial_ratios.withColumnRenamed('period_end', 'reference_date')

# Realizar o join baseado na coluna 'company' e 'reference_date'
df_merged = df_financial_ratios.join(df_market_ratios, on=['company', 'reference_date'], how='left')

# Exibir o DataFrame resultante
df_merged.show()

+-------+--------------+--------------+--------------+-----------------+--------+-----------+------+-------------+----------+------------+--------+----------+----------------+-----------+-----------+---------------+----------------+----------------+--------------+----------+---------------+----------------+--------+------------------+--------------+----------------+-------------------+-----+--------------+-------------+------------------+--------------+------+------+
|company|reference_date|asset_turnover|cash_liquidity|current_liquidity|cvm_code|ebit_margin|ebitda|ebitda_margin|gross_debt|gross_margin|net_debt|net_margin|operating_margin|period_init|period_type|quick_liquidity|return_on_assets|return_on_equity|statement_type|total_debt|working_capital|assets_per_share|cvm_code|earnings_per_share|ebit_per_share|equity_per_share|net_sales_per_share|price|price_earnings|price_to_book|price_to_cash_flow|price_to_sales|shares|ticker|
+-------+--------------+--------------+--------------+--

In [0]:
# Selecionando apenas as colunas desejadas para evitar duplicidade e retirando colunas que nao serão utilizadas
columns_to_keep = [
    'company', 'reference_date', 'assets_per_share', 'earnings_per_share',
    'ebit_per_share', 'equity_per_share', 'net_sales_per_share',
    'price', 'price_earnings', 'price_to_book', 'price_to_cash_flow',
    'price_to_sales', 'shares', 'ticker', 'asset_turnover', 'cash_liquidity',
    'current_liquidity', 'ebit_margin', 'ebitda', 'ebitda_margin',
    'gross_debt', 'gross_margin', 'net_debt', 'net_margin', 'operating_margin',
    'quick_liquidity', 'return_on_assets', 'return_on_equity', 'total_debt', 'working_capital'
]

df_merged_selected = df_merged.select(columns_to_keep)

In [0]:
df_merged_selected.count()

Out[13]: 6197

## Tratamento dos dados
Agora vamos tratar esses dados, vamos tirar as linhas com mais de 60% dos valores nullos

In [0]:
null_threshold = 5

# Filtrar as linhas com mais de 6 valores nulos
filtered_df = df_merged_selected.filter(
    sum(col(c).isNull().cast("integer") for c in df_merged_selected.columns) <= null_threshold
)

Tiramos as linhas com valores nulos do DataFrame. Como não possuímos variáveis categóricas e os tipos de dados estão corretos, vamos proceder verificando a presença de outliers nos dados.

In [0]:
descriptive_stats = filtered_df.describe().toPandas()

descriptive_stats

Unnamed: 0,summary,company,reference_date,assets_per_share,earnings_per_share,ebit_per_share,equity_per_share,net_sales_per_share,price,price_earnings,...,gross_debt,gross_margin,net_debt,net_margin,operating_margin,quick_liquidity,return_on_assets,return_on_equity,total_debt,working_capital
0,count,3231,3231,3231.0,3231.0,3231.0,3231.0,3231.0,3231.0,3231.0,...,3169.0,3231.0,3169.0,3231.0,3231.0,3219.0,3231.0,3231.0,3231.0,3231.0
1,mean,,,29.51041287527082,1.0009197462086037,2.223296812132468,9.75656979263386,15.92680157845868,14.955023212627667,30.451856669761668,...,24153967246.998108,36.90970154750852,17377126055.075733,18.30191324667285,17.569853946146715,1.6804571295433357,0.0479164035902197,14.018542958836276,191.82402432683372,5958619866.685546
2,stddev,,,31.23118722520641,2.778336645123253,4.0667003253456375,9.55922757922692,23.07786285181474,26.095724019998837,600.9917003124518,...,63639962876.75412,22.629875243209167,51032130450.38494,120.26018775184384,98.30843448595348,0.9442293782541382,0.0749473654948325,77.70861034637232,744.520238445092,10337382042.826942
3,min,ABEV,2010-03-31,1.1193,-17.8181,-27.5247,-15.917,-4.2929,0.17,-8117.1846,...,554000.0,-42.7944,-16973032000.0,-352.5066,-5103.4483,0.1751,-1.0393,-1061.5892,-27634.8783,-14783000000.0
4,max,YDUQ,2023-06-30,290.4341,25.1231,32.2587,59.2751,170.946,1120.37,32079.1121,...,506584000000.0,365.5172,402335000000.0,6544.8276,348.6943,12.8748,0.3397,3716.5156,7769.3534,75918749000.0


Os dados apresentam alguns valores outliers, como observado em métricas como Earnings per Share, Price to Earnings e Total Debt. É importante notar que outliers são relativamente comuns no mercado financeiro devido à natureza variável das empresas e das condições econômicas. Não planejamos remover esses dados neste momento, pois essas variações extremas podem refletir eventos específicos ou características únicas de cada empresa, que são relevantes para uma análise financeira abrangente.

In [0]:
# Salvar o DataFrame resultante
filtered_df.write.format("delta").mode("overwrite").saveAsTable("merged_ratios")

print("DataFrame resultante salvo com sucesso!")

DataFrame resultante salvo com sucesso!



# Catálogo de Dados: Tabela `merged_ratios`

Este notebook documenta a tabela `merged_ratios`, que contém dados combinados de indicadores de mercado e financeiros das empresas listadas no IBXX.

### Descrição Geral da Tabela

- **Nome da Tabela**: `merged_ratios`
- **Descrição**: Tabela contendo dados combinados de indicadores de mercado e financeiros das empresas listadas no IBXX.
- **Esquema**: Flat

### Estrutura da Tabela e Descrição dos Campos

| Campo                 | Tipo de Dados | Descrição                                         | Valor Esperado                   |
|-----------------------|---------------|---------------------------------------------------|----------------------------------|
| **company**           | `string`      | Código da empresa                                 | Código alfanumérico único        |
| **reference_date**    | `string`      | Data de referência                                | Formato `YYYY-MM-DD`             |
| **assets_per_share**  | `double`      | Ativos por ação                                   | Maior que 0                      |
| **earnings_per_share**| `double`      | Lucros por ação                                   | Pode ser positivo ou negativo    |
| **ebit_per_share**    | `double`      | EBIT por ação                                     | Maior que 0                      |
| **equity_per_share**  | `double`      | Patrimônio líquido por ação                       | Pode ser positivo ou negativo    |
| **net_sales_per_share** | `double`    | Vendas líquidas por ação                          | Maior que 0                      |
| **price**             | `double`      | Preço da ação                                     | Maior que 0                      |
| **price_earnings**    | `double`      | Relação preço/lucro                               | Pode ser positivo ou negativo    |
| **price_to_book**     | `double`      | Relação preço/valor patrimonial                   | Maior que 0                      |
| **price_to_cash_flow**| `double`      | Relação preço/fluxo de caixa                      | Maior que 0                      |
| **price_to_sales**    | `double`      | Relação preço/vendas                              | Maior que 0                      |
| **shares**            | `bigint`      | Número de ações                                   | Maior que 0                      |
| **ticker**            | `string`      | Ticker da empresa                                 | Código alfanumérico único        |
| **asset_turnover**    | `double`      | Giro dos ativos                                   | Maior que 0                      |
| **cash_liquidity**    | `double`      | Liquidez em caixa                                 | Maior que 0                      |
| **current_liquidity** | `double`      | Liquidez corrente                                 | Maior que 0                      |
| **ebit_margin**       | `double`      | Margem EBIT                                       | Entre -100% e 100%               |
| **ebitda**            | `double`      | EBITDA                                            | Maior que 0                      |
| **ebitda_margin**     | `double`      | Margem EBITDA                                     | Entre -100% e 100%               |
| **gross_debt**        | `double`      | Dívida bruta                                      | Pode ser positivo ou negativo    |
| **gross_margin**      | `double`      | Margem bruta                                      | Entre -100% e 100%               |
| **net_debt**          | `double`      | Dívida líquida                                    | Pode ser positivo ou negativo    |
| **net_margin**        | `double`      | Margem líquida                                    | Entre -100% e 100%               |
| **operating_margin**  | `double`      | Margem operacional                                | Entre -100% e 100%               |
| **period_init**       | `string`      | Data de início do período                         | Formato `YYYY-MM-DD`             |
| **period_type**       | `string`      | Tipo de período (por exemplo, trimestral ou anual)| 'trimestral' ou 'anual'          |
| **quick_liquidity**   | `double`      | Liquidez rápida                                   | Maior que 0                      |
| **return_on_assets**  | `double`      | Retorno sobre os ativos                           | Entre -100% e 100%               |
| **return_on_equity**  | `double`      | Retorno sobre o patrimônio líquido                | Entre -100% e 100%               |
| **total_debt**        | `double`      | Dívida total                                      | Pode ser positivo ou negativo    |
| **working_capital**   | `double`      | Capital de giro                                   | Pode ser positivo ou negativo    |


### Linhagem dos Dados

- **Fonte**: Dados coletados pela API do site dadosdemercado.
- **Processamento**: Transformação e limpeza de dados realizadas no Databricks utilizando Spark SQL.
- **Carga**: Dados carregados e armazenados em formato Delta para garantir eficiência em operações de leitura e escrita.

### Definições de Metadados em SQL

In [0]:
# Definir descrições para os campos da tabela
spark.sql("""
    ALTER TABLE merged_ratios
    SET TBLPROPERTIES (
        'description' = 'Tabela contendo dados combinados de indicadores de mercado e financeiros das empresas listadas no IBXX.',
        'company.description' = 'Código da empresa',
        'reference_date.description' = 'Data de referência',
        'assets_per_share.description' = 'Ativos por ação',
        'earnings_per_share.description' = 'Lucros por ação',
        'ebit_per_share.description' = 'EBIT por ação',
        'equity_per_share.description' = 'Patrimônio líquido por ação',
        'net_sales_per_share.description' = 'Vendas líquidas por ação',
        'price.description' = 'Preço da ação',
        'price_earnings.description' = 'Relação preço/lucro',
        'price_to_book.description' = 'Relação preço/valor patrimonial',
        'price_to_cash_flow.description' = 'Relação preço/fluxo de caixa',
        'price_to_sales.description' = 'Relação preço/vendas',
        'shares.description' = 'Número de ações',
        'ticker.description' = 'Ticker da empresa',
        'asset_turnover.description' = 'Giro dos ativos',
        'cash_liquidity.description' = 'Liquidez em caixa',
        'current_liquidity.description' = 'Liquidez corrente',
        'ebit_margin.description' = 'Margem EBIT',
        'ebitda.description' = 'EBITDA',
        'ebitda_margin.description' = 'Margem EBITDA',
        'gross_debt.description' = 'Dívida bruta',
        'gross_margin.description' = 'Margem bruta',
        'net_debt.description' = 'Dívida líquida',
        'net_margin.description' = 'Margem líquida',
        'operating_margin.description' = 'Margem operacional',
        'period_init.description' = 'Data de início do período',
        'period_type.description' = 'Tipo de período (por exemplo, trimestral ou anual)',
        'quick_liquidity.description' = 'Liquidez rápida',
        'return_on_assets.description' = 'Retorno sobre os ativos',
        'return_on_equity.description' = 'Retorno sobre o patrimônio líquido',
        'statement_type.description' = 'Tipo de demonstrativo financeiro (por exemplo, consolidado)',
        'total_debt.description' = 'Dívida total',
        'working_capital.description' = 'Capital de giro'
    )
""")



Out[17]: DataFrame[]

# Perguntas:

### Como os Indicadores Financeiros Evoluíram ao Longo do Tempo?
Abaixo, consultamos a média dos principais indicadores financeiros agrupados por data de referência, permitindo observar sua evolução ao longo do tempo.



In [0]:
%sql
SELECT 
    reference_date,
    AVG(price) AS avg_price,
    AVG(price_earnings) AS avg_price_earnings,
    AVG(price_to_book) AS avg_price_to_book,
    AVG(price_to_cash_flow) AS avg_price_to_cash_flow,
    AVG(price_to_sales) AS avg_price_to_sales,
    AVG(ebit_margin) AS avg_ebit_margin,
    AVG(ebitda_margin) AS avg_ebitda_margin,
    AVG(gross_margin) AS avg_gross_margin,
    AVG(net_margin) AS avg_net_margin,
    AVG(operating_margin) AS avg_operating_margin,
    AVG(return_on_assets) AS avg_return_on_assets,
    AVG(return_on_equity) AS avg_return_on_equity
FROM 
    merged_ratios
GROUP BY 
    reference_date
ORDER BY 
    reference_date;


reference_date,avg_price,avg_price_earnings,avg_price_to_book,avg_price_to_cash_flow,avg_price_to_sales,avg_ebit_margin,avg_ebitda_margin,avg_gross_margin,avg_net_margin,avg_operating_margin,avg_return_on_assets,avg_return_on_equity
2010-03-31,3.75,9.7394,0.9216,3.0981,0.79335,8.7751,24.327150000000003,18.88045,7.9008,10.96545,0.0456,11.548
2011-03-31,9.937820512820512,14.322315384615385,2.1665756410256414,0.9822512820512826,2.2413705128205126,4.631148717948717,11.073244871794872,35.69862948717949,19.1641217948718,25.384642307692317,0.0677423076923076,15.410796153846157
2011-06-30,8.446235294117647,22.28045411764706,2.567469411764705,14.186663529411764,2.220994117647059,3.3052988235294123,9.969002352941178,34.48202823529412,17.158541176470585,23.09232705882353,0.0631564705882353,14.858682352941177
2011-09-30,7.719195402298851,17.997165517241378,2.311328735632184,146.17304712643678,2.034083908045977,2.012209195402297,8.992528735632183,32.89570344827586,16.241070114942527,20.498541379310343,0.057019540229885,13.363436781609195
2013-09-30,8.852168674698797,13.644655421686744,2.0304024096385542,12.867543373493977,1.980361445783133,17.351519277108434,23.281332530120483,31.95136144578313,12.877232530120486,15.418089156626507,0.0479771084337349,9.990843373493975
2014-03-31,8.678604651162791,9.963123255813954,2.281609302325581,5.483447674418606,2.363829069767442,20.831156976744182,27.01844418604651,34.25084302325581,13.223746511627908,16.064418604651163,0.0499732558139534,9.98673953488372
2014-06-30,8.695714285714287,10.22109761904762,2.1969369047619045,7.899186904761905,2.3241380952380952,23.12429404761905,29.75284404761905,32.54790952380953,16.708824999999997,21.644573809523813,0.0526857142857142,11.043616666666669
2014-09-30,8.41067415730337,13.114121348314608,2.082449438202248,6.741003370786517,2.2080157303370798,23.63916741573034,30.11562808988764,33.52575730337078,16.607331460674153,20.403480898876406,0.0476696629213483,9.20456966292135
2015-03-31,8.056914893617021,-8.653598936170214,0.982674468085107,13.407104255319148,2.379928723404255,21.97081914893617,29.51370106382979,31.797859574468088,11.262908510638294,12.559329787234043,0.0315968085106383,44.51856063829786
2015-06-30,8.583695652173912,5.569517391304347,2.4162891304347824,12.435951086956518,2.2951,16.87741956521739,24.8440347826087,31.205842391304348,6.950746739130434,8.125882608695653,0.0212282608695652,-0.3693706521739118



1. **avg_price (Preço Médio)**
   - O preço médio varia significativamente ao longo do tempo.
   - Em 2010, o preço médio é baixo (3.75), mas aumenta substancialmente em 2021 (24.60) e mantém-se alto.
   - Indica um crescimento no valor das ações ao longo do período, possivelmente refletindo uma valorização geral do mercado.

2. **avg_price_earnings (Preço/Lucro Médio)**
   - Variações extremas podem ser observadas, como em 2016 (-71.08) e 2021 (229.43), sugerindo flutuações significativas nos lucros em relação aos preços.
   - Estas variações extremas podem indicar períodos de volatilidade ou eventos significativos no mercado que afetaram os lucros das empresas.

3. **avg_price_to_book (Preço/Valor Patrimonial Médio)**
   - Valores consistentes ao longo do tempo com aumentos notáveis em 2021 (7.95).
   - Um aumento neste índice pode indicar uma valorização das ações em relação ao valor patrimonial da empresa.

4. **avg_price_to_cash_flow (Preço/Fluxo de Caixa Médio)**
   - Variações significativas, especialmente em 2011 e 2020 com valores negativos ou extremamente altos.
   - Flutuações indicam períodos de instabilidade no fluxo de caixa das empresas.

5. **avg_price_to_sales (Preço/Vendas Médio)**
   - Geralmente estável, com um aumento gradual ao longo do tempo.
   - Reflete uma correlação entre o crescimento das vendas e a valorização das ações.

6. **avg_ebit_margin (Margem EBIT Média)**
   - Aumenta ao longo do tempo, especialmente notável em 2019 (30.53) e em 2022 (34.23).
   - Sugere uma melhoria na eficiência operacional das empresas.

7. **avg_ebitda_margin (Margem EBITDA Média)**
   - Aumento consistente ao longo do tempo, indicando melhoria na capacidade de gerar lucro operacional.
   - Valores mais altos em 2021 e 2022 refletem uma forte performance operacional.

8. **avg_gross_margin (Margem Bruta Média)**
   - Relativamente estável, com pequenos aumentos ao longo do tempo.
   - Indica uma manutenção na capacidade de gerar lucro bruto.

9. **avg_net_margin (Margem Líquida Média)**
   - Melhora ao longo do tempo, com picos em 2021 (24.02) e 2022 (24.82).
   - Reflete a capacidade das empresas de transformar receita em lucro líquido.

10. **avg_operating_margin (Margem Operacional Média)**
    - Aumenta gradualmente, especialmente em 2021 (29.44).
    - Demonstra uma melhoria na eficiência das operações principais das empresas.

11. **avg_return_on_assets (Retorno sobre Ativos Médio)**
    - Relativamente estável, com uma ligeira tendência de aumento.
    - Valores mais altos indicam melhor utilização dos ativos para gerar lucro.

12. **avg_return_on_equity (Retorno sobre Patrimônio Líquido Médio)**
    - Aumenta substancialmente em 2015 (44.52) e 2021 (27.12).
    - Alta variação sugere períodos de forte retorno sobre o patrimônio, indicando uma boa rentabilidade para os acionistas.

- **Tendências de Crescimento**: Vários indicadores mostram uma tendência de crescimento ao longo do tempo, como o preço médio, margem EBIT e EBITDA, sugerindo uma valorização geral e melhor eficiência operacional das empresas.

- **Variações e Volatilidade**: Algumas métricas, como o Preço/Lucro e Preço/Fluxo de Caixa, apresentam variações significativas, indicando períodos de alta volatilidade ou mudanças substanciais no desempenho financeiro.

- **Eficiência e Rentabilidade**: A melhoria nas margens e retornos sugere que as empresas estão se tornando mais eficientes e rentáveis ao longo do tempo.

### Quais Indicadores Têm Maior Influência no Preço das Ações?
Calculamos a correlação entre o preço das ações e vários indicadores financeiros para identificar quais têm a maior influência no preço.



In [0]:
%sql
SELECT
    CORR(price, price_earnings) AS corr_price_earnings,
    CORR(price, price_to_book) AS corr_price_to_book,
    CORR(price, price_to_cash_flow) AS corr_price_to_cash_flow,
    CORR(price, price_to_sales) AS corr_price_to_sales,
    CORR(price, ebit_margin) AS corr_ebit_margin,
    CORR(price, ebitda_margin) AS corr_ebitda_margin,
    CORR(price, gross_margin) AS corr_gross_margin,
    CORR(price, net_margin) AS corr_net_margin,
    CORR(price, operating_margin) AS corr_operating_margin,
    CORR(price, return_on_assets) AS corr_return_on_assets,
    CORR(price, return_on_equity) AS corr_return_on_equity
FROM 
    merged_ratios;


corr_price_earnings,corr_price_to_book,corr_price_to_cash_flow,corr_price_to_sales,corr_ebit_margin,corr_ebitda_margin,corr_gross_margin,corr_net_margin,corr_operating_margin,corr_return_on_assets,corr_return_on_equity
0.0334242869693938,0.1764593627866189,-0.0169278199138465,0.0918787698228651,-0.0119142941833532,0.0021540369491144,0.0443409604591539,-0.0033626604994289,-0.0117447807476352,0.025437343625672,0.0095062871199205



- **Critério de Significância**: Consideramos um nível de significância de 5% (p < 0.05) para determinar se a correlação é estatisticamente significativa.
- **Conclusão**:
  - Nenhuma das correlações analisadas apresentou um p-valor menor que 0.05, indicando que **nenhuma das correlações é estatisticamente significativa** ao nível de 5%.

Isso sugere que, com base nos dados fornecidos e no tamanho da amostra, não há evidências suficientes para afirmar que qualquer um desses indicadores financeiros tenha uma correlação significativa com a categorização das ações como baratas, caras ou neutras. 

### Quais Empresas Apresentam Maior Estabilidade Financeira?

Para avaliar a estabilidade financeira, analisamos a variabilidade dos lucros por ação (EPS) de cada empresa. Menor variabilidade indica maior estabilidade.




In [0]:
%sql
SELECT 
    company,
    STDDEV(earnings_per_share) AS eps_volatility,
    AVG(earnings_per_share) AS avg_eps,
    AVG(price_to_book) AS avg_price_to_book,
    AVG(net_margin) AS avg_net_margin,
    AVG(gross_margin) AS avg_gross_margin
FROM 
    merged_ratios
GROUP BY 
    company
ORDER BY 
    eps_volatility ASC
LIMIT 10;


company,eps_volatility,avg_eps,avg_price_to_book,avg_net_margin,avg_gross_margin
LWSA,0.0227448815420884,0.0138818181818181,4.5219,1.5661181818181815,44.11735454545455
GMAT,0.067278690109552,0.403375,2.1646375,4.9964,22.81255
RAIZ,0.0733167102371621,0.2234,2.397,1.269825,5.764425
RDOR,0.1072310023134301,0.553825,6.6783125000000005,6.2108500000000015,21.78785
ABEV,0.1097890371929139,0.7833782608695651,3.738956521739131,24.36072173913044,58.71346521739129
B3SA,0.1225474997581333,0.7267666666666667,3.1878,44.053358333333335,90.69388333333332
HAPV,0.1278873447786975,0.0149249999999999,7.001608333333333,4.629958333333334,28.39978333333333
POMO,0.1331711416427161,0.227074074074074,1.1879814814814813,6.9506000000000006,16.23336296296296
VAMO,0.1634661083265536,0.4192499999999999,5.228462500000001,12.8789875,38.51415
TOTS,0.1867678512389385,0.4224777777777777,5.532814814814816,11.451140740740742,66.01874444444445



Para determinar quais empresas apresentam maior estabilidade financeira com base nos dados fornecidos, podemos usar os seguintes critérios de estabilidade:

1. **Baixa Volatilidade do EPS**: Empresas com menor volatilidade no EPS (Earnings Per Share) são geralmente mais estáveis.
2. **Margens Altas e Consistentes**: Empresas com margens líquida e bruta mais altas e consistentes tendem a ser mais estáveis.
3. **Baixo P/B**: Um menor valor de Price-to-Book (P/B) pode indicar que a empresa está sendo negociada a um preço mais próximo de seu valor contábil, sugerindo menos volatilidade.

### Análise por Critério:

1. **Baixa Volatilidade do EPS**:
   - **Mais estáveis**: LWSA (0.023), GMAT (0.067)
   - **Menos estáveis**: TOTS (0.187), VAMO (0.163)

2. **Altas Margens Líquidas**:
   - **Mais estáveis**: B3SA (44.053%), ABEV (24.361%)
   - **Menos estáveis**: RAIZ (1.2698%), LWSA (1.5661%)

3. **Altas Margens Brutas**:
   - **Mais estáveis**: B3SA (90.694%), ABEV (58.713%)
   - **Menos estáveis**: RAIZ (5.764%), GMAT (22.813%)

4. **Baixo P/B**:
   - **Mais estáveis**: POMO (1.188), GMAT (2.165)
   - **Menos estáveis**: HAPV (7.002), RDOR (6.678)

### Empresas com Maior Estabilidade Financeira:

Combinando esses critérios, as empresas que aparecem mais frequentemente como estáveis são:

1. **GMAT (Grupo Mateus)**:
   - **Volatilidade do EPS**: Relativamente baixa (0.067)
   - **Margem Líquida**: Moderada (4.996%)
   - **Margem Bruta**: Baixa (22.813%)
   - **P/B**: Baixo (2.165)

2. **ABEV (Ambev)**:
   - **Volatilidade do EPS**: Moderada (0.110)
   - **Margem Líquida**: Alta (24.361%)
   - **Margem Bruta**: Alta (58.713%)
   - **P/B**: Moderado (3.739)

3. **B3SA (B3)**:
   - **Volatilidade do EPS**: Moderada (0.123)
   - **Margem Líquida**: Muito alta (44.053%)
   - **Margem Bruta**: Muito alta (90.694%)
   - **P/B**: Moderado (3.188)

### Conclusão:

- **GMAT** se destaca por sua baixa volatilidade do EPS e baixo P/B, sugerindo estabilidade em termos de ganhos e avaliação.
- **ABEV** e **B3SA** se destacam por suas margens líquida e bruta altas, indicando operações financeiramente saudáveis e estáveis.

Essas três empresas são as mais estáveis financeiramente com base nos critérios analisados.

### Como a Dívida Impacta o Desempenho das Empresas?

Analisamos a correlação entre a dívida total e vários indicadores de desempenho para entender o impacto da dívida.




In [0]:
%sql
SELECT
    CORR(total_debt, ebit_margin) AS corr_debt_ebit_margin,
    CORR(total_debt, net_margin) AS corr_debt_net_margin,
    CORR(total_debt, operating_margin) AS corr_debt_operating_margin,
    CORR(total_debt, return_on_assets) AS corr_debt_return_on_assets,
    CORR(total_debt, return_on_equity) AS corr_debt_return_on_equity
FROM 
    merged_ratios;


corr_debt_ebit_margin,corr_debt_net_margin,corr_debt_operating_margin,corr_debt_return_on_assets,corr_debt_return_on_equity
-0.0356072446417786,-0.0113637573008719,-0.0165742334095236,0.0006459564966111978,-0.6920845213392909



- **1** indica uma relação positiva perfeita.
- **-1** indica uma relação negativa perfeita.
- **0** indica que não há relação linear.

Com base nas correlações analisadas:

- **Dívida e Margens (EBIT, Líquida e Operacional)**: A dívida tem um impacto ligeiramente negativo ou insignificante sobre as margens de lucro das empresas. A relação é fraca, sugerindo que a dívida não altera drasticamente essas métricas de desempenho em média.

- **Dívida e ROA**: A dívida não parece ter uma influência significativa sobre o retorno sobre os ativos, indicando que as empresas podem ser igualmente eficientes em usar seus ativos para gerar lucros, independentemente do nível de dívida.

- **Dívida e ROE**: A dívida tem um impacto fortemente negativo sobre o retorno sobre o patrimônio. Isso sugere que empresas com maiores níveis de dívida tendem a ter um retorno reduzido para os acionistas. A dívida adicional pode aumentar o risco financeiro e diminuir a rentabilidade do patrimônio dos acionistas, especialmente quando a dívida se torna pesada demais para ser gerenciada eficazmente.


###  Quais Empresas Utilizam Seus Ativos de Forma Mais Eficiente?
Identificamos as empresas que utilizam seus ativos de forma mais eficiente com base no giro dos ativos e no retorno sobre os ativos.



In [0]:
%sql
SELECT 
    company,
    AVG(asset_turnover) AS avg_asset_turnover,
    AVG(return_on_assets) AS avg_return_on_assets
FROM 
    merged_ratios
GROUP BY 
    company
ORDER BY 
    avg_asset_turnover DESC
LIMIT 10;


company,avg_asset_turnover,avg_return_on_assets
VBBR,3.70435,0.0823083333333333
UGPA,3.3102239999999994,0.0501279999999999
RAIZ,1.9116,0.0226499999999999
GMAT,1.6451,0.0821625
JBSS,1.5651185185185186,0.0357407407407407
MGLU,1.5284576923076922,0.0150192307692307
CRFB,1.3629416666666667,0.0418749999999999
BEEF,1.1924222222222225,-0.0051222222222222
ARZZ,1.1040333333333334,0.1118555555555555
MRFG,1.098862962962963,0.0186962962962962



1. **Giro dos Ativos (Asset Turnover)**: Mede a eficiência com que uma empresa utiliza seus ativos para gerar vendas. Um giro de ativos mais alto indica que a empresa está gerando mais receita para cada unidade monetária de ativo.

2. **Retorno sobre Ativos (Return on Assets - ROA)**: Mede a eficiência com que uma empresa utiliza seus ativos para gerar lucro. Um ROA mais alto indica que a empresa está gerando mais lucro para cada unidade monetária de ativo.


### Empresas com Maior Eficiência no Uso dos Ativos

1. **VBBR (Vibra Energia S.A.)**
   - **Giro dos Ativos**: 3.7044 (Mais alto entre as empresas listadas)
   - **ROA**: 0.0823 (Segundo mais alto)
   - **Conclusão**: VBBR utiliza seus ativos de forma extremamente eficiente, gerando uma quantidade significativa de receita e lucro em relação aos seus ativos.

2. **UGPA (Ultrapar Participações S.A.)**
   - **Giro dos Ativos**: 3.3102 (Segundo mais alto)
   - **ROA**: 0.0501
   - **Conclusão**: UGPA também demonstra alta eficiência na utilização de seus ativos para gerar receita, sendo a segunda em termos de giro dos ativos.

3. **ARZZ (Arezzo&Co S.A.)**
   - **Giro dos Ativos**: 1.1040
   - **ROA**: 0.1119 (Mais alto entre as empresas listadas)
   - **Conclusão**: ARZZ tem o maior ROA, indicando que é extremamente eficiente em converter seus ativos em lucros, apesar de ter um giro dos ativos menor comparado a VBBR e UGPA.

4. **GMAT (Grupo Mateus)**
   - **Giro dos Ativos**: 1.6451
   - **ROA**: 0.0822 (Quase igual ao VBBR)
   - **Conclusão**: GMAT também utiliza seus ativos de maneira eficiente, com um bom equilíbrio entre giro dos ativos e retorno sobre ativos.

### Observações Adicionais

- **BEEF (Minerva S.A.)** apresenta um retorno sobre ativos negativo (-0.0051), indicando uma possível ineficiência ou problemas de rentabilidade em relação aos seus ativos.
- **MGLU (Magazine Luiza S.A.)** e **RAIZ (Raízen S.A.)** têm giros dos ativos relativamente altos, mas seus retornos sobre ativos são baixos, sugerindo que, embora gerem receita de maneira eficiente, não estão convertendo isso em lucros de forma eficaz.
- **JBSS (JBS S.A.)** tem um giro dos ativos moderado e um retorno sobre ativos razoável, mostrando um desempenho equilibrado.

### Conclusão

- **VBBR** e **UGPA** se destacam pela alta eficiência na geração de receita a partir de seus ativos.
- **ARZZ** se destaca pela eficiência na geração de lucros a partir de seus ativos.
- Empresas como **GMAT** apresentam um bom equilíbrio entre o uso dos ativos para gerar receita e lucro.


### Próximos Passos

Para uma análise mais detalhada, poderíamos:
- Comparar essas métricas com benchmarks ou índices do mercado para entender o desempenho relativo.
- Analisar eventos externos que possam ter impactado drasticamente algumas métricas em certos períodos.
- Avaliar a correlação entre diferentes métricas para entender como elas influenciam umas às outras.
