In [12]:
import pandas as pd

In [13]:
def formatar_dados(arquivo_origem):
    print('Formatação iniciada...')
    # Carregando o arquivo .csv
    df = pd.read_csv(arquivo_origem)

    # Formatando os campos
    df['data_pregao'] = pd.to_datetime(df['data_pregao']).dt.strftime('%d/%m/%Y')
    df['preco_abertura'] = df['preco_abertura'].astype(float)
    df['preco_maximo'] = df['preco_maximo'].astype(float)
    df['preco_minimo'] = df['preco_minimo'].astype(float)
    df['preco_fechamento'] = df['preco_fechamento'].astype(float)
    df['qtd_negocios'] = df['qtd_negocios'].astype(int)
    df['volume_negocios'] = df['volume_negocios'].astype(int)

    # Remover o índice do DataFrame
    df = df.reset_index(drop=True)

    # Adicionar as colunas 'sigla_acao' e 'nome_acao' ao DataFrame, se necessário
    if 'sigla_acao' not in df.columns:
        df['sigla_acao'] = ''
    if 'nome_acao' not in df.columns:
        df['nome_acao'] = ''

    print('Formatação Concluída!')
    
    return df

In [14]:
## Funções de análise de dados
def analisar_media(df):
    # Calcular a média do preço de fechamento ao longo do tempo
    media_fechamento = df['preco_fechamento'].mean()
    media_fechamento_formatada = round(media_fechamento, 2)
    print("Média do preço de fechamento:")
    print(media_fechamento_formatada)

In [15]:
def maior_valor(df, quantidade):
    # Ordernar por maior valor do preço máximo
    maiores_valores = df.sort_values('preco_maximo', ascending=False).head(quantidade)
    print('Preços máximos registrados: ')
    print(maiores_valores.to_string(index=False))

In [23]:
def menor_valor(df, quantidade):
    # Ordenar por menor valor do preço mínimo
    menores_valores = df.sort_values('preco_minimo', ascending=True).head(quantidade)
    print('Preços mínimos registrados:')
    print(menores_valores.to_string(index=False))


In [17]:
def maior_volume(df, quantidade):
    # Ordernar por maior volume de negócios
    maiores_volumes = df.sort_values('volume_negocios', ascending=False).head(quantidade)
    print('Maior volume de negócios registrados:')
    print(maiores_volumes.to_string(index=False))

In [18]:
def maior_negocio(df, quantidade):
    # Ordenar o DataFrame pelo campo 'qtd_negocios' em ordem decrescente
    df_sorted = df.sort_values('qtd_negocios', ascending=False)

    # Selecionar as n primeiras linhas do DataFrame ordenado
    top_dates = df_sorted.head(quantidade)[['data_pregao', 'sigla_acao', 'nome_acao', 'preco_fechamento', 'qtd_negocios']].copy()
    
    # Formatando as datas
    top_dates['data_pregao'] = top_dates['data_pregao']

    return top_dates

In [19]:
df_formatado = formatar_dados('all_bovespa.csv')

Formatação iniciada...


Formatação Concluída!


In [20]:
analisar_media(df_formatado)

Média do preço de fechamento:
113.78


113.78

In [21]:
maior_valor(df_formatado, 10)

Preços máximos registrados: 
data_pregao sigla_acao nome_acao  preco_abertura  preco_maximo  preco_minimo  preco_fechamento  qtd_negocios  volume_negocios
 16/06/2021     IBOV11  IBOVESPA        129516.0      129516.0      129516.0          129516.0        190790       1481375200
 14/07/2021     IBOV11  IBOVESPA        128372.0      128372.0      128372.0          128372.0         28070       -398537264
 13/01/2021     IBOV11  IBOVESPA        122150.0      122150.0      122150.0          122150.0        114710       1133246504
 14/04/2021     IBOV11  IBOVESPA        120474.0      120474.0      120474.0          120474.0        114920       1507738688
 17/02/2021     IBOV11  IBOVESPA        120395.0      120395.0      120395.0          120395.0        104210        614200068
 12/05/2021     IBOV11  IBOVESPA        120306.0      120306.0      120306.0          120306.0         38830       -967145464
 18/08/2021     IBOV11  IBOVESPA        117945.0      117945.0      117945.0          117

In [24]:
menor_valor(df_formatado, 10)

Preços mínimos registrados:
data_pregao sigla_acao nome_acao  preco_abertura  preco_maximo  preco_minimo  preco_fechamento  qtd_negocios  volume_negocios
 18/05/2021      BGIP4    BANESE            0.00          0.00          0.00              0.00           100           222400
 03/03/2023      PDGR3 PDG REALT            0.09          0.09          0.08              0.09       8230600         70240600
 02/03/2023      PDGR3 PDG REALT            0.09          0.10          0.08              0.09      14836100        133284900
 28/02/2023      PDGR3 PDG REALT            0.11          0.11          0.09              0.10      23342300        242179600
 01/03/2023      PDGR3 PDG REALT            0.10          0.11          0.09              0.09       6392100         61445100
 22/12/2022      PDGR3 PDG REALT            0.10          0.14          0.10              0.12      49442100        578988200
 29/12/2022      PDGR3 PDG REALT            0.11          0.12          0.10              

In [25]:
maior_volume(df_formatado, 5)

Maior volume de negócios registrados:
data_pregao sigla_acao  nome_acao  preco_abertura  preco_maximo  preco_minimo  preco_fechamento  qtd_negocios  volume_negocios
 02/07/2020      CPLE3      COPEL           61.37         61.60         58.40             58.40        363800       2147434200
 04/03/2020      BMGB4  BANCO BMG            6.65          6.73          6.32              6.50       3281000       2147425700
 23/11/2021      MLAS3 MULTILASER            7.02          7.11          6.79              7.11       3097200       2147410800
 19/08/2021      CEAB3  CEA MODAS            9.10          9.53          9.02              9.34       2305300       2147403800
 23/02/2022      ABEV3  AMBEV S/A           14.62         15.26         14.59             14.81      30107000       2147389240


In [28]:
maiores_numeros_negocios = maior_negocio(df_formatado, 5)
maiores_numeros_negocios

Unnamed: 0,data_pregao,sigla_acao,nome_acao,preco_fechamento,qtd_negocios
517297,09/03/2023,HAPV3,HAPVIDA,1.94,553080600
499778,09/11/2022,BBDC4,BRADESCO,15.35,499194800
136521,22/02/2021,PETR4,PETROBRAS,21.45,490230400
515239,01/03/2023,HAPV3,HAPVIDA,3.02,485994800
508786,01/02/2023,RAIZ4,RAIZEN,3.15,404695000


In [29]:
def encontrar_maior_variacao_percentual(df):
    # Ordenar o DataFrame pela coluna 'data_pregao' em ordem crescente
    df.sort_values('data_pregao', inplace=True)

    # Criar a coluna 'variacao_percentual'
    df['variacao_percentual'] = ((df['preco_fechamento'] - df['preco_abertura']) / df['preco_abertura']) * 100

    # Encontrar o índice da linha com a maior variação percentual
    indice_max_variacao = df['variacao_percentual'].idxmax()

    # Obter as informações da ação com a maior variação percentual
    acao_max_variacao = df.loc[indice_max_variacao, ['sigla_acao', 'nome_acao', 'variacao_percentual']]

    # Imprimir as informações da ação encontrada
    print("A ação com a maior variação percentual de preço de abertura para fechamento no período de 2020 a 2023 é:")
    print("Sigla da Ação:", acao_max_variacao['sigla_acao'])
    print("Nome da Ação:", acao_max_variacao['nome_acao'])
    print("Variação Percentual:", acao_max_variacao['variacao_percentual'])


In [30]:
encontrar_maior_variacao_percentual(df_formatado)

A ação com a maior variação percentual de preço de abertura para fechamento no período de 2020 a 2023 é:
Sigla da Ação: MERC3
Nome da Ação: MERC FINANC
Variação Percentual: 413.9334155363748


In [31]:
def encontrar_maiores_variacoes_percentuais(df, quantidade):
    # Ordenar o DataFrame pela coluna 'data_pregao' em ordem crescente
    df.sort_values('data_pregao', inplace=True)

    # Criar a coluna 'variacao_percentual'
    df['variacao_percentual'] = ((df['preco_fechamento'] - df['preco_abertura']) / df['preco_abertura']) * 100

    # Ordenar o DataFrame pela coluna 'variacao_percentual' em ordem decrescente
    df.sort_values('variacao_percentual', ascending=False, inplace=True)

    # Selecionar as 5 ações com maior variação percentual
    top_variacoes = df.head(quantidade)[['sigla_acao', 'nome_acao', 'variacao_percentual']]

    print(top_variacoes)

In [32]:
encontrar_maiores_variacoes_percentuais(df_formatado, 5)

       sigla_acao    nome_acao  variacao_percentual
50740       MERC3  MERC FINANC           413.933416
209609      SHUL3       SCHULZ           383.376736
139498      NORD3   NORDON MET           338.141470
210766      CPLE5        COPEL           253.139217
83466       DOHL3       DOHLER           134.666667


In [37]:
def encontrar_aumento_preco_fechamento(df, quantidade):
    # Ordenar o DataFrame pela coluna 'data_pregao' em ordem crescente
    df.sort_values('data_pregao', inplace=True)

    # Calcular a variação percentual de preço de fechamento em relação ao dia anterior
    df['variacao_percentual'] = ((df['preco_fechamento'] - df['preco_fechamento'].shift(1)) / df['preco_fechamento'].shift(1)) * 100

    # Selecionar as linhas em que a variação percentual é positiva
    aumento_preco_fechamento = df[df['variacao_percentual'] > 0][['sigla_acao', 'nome_acao']].head(quantidade)

    # Imprimir as informações das ações com aumento de preço de fechamento
    print("Ações com aumento percentual de preço de fechamento em relação ao dia anterior:")
    print(aumento_preco_fechamento)

In [38]:
encontrar_aumento_preco_fechamento(df_formatado, 5)

Ações com aumento percentual de preço de fechamento em relação ao dia anterior:
       sigla_acao     nome_acao
126448     VISA34      VISA INC
124772     A1TM34  ATMOS ENERGY
125805     N1TA34    NETAPP INC
125570     LILY34         LILLY
125231     D1IS34  DISH NETWORK


In [42]:
def encontrar_maiores_quedas(df):
    # Ordenar o DataFrame pela coluna 'data_pregao' em ordem crescente
    df.sort_values('data_pregao', inplace=True)

    # Calcular a variação percentual de preço de fechamento em relação ao dia anterior
    df['variacao_percentual'] = ((df['preco_fechamento'] - df['preco_fechamento'].shift(1)) / df['preco_fechamento'].shift(1)) * 100

    # Agrupar o DataFrame por 'sigla_acao' e encontrar os índices dos dias de maior queda percentual para cada ação
    indices_maiores_quedas = df.groupby('sigla_acao')['variacao_percentual'].idxmin()

    # Selecionar as linhas correspondentes aos índices encontrados
    maiores_quedas = df.loc[indices_maiores_quedas, ['sigla_acao', 'nome_acao', 'data_pregao', 'variacao_percentual']].head()
    
    # Imprimir as informações dos dias de maior queda percentual
    print("Dias de maior queda percentual para cada ação:")
    print(maiores_quedas)

In [43]:
encontrar_maiores_quedas(df_formatado)

Dias de maior queda percentual para cada ação:
       sigla_acao     nome_acao data_pregao  variacao_percentual
108261     A1AP34  ADVANCE AUTO  09/12/2020           -97.248077
216638     A1BB34       ABB LTD  26/11/2021           -97.486642
216652     A1BM34   ABIOMED INC  15/07/2021           -89.062530
216995     A1CR34     AMCOR PLC  30/12/2021           -98.495774
108272     A1DI34  ANALOG DEVIC  04/12/2020           -79.092195


In [44]:
def calcular_volume_medio(df):
    # Calcular o volume médio de negociação por dia
    volume_medio = df['volume_negocios'].mean()
    
    # Imprimir o volume médio de negociação por dia
    print("Volume médio de negociação por dia:")
    print(volume_medio)

In [45]:
calcular_volume_medio(df_formatado)

Volume médio de negociação por dia:
108490072.85645308


In [50]:
def encontrar_acoes_acima_da_media(df):
    # Calcular o número médio de negócios por ação
    media_negocios = df.groupby('sigla_acao')['qtd_negocios'].mean()

    # Selecionar as ações com número de negócios acima da média
    acoes_acima_da_media = media_negocios[media_negocios > media_negocios.mean()].head()

    # Imprimir as ações com número de negócios acima da média
    print("Ações com número de negócios acima da média:")
    print(acoes_acima_da_media.to_string(index=True))

In [51]:
encontrar_acoes_acima_da_media(df_formatado)

Ações com número de negócios acima da média:
sigla_acao
ABEV3    2.737395e+07
AERI3    4.123553e+06
AESB3    1.722754e+06
ALPA4    3.373275e+06
ALSO3    2.040063e+06
