# Bovespa - Análise das ações

In [3]:
import pandas as pd
import os
import numpy as np
pd.set_option('display.float_format', '{:.2f}'.format)

diretorio_base = os.getcwd()
pasta = "arquivos\\"

In [4]:
def ler_arquivos(caminho, nome_arquivo, ano_arquivo, tipo_arquivo):
    _file = f'{caminho}{nome_arquivo}{ano_arquivo}.{tipo_arquivo}'

    colunas_desejadas = [
        (2,10),
        (10,12),
        (12,24),
        (27,39),
        (56, 69),
        (69, 82),
        (82, 95),
        (108, 121),
        (152, 170),
        (170, 188)
                        ]

    nome_colunas = ['data_pregao', 'codbdi', 'sigla_acao', 'nome_acao', 'preco_abertura', 'preco_max', 'preco_min', 'preco_fechamento', 'qtd_negocios', 'volume_negocios']

    df = pd.read_fwf(_file, colspecs=colunas_desejadas, names=nome_colunas, skiprows=1)
    return df
    

In [5]:
def filtrar_stocks(df):
    df = df[df['codbdi'] == 2]
    df = df.drop(['codbdi'], axis=1)
    return df

In [6]:
def ajustar_data(df):
    df['data_pregao'] = pd.to_datetime(df['data_pregao']).dt.date
    return df

In [7]:
def ajustar_valores(df):
    colunas_valores = df.select_dtypes(include=['number']).columns
    for col_val in colunas_valores:
        df[col_val] = (df[col_val] / 100).astype(float)

    return df

In [8]:
def concat_arquivos(caminho, nome_arquivo, ano_arquivo, tipo_arquivo, arquivo_final):
    for i, y in enumerate(ano_arquivo):
        df = ler_arquivos(caminho, nome_arquivo, y, tipo_arquivo)
        df = filtrar_stocks(df)
        df = ajustar_data(df)
        df = ajustar_valores(df)

        if i  == 0:
            df_final = df
        else:
            df_final = pd.concat([df_final, df])

    df_final.to_csv(f'{caminho}//{arquivo_final}', index=False)

In [9]:
year_date = ['2022', '2023', '2024']

path = os.path.join(diretorio_base, pasta)

name_file = 'COTAHIST_A'

type_file = 'txt'

final_file = 'all_bovespa.csv'

concat_arquivos(path, name_file, year_date, type_file, final_file)
