In [4]:
import pandas as pd
from tabulate import tabulate

In [5]:
ano1 = 'COTAHIST_A2021.TXT'
ano2 = 'COTAHIST_A2022.TXT'
ano3 = 'COTAHIST_A2023.TXT'

In [6]:
# Especificar as larguras das colunas
colspecs = [
    (0, 2),      # Tipo de registro
    (2, 10),     # Data do pregão
    (10, 12),    # Código BDI
    (12, 24),    # Código de negociação do papel
    (24, 27),    # Tipo de mercado
    (27, 39),    # Nome da empresa
    (39, 49),    # Especificação do papel (ON/PN)
    (49, 52),    # Prazo em dias do mercado a termo
    (52, 56),    # Moeda de referência
    (56, 69),    # Preço de abertura
    (69, 82),    # Preço máximo
    (82, 95),    # Preço mínimo
    (95, 108),   # Preço médio
    (108, 121),  # Preço de fechamento
    (121, 134),  # Preço do melhor negócio do dia
    (134, 147),  # Preço de fechamento anterior
    (147, 152),  # Preço de abertura de exercício de opções de compra
    (152, 170),  # Quantidade de negócios
    (170, 188),  # Volume total dos negócios
    (188, 200),  # ISIN do ativo
]

# Nomes das colunas correspondentes
colnames = [
    'Tipo de Registro',
    'Data do Pregão',
    'Código BDI',
    'Código de Negociação',
    'Tipo de Mercado',
    'Nome da Empresa',
    'Especificação do Papel',
    'Prazo em Dias do Mercado a Termo',
    'Moeda de Referência',
    'Preço de Abertura',
    'Preço Máximo',
    'Preço Mínimo',
    'Preço Médio',
    'Preço de Fechamento',
    'Preço do Melhor Negócio do Dia',
    'Preço de Fechamento Anterior',
    'Preço de Abertura de Exercício de Opções de Compra',
    'Quantidade de Negócios',
    'Volume Total dos Negócios',
    'ISIN do Ativo'
]


In [7]:
# Ler o arquivo .txt com larguras fixas
df_1 = pd.read_fwf(ano1, colspecs=colspecs, names=colnames)
df_2 = pd.read_fwf(ano2, colspecs=colspecs, names=colnames)
df_3 = pd.read_fwf(ano3, colspecs=colspecs, names=colnames)

In [8]:
#Obtendo os cabeçalho antes da exclusão
Hist2021 = 'Histórico BOVESPA 2021/12/30'
Hist2022 = 'Histórico BOVESPA 2022/12/29'
Hist2023 = 'Histórico BOVESPA 2023/12/28'


In [None]:
# Remover a primeira linha
df_1 = df_1.drop(index=0)
df_2 = df_2.drop(index=0)   
df_3 = df_3.drop(index=0)

# Resetar os índices após a remoção
df_1 = df_1.reset_index(drop=True)
df_2 = df_2.reset_index(drop=True)
df_3 = df_3.reset_index(drop=True)

In [9]:
# Obter o número de linhas e colunas
num_linhas = []
num_colunas = []

num_linhas.append(df_1.shape[0])
num_colunas.append(df_1.shape[1])

num_linhas.append(df_2.shape[0])
num_colunas.append(df_2.shape[1])

num_linhas.append(df_3.shape[0])
num_colunas.append(df_3.shape[1])

# Exibir o número de linhas e colunas
print(f"Quantidade de linhas 2021: {num_linhas[0]}\n"
      f"Quantidade de linhas 2022: {num_linhas[1]}\n"
      f"Quantidade de linhas 2023: {num_linhas[1]}\n")

print(f"Quantidade de colunas 2021: {num_colunas[0]}\n"
      f"Quantidade de colunas 2022: {num_colunas[1]}\n"
      f"Quantidade de colunas 2023: {num_colunas[2]}")

Quantidade de linhas 2021: 1831864
Quantidade de linhas 2022: 2117442
Quantidade de linhas 2023: 2117442

Quantidade de colunas 2021: 20
Quantidade de colunas 2022: 20
Quantidade de colunas 2023: 20


In [14]:
# Exibir apenas a primeira linha do DataFrame de forma formatada
print(tabulate(df_1.head(), headers='keys', tablefmt='pretty'))
print(tabulate(df_2.head(), headers='keys', tablefmt='pretty'))
print(tabulate(df_3.head(), headers='keys', tablefmt='pretty'))

+---+------------------+----------------+------------+----------------------+-----------------+-----------------+------------------------+----------------------------------+---------------------+-------------------+--------------+--------------+-------------+---------------------+--------------------------------+------------------------------+----------------------------------------------------+------------------------+---------------------------+---------------+
|   | Tipo de Registro | Data do Pregão | Código BDI | Código de Negociação | Tipo de Mercado | Nome da Empresa | Especificação do Papel | Prazo em Dias do Mercado a Termo | Moeda de Referência | Preço de Abertura | Preço Máximo | Preço Mínimo | Preço Médio | Preço de Fechamento | Preço do Melhor Negócio do Dia | Preço de Fechamento Anterior | Preço de Abertura de Exercício de Opções de Compra | Quantidade de Negócios | Volume Total dos Negócios | ISIN do Ativo |
+---+------------------+----------------+------------+----------