In [7]:
#Importando biblioteca
import pandas as pd
import numpy as np
from tabulate import tabulate

In [3]:
#Carregando as bases
ano1 = 'COTAHIST_A2021.TXT'
ano2 = 'COTAHIST_A2022.TXT'
ano3 = 'COTAHIST_A2023.TXT'

In [5]:
# Especificar as larguras das colunas
colspecs = [
    (0, 2),      # Tipo de registro
    (2, 10),     # Data do pregão
    (10, 12),    # Código BDI
    (12, 24),    # Código de negociação do papel
    (24, 27),    # Tipo de mercado
    (27, 39),    # Nome da empresa
    (39, 49),    # Especificação do papel (ON/PN)
    (49, 52),    # Prazo em dias do mercado a termo
    (52, 56),    # Moeda de referência
    (56, 69),    # Preço de abertura
    (69, 82),    # Preço máximo
    (82, 95),    # Preço mínimo
    (95, 108),   # Preço médio
    (108, 121),  # Preço de fechamento
    (121, 134),  # Preço do melhor negócio do dia
    (134, 147),  # Preço de fechamento anterior
    (147, 152),  # Preço de abertura de exercício de opções de compra
    (152, 170),  # Quantidade de negócios
    (170, 188),  # Volume total dos negócios
    (188, 200),  # ISIN do ativo
]

# Nomes das colunas correspondentes
colnames = [
    'Tipo de Registro',
    'Data do Pregão',
    'Código BDI',
    'Código de Negociação',
    'Tipo de Mercado',
    'Nome da Empresa',
    'Especificação do Papel',
    'Prazo em Dias do Mercado a Termo',
    'Moeda de Referência',
    'Preço de Abertura',
    'Preço Máximo',
    'Preço Mínimo',
    'Preço Médio',
    'Preço de Fechamento',
    'Preço do Melhor Negócio do Dia',
    'Preço de Fechamento Anterior',
    'Preço de Abertura de Exercício de Opções de Compra',
    'Quantidade de Negócios',
    'Volume Total dos Negócios',
    'ISIN do Ativo'
]

In [6]:
# Carregar os arquivos .txt em DataFrames
df_1 = pd.read_fwf(ano1, colspecs=colspecs, names=colnames)
df_2 = pd.read_fwf(ano2, colspecs=colspecs, names=colnames)
df_3 = pd.read_fwf(ano3, colspecs=colspecs, names=colnames)

In [8]:
# Remover a primeira linha
df_1 = df_1.drop(index=0).reset_index(drop=True)
df_2 = df_2.drop(index=0).reset_index(drop=True)
df_3 = df_3.drop(index=0).reset_index(drop=True)    

In [9]:
# Selecionar as colunas específicas
colunas_selecionadas = [
    'Data do Pregão',
    'Código de Negociação',
    'Nome da Empresa',
    'Moeda de Referência',
    'Preço de Abertura',
    'Preço Máximo',
    'Preço Mínimo',
    'Preço Médio',
    'Preço de Fechamento',
    'Preço de Fechamento Anterior',
    'Quantidade de Negócios',
    'Volume Total dos Negócios'
]

In [10]:
df_1 = df_1[colunas_selecionadas]
df_2 = df_2[colunas_selecionadas]
df_3 = df_3[colunas_selecionadas]


In [11]:
# Concatenar os DataFrames
df_concatenado = pd.concat([df_1, df_2, df_3], ignore_index=True)


In [12]:
# Exibir as primeiras linhas do DataFrame concatenado
print(tabulate(df_concatenado.head(), headers='keys', tablefmt='pretty'))


+---+----------------+----------------------+-----------------+---------------------+-------------------+--------------+--------------+-------------+---------------------+------------------------------+------------------------+---------------------------+
|   | Data do Pregão | Código de Negociação | Nome da Empresa | Moeda de Referência | Preço de Abertura | Preço Máximo | Preço Mínimo | Preço Médio | Preço de Fechamento | Preço de Fechamento Anterior | Quantidade de Negócios | Volume Total dos Negócios |
+---+----------------+----------------------+-----------------+---------------------+-------------------+--------------+--------------+-------------+---------------------+------------------------------+------------------------+---------------------------+
| 0 |    20210104    |        A1AP34        |  ADVANCE AUTO   |         R$          |      5110.0       |    5203.0    |    5062.0    |   5191.0    |       5190.0        |            6132.0            |         6420.0         |     

In [13]:
# Exibir o número de linhas e colunas do DataFrame concatenado
print(f"Quantidade de linhas: {df_concatenado.shape[0]}")
print(f"Quantidade de colunas: {df_concatenado.shape[1]}")

Quantidade de linhas: 6206729
Quantidade de colunas: 12


In [14]:
# Salvar o DataFrame concatenado em um arquivo CSV
df_concatenado.to_csv('dados_concatenados.csv', index=False)