In [3]:
import pandas as pd

In [4]:
FIELD_SIZES = {
    'TIPO_DE_REGISTRO': 2,
    'DATA_DO_PREGAO': 8,
    'CODIGO_BDI': 2,
    'CODIGO_DE_NEGOCIACAO': 12,
    'TIPO_DE_MERCADO': 3,
    'NOME_DA_EMPRESA': 12,
    'ESPECIFICACAO_DO_PAPEL': 10,
    'PRAZO_EM_DIAS_DO_MERCADO_A_TERMO': 3,
    'MOEDA_DE_REFERENCIA': 4,
    'PRECO_DE_ABERTURA': 13,
    'PRECO_MAXIMO': 13,
    'PRECO_MINIMO': 13,
    'PRECO_MEDIO': 13,
    'PRECO_ULTIMO_NEGOCIO': 13,
    'PRECO_MELHOR_OFERTA_DE_COMPRA': 13,
    'PRECO_MELHOR_OFERTA_DE_VENDAS': 13,
    'NUMERO_DE_NEGOCIOS': 5,
    'QUANTIDADE_NEGOCIADA': 18,
    'VOLUME_TOTAL_NEGOCIADO': 18,
    'PRECO_DE_EXERCICIO': 13,
    'INDICADOR_DE_CORRECAO_DE_PRECOS': 1,
    'DATA_DE_VENCIMENTO': 8,
    'FATOR_DE_COTACAO': 7,
    'PRECO_DE_EXERCICIO_EM_PONTOS': 13,
    'CODIGO_ISIN': 12,
    'NUMERO_DE_DISTRIBUICAO': 3
}

DATE_COLUMNS = (
    "DATA_DO_PREGAO",
    "DATA_DE_VENCIMENTO"
)

FLOAT32_COLUMNS = (
    'PRECO_DE_ABERTURA',
    'PRECO_MAXIMO',
    'PRECO_MINIMO',
    'PRECO_MEDIO',
    'PRECO_ULTIMO_NEGOCIO',
    'PRECO_MELHOR_OFERTA_DE_COMPRA',
    'PRECO_MELHOR_OFERTA_DE_VENDAS',
    'PRECO_DE_EXERCICIO',
    'PRECO_DE_EXERCICIO_EM_PONTOS',    
)

FLOAT64_COLUMNS = (
    "VOLUME_TOTAL_NEGOCIADO",
    "QUANTIDADE_NEGOCIADA"
)

UINT32_COLUMNS = (
    "FATOR_DE_COTACAO",
    "PRAZO_EM_DIAS_DO_MERCADO_A_TERMO",
    "NUMERO_DE_NEGOCIOS",
    "NUMERO_DE_DISTRIBUICAO",
    'TIPO_DE_REGISTRO', 
)

STRING_COLUMNS = (
    "CODIGO_DE_NEGOCIACAO",
    "NOME_DA_EMPRESA",
    "CODIGO_ISIN"
)

CATEGORY_COLUMNS = (
    "INDICADOR_DE_CORRECAO_DE_PRECOS", 
    'TIPO_DE_MERCADO', 
    'CODIGO_BDI', 
    "MOEDA_DE_REFERENCIA",
    "ESPECIFICACAO_DO_PAPEL"
)

MARKETS = {
    '010':'VISTA',
    '012':'EXERCICIO_DE_OPCOES_DE_COMPRA',
    '013':'EXERCÍCIO_DE_OPCOES_DE_VENDA',
    '017':'LEILAO',
    '020':'FRACIONARIO',
    '030':'TERMO',
    '050':'FUTURO_COM_RETENCAO_DE_GANHO',
    '060':'FUTURO_COM_MOVIMENTACAO_CONTINUA',
    '070':'OPCOES_DE_COMPRA',
    '080':'OPCOES_DE_VENDA'
}

INDOPC = {
    '0':'0',
    '1':'US$',
    '2':"TJLP",
    '8':"IGPM",
    '9':"URV"
}

CODBDI = {
    '00':'0',
    '02':"LOTE_PADRAO",
    '05':"SANCIONADAS PELOS REGULAMENTOS BMFBOVESPA",
    '06':"CONCORDATARIAS",
    '07':"RECUPERACAO_EXTRAJUDICIAL",
    '08':"RECUPERAÇÃO_JUDICIAL",
    '09':"REGIME_DE_ADMINISTRACAO_ESPECIAL_TEMPORARIA",
    '10':"DIREITOS_E_RECIBOS",
    '11':"INTERVENCAO",
    '12':"FUNDOS_IMOBILIARIOS",
    '13':'13',
    '14':"CERT.INVEST/TIT.DIV.PUBLICA",
    '18':"OBRIGACÕES",
    '22':"BÔNUS(PRIVADOS)",
    '26':"APOLICES/BÔNUS/TITULOS PUBLICOS",
    '32':"EXERCICIO_DE_OPCOES_DE_COMPRA_DE_INDICES",
    '33':"EXERCICIO_DE_OPCOES_DE_VENDA_DE_INDICES",
    '34':'34',
    '35':'35',
    '36':'36',
    '37':'37',
    '38':"EXERCICIO_DE_OPCOES_DE_COMPRA",
    '42':"EXERCICIO_DE_OPCOES_DE_VENDA",
    '46':"LEILAO_DE_NAO_COTADOS",
    '48':"LEILAO_DE_PRIVATIZACAO",
    '49':"LEILAO_DO_FUNDO_RECUPERACAO_ECONOMICA_ESPIRITO_SANTO",
    '50':"LEILAO",
    '51':"LEILAO_FINOR",
    '52':"LEILAO_FINAM",
    '53':"LEILAO_FISET",
    '54':"LEILAO_DE_ACÕES_EM_MORA",
    '56':"VENDAS_POR_ALVARA_JUDICIAL",
    '58':"OUTROS",
    '60':"PERMUTA_POR_ACÕES",
    '61':"META",
    '62':"MERCADO_A_TERMO",
    '66':"DEBENTURES_COM_DATA_DE_VENCIMENTO_ATE_3_ANOS",
    '68':"DEBENTURES_COM_DATA_DE_VENCIMENTO_MAIOR_QUE_3_ANOS",
    '70':"FUTURO_COM_RETENCAO_DE_GANHOS",
    '71':"MERCADO_DE_FUTURO",
    '74':"OPCOES_DE_COMPRA_DE_INDICES",
    '75':"OPCOES_DE_VENDA_DE_INDICES",
    '78':"OPCOES_DE_COMPRA",
    '82':"OPCOES_DE_VENDA",
    '83':"BOVESPAFIX",
    '84':"SOMA_FIX",
    '90':"TERMO_VISTA_REGISTRADO",
    '96':"MERCADO_FRACIONARIO",
    '99':"TOTAL_GERAL"
}

In [5]:
file = 'COTAHIST_A2025.TXT'
df = pd.read_fwf(file, 
                 header=None,
                 names=list(FIELD_SIZES.keys()),
                 widths=list(FIELD_SIZES.values()),
                    encoding='latin1')[1:-1]

In [6]:
df["TIPO_DE_MERCADO"] = df["TIPO_DE_MERCADO"].apply(lambda x: MARKETS.get(x, x))
df["INDICADOR_DE_CORRECAO_DE_PRECOS"] = df["INDICADOR_DE_CORRECAO_DE_PRECOS"].apply(lambda x: INDOPC.get(x, x))
df["CODIGO_BDI"] = df["CODIGO_BDI"].apply(lambda x: CODBDI.get(x, x))
for col in FLOAT32_COLUMNS: df[col] = df[col].astype(float) / 100
for col in FLOAT64_COLUMNS: df[col] = df[col].astype(float)
for col in DATE_COLUMNS:            
    df[col] = df[col].apply(lambda x: pd.NaT if x == "99991231" else x )
    df[col] = pd.to_datetime(df[col])

In [9]:
df.columns

Index(['TIPO_DE_REGISTRO', 'DATA_DO_PREGAO', 'CODIGO_BDI',
       'CODIGO_DE_NEGOCIACAO', 'TIPO_DE_MERCADO', 'NOME_DA_EMPRESA',
       'ESPECIFICACAO_DO_PAPEL', 'PRAZO_EM_DIAS_DO_MERCADO_A_TERMO',
       'MOEDA_DE_REFERENCIA', 'PRECO_DE_ABERTURA', 'PRECO_MAXIMO',
       'PRECO_MINIMO', 'PRECO_MEDIO', 'PRECO_ULTIMO_NEGOCIO',
       'PRECO_MELHOR_OFERTA_DE_COMPRA', 'PRECO_MELHOR_OFERTA_DE_VENDAS',
       'NUMERO_DE_NEGOCIOS', 'QUANTIDADE_NEGOCIADA', 'VOLUME_TOTAL_NEGOCIADO',
       'PRECO_DE_EXERCICIO', 'INDICADOR_DE_CORRECAO_DE_PRECOS',
       'DATA_DE_VENCIMENTO', 'FATOR_DE_COTACAO',
       'PRECO_DE_EXERCICIO_EM_PONTOS', 'CODIGO_ISIN',
       'NUMERO_DE_DISTRIBUICAO'],
      dtype='object')

In [11]:
df

Unnamed: 0,TIPO_DE_REGISTRO,DATA_DO_PREGAO,CODIGO_BDI,CODIGO_DE_NEGOCIACAO,TIPO_DE_MERCADO,NOME_DA_EMPRESA,ESPECIFICACAO_DO_PAPEL,PRAZO_EM_DIAS_DO_MERCADO_A_TERMO,MOEDA_DE_REFERENCIA,PRECO_DE_ABERTURA,...,NUMERO_DE_NEGOCIOS,QUANTIDADE_NEGOCIADA,VOLUME_TOTAL_NEGOCIADO,PRECO_DE_EXERCICIO,INDICADOR_DE_CORRECAO_DE_PRECOS,DATA_DE_VENCIMENTO,FATOR_DE_COTACAO,PRECO_DE_EXERCICIO_EM_PONTOS,CODIGO_ISIN,NUMERO_DE_DISTRIBUICAO
1,1,2025-01-02,2.0,HYPE3,10,HYPERA,ON EDJ NM,,R$,17.87,...,9826.0,2512400.0,4.481908e+09,0.00,0.0,1970-01-01 00:00:00.099991231,1.0,0.0,BRHYPEACNOR0,145.0
2,1,2025-01-02,2.0,JALL3,10,JALLESMACHAD,ON NM,,R$,4.65,...,1550.0,573500.0,2.617241e+08,0.00,0.0,1970-01-01 00:00:00.099991231,1.0,0.0,BRJALLACNOR0,106.0
3,1,2025-01-02,2.0,JBSS3,10,JBS,ON NM,,R$,36.50,...,36937.0,8364400.0,3.066122e+10,0.00,0.0,1970-01-01 00:00:00.099991231,1.0,0.0,BRJBSSACNOR8,123.0
4,1,2025-01-02,2.0,MILS3,10,MILLS,ON EJ NM,,R$,8.42,...,3082.0,1048200.0,8.725361e+08,0.00,0.0,1970-01-01 00:00:00.099991231,1.0,0.0,BRMILSACNOR2,129.0
5,1,2025-01-02,2.0,KEPL3,10,KEPLER WEBER,ON NM,,R$,9.34,...,5238.0,1320700.0,1.219215e+09,0.00,0.0,1970-01-01 00:00:00.099991231,1.0,0.0,BRKEPLACNOR1,65.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
572418,1,2025-03-14,82.0,YDUQP139,80,YDUQE /AT,ON NM,0.0,R$,2.54,...,14.0,12000.0,3.039700e+06,13.96,0.0,1970-01-01 00:00:00.020250417,1.0,0.0,BRYDUQACNOR3,105.0
572419,1,2025-03-14,82.0,YDUQP149,80,YDUQE /AT,ON NM,0.0,R$,3.50,...,1.0,1500.0,5.250000e+05,14.96,0.0,1970-01-01 00:00:00.020250417,1.0,0.0,BRYDUQACNOR3,105.0
572420,1,2025-03-14,82.0,YDUQO113,80,YDUQE /AT,ON NM,0.0,R$,0.42,...,3.0,2100.0,8.990000e+04,11.31,0.0,1970-01-01 00:00:00.020250321,1.0,0.0,BRYDUQACNOR3,105.0
572421,1,2025-03-14,82.0,YDUQO103,80,YDUQE FM,ON NM,0.0,R$,0.14,...,51.0,77600.0,9.126000e+05,10.31,0.0,1970-01-01 00:00:00.020250321,1.0,0.0,BRYDUQACNOR3,105.0


In [12]:
df[(df['CODIGO_BDI'] == 2) & (df['NOME_DA_EMPRESA'] == "PETROBRAS")][['DATA_DO_PREGAO','CODIGO_DE_NEGOCIACAO', 'NOME_DA_EMPRESA', 'PRECO_DE_ABERTURA','PRECO_ULTIMO_NEGOCIO']]

Unnamed: 0,DATA_DO_PREGAO,CODIGO_DE_NEGOCIACAO,NOME_DA_EMPRESA,PRECO_DE_ABERTURA,PRECO_ULTIMO_NEGOCIO
222,2025-01-02,PETR3,PETROBRAS,39.55,40.52
223,2025-01-02,PETR4,PETROBRAS,36.42,36.77
1879,2025-01-03,PETR3,PETROBRAS,40.49,40.38
1880,2025-01-03,PETR4,PETROBRAS,36.88,36.38
3461,2025-01-06,PETR3,PETROBRAS,40.45,40.00
...,...,...,...,...,...
80752,2025-03-12,PETR4,PETROBRAS,34.16,34.10
82344,2025-03-13,PETR3,PETROBRAS,36.69,36.97
82345,2025-03-13,PETR4,PETROBRAS,34.18,34.44
83944,2025-03-14,PETR3,PETROBRAS,37.21,38.41
