In [20]:
import openpyxl
import pandas as pd

pd.set_option('display.max_colwidth', None)  # None para largura ilimitada
pd.set_option('display.width', None)

def table(excelname, sheetname):
    workbook = openpyxl.load_workbook(excelname + '.xlsx', data_only=True)
    sheet = workbook[sheetname]

    dados_filtrados = []
    cabecalhos = []
    num_colunas = 11

    # Ler APENAS os 11 primeiros cabeçalhos da primeira linha
    for i in range(1, num_colunas + 1):
        cabecalho = sheet.cell(row=1, column=i).value
        cabecalhos.append(cabecalho)

    print(f"Número de cabeçalhos lidos: {len(cabecalhos)}")
    print(f"Cabeçalhos: {cabecalhos}")

    # Ler os dados a partir da segunda linha até a linha 45391 e filtrar
    for linha_num in range(2, 45392):
        linha_dados = []
        for coluna in range(1, num_colunas + 1):  # Colunas de 1 (A) a 11 (K)
            celula = sheet.cell(row=linha_num, column=coluna)
            linha_dados.append(celula.value)

        if len(linha_dados) == num_colunas:
            dados_filtrados.append(linha_dados)

    return cabecalhos, dados_filtrados

excelname = 'ROI_v2'
sheetname = 'BASE'  
cabecalhos, dados_filtrados = table(excelname, sheetname)

if dados_filtrados:
    try:
        df = pd.DataFrame(dados_filtrados, columns=cabecalhos)
        print("\nDataFrame criado com as linhas filtradas:")
        print(df)

        # Formatar colunas de venda para moeda
        colunas_venda = ['VENDAS LT', 'VENDAS VALOR R$', 'R$ INV.']
        for col in colunas_venda:
            if col in df.columns:
                # Formata para moeda com 2 casas decimais
                # Usando um formato de string mais direto
                df[col] = df[col].apply(lambda x: "{:,.2f}".format(x) if pd.notnull(x) else '')

        print("\nDataFrame com formatação de moeda nas colunas de venda:")
        print(df.head())

        # Tenta converter colunas para datetime, se aplicável
        for col in df.columns:
            try:
                df[col] = pd.to_datetime(df[col])
            except (ValueError, TypeError):
                pass 

        
        data_columns = ['PERÍODO'] 
        for col in data_columns:
            if col in df.columns:
                df[col] = df[col].dt.strftime('%d/%m/%Y') 
        print("\nDataFrame com formatação de data (se aplicável):")
        print(df)

    except ValueError as e:
        print(f"\nErro ao criar o DataFrame com os dados filtrados: {e}")
        print(f"Número de cabeçalhos: {len(cabecalhos)}")
        if dados_filtrados:
            print(f"Número de colunas na primeira linha dos dados filtrados: {len(dados_filtrados[0])}")

  ws_parser.bind_all()


Número de cabeçalhos lidos: 11
Cabeçalhos: ['UF/ÁREA', 'FAMÍLIA', 'PERÍODO', 'VENDAS LT', 'VENDAS VALOR R$', 'SHARE VOLUME', 'SHARE VALOR', 'DISTRIBUIÇÃO NUMÉRICA', 'R$ INV.', 'SEGMENTO', 'ANO MÓVEL']

DataFrame criado com as linhas filtradas:
      UF/ÁREA     FAMÍLIA    PERÍODO    VENDAS LT  VENDAS VALOR R$  \
0          AL      AMSTEL 2018-01-01  139432.7265     1.460088e+06   
1          AL      AMSTEL 2018-02-01   78649.5055     1.448213e+06   
2          AL      AMSTEL 2018-03-01   82657.5689     1.614080e+06   
3          AL      AMSTEL 2018-04-01  127809.4865     1.455399e+06   
4          AL      AMSTEL 2018-05-01   88741.5835     1.243698e+06   
...       ...         ...        ...          ...              ...   
45385   T. BR      SPATEN 2025-01-01  142210.4879     8.401553e+05   
45386   T. BR  T. CERVEJA 2024-12-01  102025.7758     1.658170e+06   
45387   T. BR  T. CERVEJA 2025-01-01   75669.9097     1.488175e+06   
45388   T. BR       TIGER 2024-12-01  106943.3810     1.