In [10]:
import os
import pandas as pd
import lxml.etree as ET

# Pasta com os arquivos XML
pasta = 'C:\\Pasta Origem\\Teste_xml\\'

# Lista para armazenar os dados de todos os arquivos
dados = []

# Função para extrair texto de um elemento ou retornar None
def extrair_texto(elemento, tag):
    encontrado = elemento.find(tag)
    return encontrado.text if encontrado is not None else None

# Iterar sobre todos os arquivos na pasta
for arquivo in os.listdir(pasta):
    if arquivo.lower().endswith('.xml'):
        # Carregar o arquivo XML
        tree = ET.parse(os.path.join(pasta, arquivo))
        root = tree.getroot()

        # Informações Básicas
        cnfe = root.find('.//{http://www.portalfiscal.inf.br/nfe}infProt') 
        chave = extrair_texto(cnfe, '{http://www.portalfiscal.inf.br/nfe}chNFe')
           
        basico = root.find('.//{http://www.portalfiscal.inf.br/nfe}ide')        
        numero = extrair_texto(basico, '{http://www.portalfiscal.inf.br/nfe}nNF')
        serie = extrair_texto(basico, '{http://www.portalfiscal.inf.br/nfe}serie')
        data_emissao = extrair_texto(basico, '{http://www.portalfiscal.inf.br/nfe}dhEmi')
        finalidade = extrair_texto(basico, '{http://www.portalfiscal.inf.br/nfe}finNFe')
        nfref = basico.find('{http://www.portalfiscal.inf.br/nfe}NFref')
        refnfe = extrair_texto(nfref, '{http://www.portalfiscal.inf.br/nfe}refNFe') if nfref is not None else None
        
        # Emitente
        emitente = root.find('.//{http://www.portalfiscal.inf.br/nfe}emit')
        cnpj_emitente = extrair_texto(emitente, '{http://www.portalfiscal.inf.br/nfe}CNPJ')
        razao_social_emitente = extrair_texto(emitente, '{http://www.portalfiscal.inf.br/nfe}xNome')
        
        # Se não houver CNPJ, verifique se há CPF
        if cnpj_emitente is None:
            cnpj_emitente = extrair_texto(emitente, '{http://www.portalfiscal.inf.br/nfe}CPF')

        # Destinatário
        destinatario = root.find('.//{http://www.portalfiscal.inf.br/nfe}dest')
        cnpj_destinatario = extrair_texto(destinatario, '{http://www.portalfiscal.inf.br/nfe}CNPJ')
        razao_social_destinatario = extrair_texto(destinatario, '{http://www.portalfiscal.inf.br/nfe}xNome')

        # Produtos
        produtos = root.findall('.//{http://www.portalfiscal.inf.br/nfe}prod')
        for produto in produtos:
            descricao_produto = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}xProd')
            valor_total_produto = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}vProd')
            cfop = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}CFOP')
            unidade_comercial = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}uCom')
            valor_unidade_comercial = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}vUnCom')
            quantidade_comercial = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}qCom')
            unidade_tributaria = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}uTrib')
            valor_unidade_tributaria = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}vUnTrib')
            quantidade_tributaria = extrair_texto(produto, '{http://www.portalfiscal.inf.br/nfe}qTrib')

            # Impostos
            imposto = produto.find('../{http://www.portalfiscal.inf.br/nfe}imposto')
            cst = None
            if imposto is not None:
                icms = imposto.find('{http://www.portalfiscal.inf.br/nfe}ICMS')
                if icms is not None:
                    if icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS51') is not None:
                        cst = extrair_texto(icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS51'), '{http://www.portalfiscal.inf.br/nfe}CST')
                    elif icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS40') is not None:
                        cst = extrair_texto(icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS40'), '{http://www.portalfiscal.inf.br/nfe}CST')
                    elif icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS00') is not None:
                        cst = extrair_texto(icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS00'), '{http://www.portalfiscal.inf.br/nfe}CST')
                    elif icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS60') is not None:
                        cst = extrair_texto(icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS60'), '{http://www.portalfiscal.inf.br/nfe}CST')
                    elif icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS10') is not None:
                        cst = extrair_texto(icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS10'), '{http://www.portalfiscal.inf.br/nfe}CST')
                    elif icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS90') is not None:
                        cst = extrair_texto(icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS90'), '{http://www.portalfiscal.inf.br/nfe}CST')          
                    elif icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS20') is not None:
                        cst = extrair_texto(icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS20'), '{http://www.portalfiscal.inf.br/nfe}CST')
                    elif icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS61') is not None:
                        cst = extrair_texto(icms.find('{http://www.portalfiscal.inf.br/nfe}ICMS61'), '{http://www.portalfiscal.inf.br/nfe}CST')
                    else:
                        cst = None

                # Adicionando a extração do PIS e Cofins
                pis = imposto.find('{http://www.portalfiscal.inf.br/nfe}PIS')
                if pis is not None:
                    if pis.find('{http://www.portalfiscal.inf.br/nfe}PISNT') is not None:
                        cst_pis = extrair_texto(pis.find('{http://www.portalfiscal.inf.br/nfe}PISNT'),  '{http://www.portalfiscal.inf.br/nfe}CST')
                    elif pis.find('{http://www.portalfiscal.inf.br/nfe}PISOutr') is not None:
                        cst_pis = extrair_texto(pis.find('{http://www.portalfiscal.inf.br/nfe}PISOutr'),  '{http://www.portalfiscal.inf.br/nfe}CST')
                    elif pis.find('{http://www.portalfiscal.inf.br/nfe}PISAliq') is not None:
                        cst_pis = extrair_texto(pis.find('{http://www.portalfiscal.inf.br/nfe}PISAliq'),  '{http://www.portalfiscal.inf.br/nfe}CST')
                    else:
                        cst = None

            else:
                print(f"Imposto não encontrado para o produto: {descricao_produto}")
            # Adicionar as informações à lista de dados
            dados.append({
                'Número': numero,
                'Série': serie,
                'Data de emissão': data_emissao,
                'Finalidade': finalidade,
                'Chave': chave,
                'CNPJ do emitente': cnpj_emitente,
                'Razão social do emitente': razao_social_emitente,
                'CNPJ do destinatário': cnpj_destinatario,
                'Razão social do destinatário': razao_social_destinatario,
                'CFOP': cfop,
                'CST-ICMS': cst,
                'Descrição do produto': descricao_produto,
                'Unidade Comercial': unidade_comercial,
                'Unidade Tributária': unidade_tributaria,               
                'Valor Unitário Com.': valor_unidade_comercial,
                'Valor Unitário Trib.': valor_unidade_tributaria,
                'Quantidade Com.': quantidade_comercial,
                'Quantidade Trib.': quantidade_tributaria,            
                'Valor total do produto': valor_total_produto,
                'CST-Pis/Cofins': cst_pis,
                'Nota referenciada': refnfe
            })

# Converter a lista de dados para um DataFrame do pandas
df = pd.DataFrame(dados)

# Escrever o DataFrame em um arquivo Excel
output_path = 'C:\\Pasta Destino\\Teste_xml\\nota_fiscal_info.xlsx'
df.to_excel(output_path, index=False)

# Exibir uma mensagem de sucesso
print(f"As informações foram gravadas com sucesso no arquivo {output_path}")


In [None]:
print(df)