In [13]:
import xmltodict
from pathlib import Path
import pandas as pd

def ler_xml_danfe(nota: Path) -> dict:
    with open(nota, 'rb') as arquivo: # rb = ler em binário
        documento = xmltodict.parse(arquivo)['nfeProc']['NFe']['infNFe']

    valor_total       = documento['total']['ICMSTot']['vNF']
    cnpj_vendeu       = documento['emit']['CNPJ']
    nome_vendeu       = documento['emit']['xNome']
    documento_comprou = documento['dest']['CPF']
    nome_comprou      = documento['dest']['xNome']
    lista_produtos    = [(produto['prod']['xProd'], produto['prod']['vProd']) for produto in documento['det']]

    resposta = {
        'valor_total'      : [valor_total],
        'cnpj_vendeu'      : [cnpj_vendeu],
        'nome_vendeu'      : [nome_vendeu],
        'documento_comprou': [documento_comprou],
        'nome_comprou'     : [nome_comprou],
        'lista_produtos'   : [lista_produtos],
    }

    return resposta


def ler_xml_servico(nota: Path) -> dict:
    with open(nota, 'rb') as arquivo: # rb = ler em binário
        documento = xmltodict.parse(arquivo)['ConsultarNfseResposta']['ListaNfse']['CompNfse']['Nfse']['InfNfse']

    valor_total       = documento['Servico']['Valores']['ValorServicos']
    cnpj_vendeu       = documento['PrestadorServico']['IdentificacaoPrestador']['Cnpj']
    nome_vendeu       = documento['PrestadorServico']['RazaoSocial']
    documento_comprou = documento['TomadorServico']['IdentificacaoTomador']['CpfCnpj']['Cnpj']
    nome_comprou      = documento['TomadorServico']['RazaoSocial']
    lista_produtos    = documento['Servico']['Discriminacao']

    resposta = {
        'valor_total'      : [valor_total],
        'cnpj_vendeu'      : [cnpj_vendeu],
        'nome_vendeu'      : [nome_vendeu],
        'documento_comprou': [documento_comprou],
        'nome_comprou'     : [nome_comprou],
        'lista_produtos'   : [lista_produtos],
    }

    return resposta

CAMINHO_REFERENCIA = Path('./Python txt e PDF 08 - Dados')
for file in CAMINHO_REFERENCIA.iterdir():
    if file.suffix == '.xml':
        if 'DANFE' in file.name.upper():
            resposta = ler_xml_danfe(file)
        else:
            resposta = ler_xml_servico(file)

        tabela = pd.DataFrame.from_dict(resposta)
        display(tabela)
        tabela.to_excel(CAMINHO_REFERENCIA.joinpath(f'NF-{file.name.removesuffix(file.suffix)}.xlsx'))




Unnamed: 0,valor_total,cnpj_vendeu,nome_vendeu,documento_comprou,nome_comprou,lista_produtos
0,374.17,36882195000279,BROTA COMPANY COMERCIO DE PLANTAS LTDA,10000000000,Lira da Hashtag,"[(b.box led, 389.00), (Tomilho Serpilho, 10.00..."


Unnamed: 0,valor_total,cnpj_vendeu,nome_vendeu,documento_comprou,nome_comprou,lista_produtos
0,849.0,60409075055054,NESTLE BRASIL LTDA,11122233344,Lira da Hashtag,"[(ESSENZA Mini C30 Metal 110V, 534.82), (NOMAD..."


Unnamed: 0,valor_total,cnpj_vendeu,nome_vendeu,documento_comprou,nome_comprou,lista_produtos
0,4500,30000000000101,LIRA BOLADO NO XML,26344392000108,HASHTAG TREINAMENTOS LTDA,Nota referente aos serviços realizados no mês ...
