## Importando as bibliotecas

In [2]:
from lxml import etree

### Começando em LXML

In [None]:
# Criando um elemento

elemento = etree.Element("Teste")
elemento.text = "Este é o texto da tag Teste"
print(etree.tostring(elemento))
print(elemento.tag)


b'<Teste>Este &#233; o texto da tag Teste</Teste>'
Teste


In [None]:
# Criando uma árvore de elementos

clientes = etree.Element("Clientes")
cliente1 = etree.SubElement(clientes, "Cliente")

nome1 = etree.SubElement(cliente1, "Nome")
nome1.text = "Bruno"

idade1 = etree.SubElement(cliente1, "Idade")
idade1.text = "25"

sexo1 = etree.SubElement(cliente1, "Sexo")
sexo1.text = "Masculino"

cpf1 = etree.SubElement(cliente1, "CPF")
cpf1.text = "123.456.789-00"

print(etree.tostring(clientes, pretty_print=True).decode("utf-8"))

<Clientes>
  <Cliente>
    <Nome>Brun&#243;</Nome>
    <Idade>25</Idade>
    <Sexo>Masculino</Sexo>
    <CPF>123.456.789-00</CPF>
  </Cliente>
</Clientes>



In [16]:
# Utilizando listas para criar múltiplos elementos

clientes = etree.Element("Clientes")

cliente1 = etree.SubElement(clientes, "Cliente1")
nome1 = etree.SubElement(cliente1, "Nome")
nome1.text = "Bruno"

cliente2 = etree.SubElement(clientes, "Cliente2")
nome1 = etree.SubElement(cliente2, "Nome")
nome1.text = "Jose"
clientes.append(cliente2)

cliente3 = etree.SubElement(clientes, "Cliente3")
nome1 = etree.SubElement(cliente3, "Nome")
nome1.text = "Joao"
clientes.append(cliente3)

# len(Element) -- retorna a quantidade de tags do objeto
print("Total de clientes:", len(clientes))

# Criando um objeto com base no segundo elemento
cliente_dois = clientes[1]

# Imprimindo a tag do elemento de índice 1
print("Tag clientes[1]:", cliente_dois.tag)

# Percorrendo o Element como uma lista
for x in clientes:
    print(x.tag)

print(etree.tostring(clientes, pretty_print=True).decode("utf-8"))

# Inserindo um elemento usando insert()
clientes.insert(0, etree.Element("cliente0"))
print(etree.tostring(clientes, pretty_print=True).decode("utf-8"))

# Fatiando a lista clientes, pegando os elementos da
# porque [1:3] não inclui o índice 3
fatia1 = clientes[1:3]
for x in fatia1:
    print(x.tag)

print(etree.tostring(clientes, pretty_print=True).decode("utf-8"))
# O elemento da posição 2 (cliente2) vai ser substituido
# pelo elemento da posição 1 cliente1, ficando apenas
# elementos 0, 1 e 3
clientes[2] = clientes[1]
print(etree.tostring(clientes, pretty_print=True).decode("utf-8"))

# Verifica se clientes é pai de clientes[1]
print(clientes is clientes[1].getparent())

Total de clientes: 3
Tag clientes[1]: Cliente2
Cliente1
Cliente2
Cliente3
<Clientes>
  <Cliente1>
    <Nome>Bruno</Nome>
  </Cliente1>
  <Cliente2>
    <Nome>Jose</Nome>
  </Cliente2>
  <Cliente3>
    <Nome>Joao</Nome>
  </Cliente3>
</Clientes>

<Clientes>
  <cliente0/>
  <Cliente1>
    <Nome>Bruno</Nome>
  </Cliente1>
  <Cliente2>
    <Nome>Jose</Nome>
  </Cliente2>
  <Cliente3>
    <Nome>Joao</Nome>
  </Cliente3>
</Clientes>

Cliente1
Cliente2
<Clientes>
  <cliente0/>
  <Cliente1>
    <Nome>Bruno</Nome>
  </Cliente1>
  <Cliente2>
    <Nome>Jose</Nome>
  </Cliente2>
  <Cliente3>
    <Nome>Joao</Nome>
  </Cliente3>
</Clientes>

<Clientes>
  <cliente0/>
  <Cliente1>
    <Nome>Bruno</Nome>
  </Cliente1>
  <Cliente3>
    <Nome>Joao</Nome>
  </Cliente3>
</Clientes>

True


In [25]:
# Como elementos XML aceitam atributos
# Você pode adicionar atributos como dicionários chave=valor
clientes = etree.Element("clientes", atributo = "valor")
cliente1 = etree.SubElement(clientes, "cliente1")
nome1 = etree.SubElement(cliente1, "nome")
nome1.text = "Bruno"

print(etree.tostring(clientes, pretty_print=True).decode("utf-8"))

# Adicionando um atributo denominado código com valor 1248
clientes.set("codigo", "1248")
print(etree.tostring(clientes, pretty_print=True).decode("utf-8"))

# Imprimindo o valor do atributo código
print(clientes.get("codigo"))

# Imprimindo os atributos de clientes (Element)
print(clientes.keys())

for atributo, valor in sorted(clientes.items()):
    print(f"{atributo} = {valor}")

# Pegando os atributos
atributos = clientes.attrib

print(atributos["codigo"])
print(atributos.get("atributo-inexistente"))

atributos["atributo"] = "Valor do atributo"
print(atributos["atributo"])
print(clientes.get("atributo"))

# Atributos podem ser copiados para dicionários
d = dict(clientes.attrib)
print(sorted(d.items()))



<clientes atributo="valor">
  <cliente1>
    <nome>Bruno</nome>
  </cliente1>
</clientes>

<clientes atributo="valor" codigo="1248">
  <cliente1>
    <nome>Bruno</nome>
  </cliente1>
</clientes>

1248
['atributo', 'codigo']
atributo = valor
codigo = 1248
1248
None
Valor do atributo
Valor do atributo
[('atributo', 'Valor do atributo'), ('codigo', '1248')]


### Ler arquivos `XML` com `lxml`

In [5]:
from lxml import etree

# funcionários será do tipo ElementTree com vários elementos
funcionarios = etree.parse("funcionarios.xml")

# Localizando a primeira ocorrência da tag funcionario
print(funcionarios.find("funcionario"))
# Localizando a primeira ocorrência da tag funcionario
print(funcionarios.getroot().find('funcionario'))
# Localizando todas ocorrências da tag funcionario
print(funcionarios.findall("funcionario"))

# Imprimindo o documento XML com getroot
print(etree.tostring(funcionarios.getroot(), pretty_print=True).decode("utf-8"))

# Copiando os Elements existentes no ElementTree
todos_funcionarios = funcionarios.findall("funcionario")

# Imprimindo quantos Elements encontrados
#print(len(todos_funcionarios))

for funcionario in todos_funcionarios:
    print("==========================")
    print("Tag:", funcionario.tag.strip())
    print("Text:", funcionario.text.strip())
    print("Tail:", funcionario.tail.strip())
    print("Attrib:", funcionario.attrib)

    for informacao in funcionario:
        print("**************************")
        print("Tag:", informacao.tag.strip())
        print("Text:", informacao.text.strip())
        print("Tail:", informacao.tail.strip())
        print("Attrib:", informacao.attrib)
        print("**************************")
    print("==========================")
"""
    Tag: Nome da Tag
    Text: Texto da Tag
    Tail: Texto após a Tag
    Attrib: Atributos
"""


<Element funcionario at 0x73a54e330b80>
<Element funcionario at 0x73a54e330b80>
[<Element funcionario at 0x73a54e330200>, <Element funcionario at 0x73a54e330640>]
<funcionarios>
   <funcionario departamento="TI">
      <nome>Evaldo Wolkers</nome>Texto ap&#243;s a tag nome
      <celular>(11)11111-11111</celular>
      <email>evaldowolkers@gmail.com</email>
   </funcionario>
   
   <funcionario departamento="ADM">
      <nome>Cleo Wolkers</nome>
      <celular>(11)11111-11112</celular>
      <email>cleowolkers@gmail.com</email>
   </funcionario>
</funcionarios>

Tag: funcionario
Text: 
Tail: 
Attrib: {'departamento': 'TI'}
**************************
Tag: nome
Text: Evaldo Wolkers
Tail: Texto após a tag nome
Attrib: {}
**************************
**************************
Tag: celular
Text: (11)11111-11111
Tail: 
Attrib: {}
**************************
**************************
Tag: email
Text: evaldowolkers@gmail.com
Tail: 
Attrib: {}
**************************
Tag: funcionario
Text: 
Ta

'\n    Tag: Nome da Tag\n    Text: Texto da Tag\n    Tail: Texto após a Tag\n    Attrib: Atributos\n'

## Desafio 1

In [2]:
from lxml import etree
import locale

"""
    Arquivo Ano-2017.xml baixado em:
    http://www2.camara.leg.br/transparencia/cota-para-exercicio-da-atividade-parlamentar/dados-abertos-cota-parlamentar
    http://www.camara.leg.br/cotas/Ano-2017.xml.zip
    
    Pegando despesas de um parlamentar especificado diretamente no código
    O objetivo deste exemplo é mostrar a facilidade de uso do lxml e sua velocidade
"""

def carregar_lista_deputados():
    dados = etree.parse("Ano-2017.xml") # CARREGA O ARQUIVO XML
    lista_despesas = dados.findall('DESPESAS') # GERA UM OBJETO LISTA COM VÁRIOS ELEMENTOS "DESPESAS"

    lista_deputados = [] # LISTA QUE VAI ARMAZENAR O NOME DOS DEPUTADOS
    for despesa in lista_despesas: # PERCORRENDO A LISTA DE ELEMENTOS "DESPESAS", OBTENDO UM OBJETO "DESPESAS" ESPECÍFICO
        for informacao in despesa: # NAVEGAR DENTRO DO OBJETO DESPESA
            registros = informacao.getchildren() # CARREGAR OS FILHOS DO OBJETO DESPESA
            deputado = registros[0].text # PEGANDO O NOME DO DEPUTADO QUE ESTÁ NO ELEMENTO txNomeParlamentar QUE POSSUI ÍNDICE ZERO
            if deputado not in lista_deputados: # SE O DEPUTADO LOCALIZADO NO ARQUIVO NÃO ESTIVER NA lista_deputados
                lista_deputados.append(deputado) # ADICIONAR O DEPUTADO ENCONTRADO

    return lista_deputados # ESTE MÉTODO RETORNA UM OBJETO LISTA COM OS NOMES DOS DEPUTADOS SEM REPETIÇÕES

def carregar_despesas(deputado):
    categorias = {} # CRIANDO DICIONÁRIO DE CATEGORIAS
    dados = etree.parse("Ano-2017.xml") # CARREGA O ARQUIVO XML
    todas_despesas = dados.findall("DESPESAS") # GERA UM OBJETO LISTA COM VÁRIOS ELEMENTOS "DESPESAS"
    for despesas in todas_despesas: # PERCORRENDO A LISTA DE ELEMENTOS "DESPESAS", OBTENDO UM OBJETO "DESPESAS" ESPECÍFICO
        for despesa in despesas: # NAVEGAR DENTRO DO OBJETO DESPESA
            desp = despesa.getchildren() # CARREGAR OS FILHOS DO OBJETO DESPESA
            if desp[0].text == deputado: # COMPARAR O NOME DO DEPUTADO DE txNomeParlamentar COM O NOME RECEBIDO POR PARÂMETRO
                if desp[18].tag == 'vlrLiquido':
                    categoria_despesa = desp[8].text # PEGAR O NOME DA CATEGORIA DA DESPESA
                    valor_despesa = desp[18].text # PEGAR O VALOR DA DESPESA

                    if "," not in valor_despesa: # SE NÃO TIVER VÍRGULA NO VALOR DA DESPESA
                        valor_despesa = valor_despesa + ",00" # ADICIONAR ",00"
                    valor_despesa = float(valor_despesa.replace(',','.')) # SUBSTITUIR A VÍRGULA POR PONTO E CONVERTER PARA FLOAT

                    if categoria_despesa in categorias: # SE A CATEGORIA DA DESPESA (txtDescricao) ESTIVER DENTRO DO DICIONÁRIO DE CATEGORIAS
                        categorias[categoria_despesa] = float(categorias[categoria_despesa]) + valor_despesa # SOMAR O VALOR DA DESPESA QUE ESTÁ NO DICIONÁRIO COM O NOVO valor_despesa
                    else:
                        categorias[categoria_despesa] = valor_despesa # SE A CATEGORIA DA DESPESA NÃO EXISTIR, CRIAR ESTA CHAVE NO DICIONÁRIO COM O VALOR DA DESPESA

    total_despesas = 0
    for chave, valor in categorias.items(): # PERCORRER OS ITENS DO DICIONÁRIO DE CATEGORIAS, PEGANDO CHAVE E VALOR
        total_despesas += valor # ACRESCENTAR AO todas_despesas O VALOR DA DESPESA
        locale.setlocale(locale.LC_ALL, 'pt_BR.UTF-8') # MUDAR A CONFIGURAÇÃO DE MOEDA, NÚMEROS, ETC PARA pt_BR
        valor = locale.currency(valor, grouping=True, symbol=None) # FORMATAR A VARIÁVEL valor COMO MOEDA, SEM SÍMBOLO (R$) E COLOCANDO O PONTO PARA MILHAR
        locale.setlocale(locale.LC_ALL, '') # RETORNANDO A CONFIGURAÇÃO PADRÃO DO SISTEMA
        print("Categoria:", chave, "- Valor:", valor) # IMPRIMINDO A CATEGORIA E TOTAL DAS DESPESAS

    # MUDANDO A CONFIGURAÇÃO PARA pt_BR
    locale.setlocale(locale.LC_ALL, 'pt_BR.UTF-8')
    # FORMATANDO O TOTAL DE DESPESAS
    total_despesas = locale.currency(total_despesas, grouping=True, symbol=None) 
    # RETORNANDO A CONFIGURAÇÃO PADRÃO DO SISTEMA
    locale.setlocale(locale.LC_ALL, '')

    # IMPRIMINDO O TOTAL DE DESPESAS FORMATADO
    print(f"Total despesas: {total_despesas}")


if __name__ == "__main__":
    lista_deputados = carregar_lista_deputados()

    while True:
        deputado = input("Informe o nome do deputado (ou 0 (zero) para sair): ").upper()
        if deputado == "0":
            break
        elif deputado in lista_deputados:
            carregar_despesas(deputado)
        else:
            input("Deputado não localizado! Pressione qualquer tecla ver a lista de deputados.")
            print(lista_deputados)

    print("---Obrigado por utilizar o sistema---")


['ABEL MESQUITA JR.', 'ADAIL CARNEIRO', 'ADALBERTO CAVALCANTI', 'ADELMO CARNEIRO LEAO', 'ADELSON BARRETO', 'ADEMIR CAMILO', 'ADERMIS MARINI', 'ADILTON SACHETTI', 'AELTON FREITAS', 'AFONSO FLORENCE', 'AFONSO HAMM', 'AFONSO MOTTA', 'AGUINALDO RIBEIRO', 'ALAN RICK', 'ALBERTO FILHO', 'ALBERTO FRAGA', 'ALCEU MOREIRA', 'ALESSANDRO MOLON', 'ALEX CANZIANI', 'ALEX MANENTE', 'ALEXANDRE BALDY', 'ALEXANDRE LEITE', 'ALEXANDRE SERFIOTIS', 'ALEXANDRE VALLE', 'ALFREDO KAEFER', 'ALFREDO NASCIMENTO', 'ALICE PORTUGAL', 'ALIEL MACHADO', 'ALTINEU CÔRTES', 'ALUISIO MENDES', 'ANA PERUGINI', 'ANDRE ABDON', 'ANDRE AMARAL', 'ANDRE DE PAULA', 'ANDRE FIGUEIREDO', 'ANDRE FUFUCA', 'ANDRE MOURA', 'ANDRES SANCHEZ', 'ANGELA ALBINO', 'ANGELIM', 'ANIBAL GOMES', 'ANTONIO BRITO', 'ANTONIO BULHÕES', 'ANTONIO CARLOS MENDES THAME', 'ANTONIO IMBASSAHY', 'ANTÔNIO JACOME', 'ARIOSTO HOLANDA', 'ARLINDO CHINAGLIA', 'ARNALDO FARIA DE SA', 'ARNALDO JORDY', 'AROLDE DE OLIVEIRA', 'ARTHUR LIRA', 'ARTHUR OLIVEIRA MAIA', 'ARTHUR VIRGILIO

## Desafio 2

In [None]:
from lxml import etree
import locale


# Carregar os dados das despesas para um dicionário
# A chave do dicionário terá o nome do deputado
def carregar_dados():
    dicionario_deputado = {} # Criando um dicionário vazio - Este dicionário vai conter vários dicionários
    tree = etree.parse("Ano-2017.xml") # Carregando o arquivo XML
    lista_despesas = tree.findall('DESPESAS') # Carregando uma lista de objetos DESPESAS
    for despesa in lista_despesas: # Carregando cada objeto DESPESAS
        for informacao in despesa: # Carregando cada objeto DESPESA
            propriedades = informacao.getchildren() # Carregando cada informação do objeto DESPESA
            if propriedades[18].tag == 'vlrLiquido': # Validando se o valor líquido existe no registro (alguns registros estão sem esta informação)
                nome = propriedades[0].text # Pegando o nome do deputado
                categoria = propriedades[8].text # Pegando a categoria da despesa
                valor_despesa = propriedades[18].text # Pegando o valor da despesa

                valor_despesa = float(valor_despesa.replace(',', '.'))

                if nome in dicionario_deputado: # Se já existe uma chave com o nome do deputado no dicionário
                    dicionario = dicionario_deputado[nome] # Carrega os dados do dicionario_deputado (que também são dicionários) cuja chave seja o nome do deputado
                    if categoria in dicionario: # se 'dicionario' possuir uma chave com a categoria da despesa
                        dicionario[categoria] += valor_despesa # Soma a despesa ao valor existente
                    else: # Caso contrário
                        dicionario[categoria] = valor_despesa # Adiciona a chave com nome da categoria e valor da despesa

                    dicionario_deputado[nome] = dicionario # Adicionado o novo dicionário à dicionario_deputado cuja chave seja o nome do deputado
                else: # Se não existe o dicionário com o nome do deputado como chave
                    dic = {} # Cria um dicionário vazio
                    dic[categoria] = valor_despesa # Adiciona o valor da despesa usando como chave o nome da categoria
                    dicionario_deputado[nome] = dic # Adiciona o novo dicionário no dicionário de deputados, tendo como chave, o nome do deputado

    return dicionario_deputado # Retorna o dicionário de deputados

def formatar_valor(valor):
    if "," not in valor:
        valor_despesa = valor + ",00"

    locale.setlocale(locale.LC_ALL, 'pt_BR.UTF-8')  # MUDAR A CONFIGURAÇÃO DE MOEDA, NÚMEROS, ETC PARA pt_BR
    valor = locale.currency(valor, grouping=True, symbol=None)  # FORMATAR A VARIÁVEL valor COMO MOEDA, SEM SÍMBOLO (R$) E COLOCANDO O PONTO PARA MILHAR
    locale.setlocale(locale.LC_ALL, '')  # RETORNANDO A CONFIGURAÇÃO PADRÃO DO SISTEMA
    return valor

if __name__ == "__main__":
    dicionario = carregar_dados()
    print(dicionario)

    while True:
        total_despesas = 0
        deputado = input("Informe o nome do deputado (ou 0 (zero) para sair): ").upper()
        if deputado == "0":
            break
        elif deputado in dicionario:
            for chave, valor in dicionario[deputado].items():
                total_despesas += valor
                valor = formatar_valor(valor)
                print(f'{chave}: {valor}')
        else:
            input("Deputado não localizado! Pressione qualquer tecla ver a lista de deputados.")
            for nome in dicionario.keys():
                print(nome)

        total_despesas = formatar_valor(total_despesas)
        print(f"Total Despesas: {total_despesas}")

    print("---Obrigado por utilizar o sistema---")


## Utilizando XPath

In [9]:
# Exemplo 1

from lxml import html, etree
from urllib.request import urlopen

pagina = urlopen("https://portfolio-bruno-martins.vercel.app/")
tree = html.fromstring(pagina.read())

body = tree.xpath("/html/body")
# print(body)

for elemento in body:
    print(etree.tostring(elemento, pretty_print=True).decode("utf-8"))

<body id="index-body">

    <header id="cabecalho">
        <nav>
            <!-- <h1><a href="#">Portfolio</a></h2> -->
            <div id="curriculo">
                <a href="./pages/en-pt.html" target="_blank">Curriculo</a>
            </div>

        </nav>

    </header>
    
    <section id="first">
            <img src="./source/perfil_image.jpeg" alt="Foto de perfil de Bruno Martins"/>

        <h1>Bruno Martins</h1>

        <h3>Estudante, Desenvolvedor e Gamer</h3>

        <div class="social">
            <div class="caixa">
                <a href="https://www.linkedin.com/in/bruno-martins-541a37350/" target="_blank">
                    <svg class="icone" viewbox="0 0 256 256" version="1.1" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" preserveaspectratio="xMidYMid" fill="currentColor">
                        <g>
                            <path d="M218.123122,218.127392 L180.191928,218.127392 L180.191928,158.724263 C180.191928,144.5590

In [12]:
# Exemplo 2

from lxml import html, etree
from urllib.request import urlopen

pagina = urlopen("https://portfolio-bruno-martins.vercel.app/")
tree = html.fromstring(pagina.read())

body = tree.xpath("/html/body/section")
# print(body)

for elemento in body:
    print(etree.tostring(elemento, pretty_print=True).decode("utf-8"))

<section id="first">
            <img src="./source/perfil_image.jpeg" alt="Foto de perfil de Bruno Martins"/>

        <h1>Bruno Martins</h1>

        <h3>Estudante, Desenvolvedor e Gamer</h3>

        <div class="social">
            <div class="caixa">
                <a href="https://www.linkedin.com/in/bruno-martins-541a37350/" target="_blank">
                    <svg class="icone" viewbox="0 0 256 256" version="1.1" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" preserveaspectratio="xMidYMid" fill="currentColor">
                        <g>
                            <path d="M218.123122,218.127392 L180.191928,218.127392 L180.191928,158.724263 C180.191928,144.559023 179.939053,126.323993 160.463756,126.323993 C140.707926,126.323993 137.685284,141.757585 137.685284,157.692986 L137.685284,218.123441 L99.7540894,218.123441 L99.7540894,95.9665207 L136.168036,95.9665207 L136.168036,112.660562 L136.677736,112.660562 C144.102746,99.9650027 157.908637,92.

In [13]:
# Exemplo 3

from lxml import html, etree
from urllib.request import urlopen

pagina = urlopen("https://portfolio-bruno-martins.vercel.app/")
tree = html.fromstring(pagina.read())

body = tree.xpath("//section")
# print(body)

for elemento in body:
    print(etree.tostring(elemento, pretty_print=True).decode("utf-8"))

<section id="first">
            <img src="./source/perfil_image.jpeg" alt="Foto de perfil de Bruno Martins"/>

        <h1>Bruno Martins</h1>

        <h3>Estudante, Desenvolvedor e Gamer</h3>

        <div class="social">
            <div class="caixa">
                <a href="https://www.linkedin.com/in/bruno-martins-541a37350/" target="_blank">
                    <svg class="icone" viewbox="0 0 256 256" version="1.1" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" preserveaspectratio="xMidYMid" fill="currentColor">
                        <g>
                            <path d="M218.123122,218.127392 L180.191928,218.127392 L180.191928,158.724263 C180.191928,144.559023 179.939053,126.323993 160.463756,126.323993 C140.707926,126.323993 137.685284,141.757585 137.685284,157.692986 L137.685284,218.123441 L99.7540894,218.123441 L99.7540894,95.9665207 L136.168036,95.9665207 L136.168036,112.660562 L136.677736,112.660562 C144.102746,99.9650027 157.908637,92.

In [14]:
# Exemplo 4

from lxml import html, etree
from urllib.request import urlopen

pagina = urlopen("https://portfolio-bruno-martins.vercel.app/")
tree = html.fromstring(pagina.read())

body = tree.xpath("//div")
# print(body)

for elemento in body:
    print(etree.tostring(elemento, pretty_print=True).decode("utf-8"))

<div id="curriculo">
                <a href="./pages/en-pt.html" target="_blank">Curriculo</a>
            </div>

        

<div class="social">
            <div class="caixa">
                <a href="https://www.linkedin.com/in/bruno-martins-541a37350/" target="_blank">
                    <svg class="icone" viewbox="0 0 256 256" version="1.1" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" preserveaspectratio="xMidYMid" fill="currentColor">
                        <g>
                            <path d="M218.123122,218.127392 L180.191928,218.127392 L180.191928,158.724263 C180.191928,144.559023 179.939053,126.323993 160.463756,126.323993 C140.707926,126.323993 137.685284,141.757585 137.685284,157.692986 L137.685284,218.123441 L99.7540894,218.123441 L99.7540894,95.9665207 L136.168036,95.9665207 L136.168036,112.660562 L136.677736,112.660562 C144.102746,99.9650027 157.908637,92.3824528 172.605689,92.9280076 C211.050535,92.9280076 218.138927,118.216023 21

In [30]:
# Exemplo 5

from lxml import html, etree
from urllib.request import urlopen

pagina = urlopen("https://portfolio-bruno-martins.vercel.app/")
tree = html.fromstring(pagina.read())

body = tree.xpath("//div[3]")
# print(body)

for elemento in body:
    print(etree.tostring(elemento, pretty_print=True).decode("utf-8"))

<div class="caixa">
                <a href="https://steamcommunity.com/id/brunomartins009" target="_blank">
                    <svg class="icone" viewbox="0 0 256 259" version="1.1" preserveaspectratio="xMidYMid" fill="currentColor">
                        <g>
                            <path d="M127.778579,0 C60.4203546,0 5.24030561,52.412282 0,119.013983 L68.7236558,147.68805 C74.5451924,143.665561 81.5845466,141.322185 89.1497766,141.322185 C89.8324924,141.322185 90.5059824,141.340637 91.1702465,141.377541 L121.735621,96.668877 L121.735621,96.0415165 C121.735621,69.1388208 143.425688,47.2457835 170.088511,47.2457835 C196.751333,47.2457835 218.441401,69.1388208 218.441401,96.0415165 C218.441401,122.944212 196.751333,144.846475 170.088511,144.846475 C169.719475,144.846475 169.359666,144.83725 168.99063,144.828024 L125.398299,176.205276 C125.425977,176.786507 125.444428,177.367738 125.444428,177.939743 C125.444428,198.144443 109.160732,214.575753 89.1497766,214.575753 C71.5836817,2

In [36]:
# Exemplo 6

from lxml import html, etree
from urllib.request import urlopen

pagina = urlopen("https://portfolio-bruno-martins.vercel.app/")
tree = html.fromstring(pagina.read())

body = tree.xpath("//div[3]/a")
# print(body)

for elemento in body:
    print(etree.tostring(elemento, pretty_print=True).decode("utf-8"))

<a href="https://steamcommunity.com/id/brunomartins009" target="_blank">
                    <svg class="icone" viewbox="0 0 256 259" version="1.1" preserveaspectratio="xMidYMid" fill="currentColor">
                        <g>
                            <path d="M127.778579,0 C60.4203546,0 5.24030561,52.412282 0,119.013983 L68.7236558,147.68805 C74.5451924,143.665561 81.5845466,141.322185 89.1497766,141.322185 C89.8324924,141.322185 90.5059824,141.340637 91.1702465,141.377541 L121.735621,96.668877 L121.735621,96.0415165 C121.735621,69.1388208 143.425688,47.2457835 170.088511,47.2457835 C196.751333,47.2457835 218.441401,69.1388208 218.441401,96.0415165 C218.441401,122.944212 196.751333,144.846475 170.088511,144.846475 C169.719475,144.846475 169.359666,144.83725 168.99063,144.828024 L125.398299,176.205276 C125.425977,176.786507 125.444428,177.367738 125.444428,177.939743 C125.444428,198.144443 109.160732,214.575753 89.1497766,214.575753 C71.5836817,214.575753 56.8868387,201.917832 53.5

In [34]:
# Exemplo 7

from lxml import html, etree
from urllib.request import urlopen

pagina = urlopen("https://portfolio-bruno-martins.vercel.app/")
tree = html.fromstring(pagina.read())

body = tree.xpath("//div[3]/*")
# print(body)

for elemento in body:
    print(etree.tostring(elemento, pretty_print=True).decode("utf-8"))

<a href="https://steamcommunity.com/id/brunomartins009" target="_blank">
                    <svg class="icone" viewbox="0 0 256 259" version="1.1" preserveaspectratio="xMidYMid" fill="currentColor">
                        <g>
                            <path d="M127.778579,0 C60.4203546,0 5.24030561,52.412282 0,119.013983 L68.7236558,147.68805 C74.5451924,143.665561 81.5845466,141.322185 89.1497766,141.322185 C89.8324924,141.322185 90.5059824,141.340637 91.1702465,141.377541 L121.735621,96.668877 L121.735621,96.0415165 C121.735621,69.1388208 143.425688,47.2457835 170.088511,47.2457835 C196.751333,47.2457835 218.441401,69.1388208 218.441401,96.0415165 C218.441401,122.944212 196.751333,144.846475 170.088511,144.846475 C169.719475,144.846475 169.359666,144.83725 168.99063,144.828024 L125.398299,176.205276 C125.425977,176.786507 125.444428,177.367738 125.444428,177.939743 C125.444428,198.144443 109.160732,214.575753 89.1497766,214.575753 C71.5836817,214.575753 56.8868387,201.917832 53.5

In [None]:
# Exemplo 7

from lxml import html, etree
from urllib.request import urlopen

pagina = urlopen("https://portfolio-bruno-martins.vercel.app/")
tree = html.fromstring(pagina.read())

body = tree.xpath('//section[@id="first"]')
# print(body)

for elemento in body:
    print(etree.tostring(elemento, pretty_print=True).decode("utf-8"))

<section id="first">
            <img src="./source/perfil_image.jpeg" alt="Foto de perfil de Bruno Martins"/>

        <h1>Bruno Martins</h1>

        <h3>Estudante, Desenvolvedor e Gamer</h3>

        <div class="social">
            <div class="caixa">
                <a href="https://www.linkedin.com/in/bruno-martins-541a37350/" target="_blank">
                    <svg class="icone" viewbox="0 0 256 256" version="1.1" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" preserveaspectratio="xMidYMid" fill="currentColor">
                        <g>
                            <path d="M218.123122,218.127392 L180.191928,218.127392 L180.191928,158.724263 C180.191928,144.559023 179.939053,126.323993 160.463756,126.323993 C140.707926,126.323993 137.685284,141.757585 137.685284,157.692986 L137.685284,218.123441 L99.7540894,218.123441 L99.7540894,95.9665207 L136.168036,95.9665207 L136.168036,112.660562 L136.677736,112.660562 C144.102746,99.9650027 157.908637,92.