In [21]:
# урок посвящен языку разметки XML 
# его используют для того, чтобы данные хранить

# внутри элемента бывают атрибуты
# удобно хранить xml в деревьях
# формат требует выделенного корня - такого элемента, который объединяет все другие элементы

from xml.etree import ElementTree

tree = ElementTree.parse("example.xml")
root = tree.getroot()
# можно использовать root = ElementTree.fromstring(string_xml_data) для того, чтобы разобрать строку

print(root)
print(root.tag, root.attrib)

# можно использовать цикл для разбора детей
for child in root:
    print(child.tag, child.attrib)
    
# можно использовать индексацию для перебора детей
print(root[0][0].text) #выводим содержимое тэга первого ребенка первого ребенка корня

# можем перебрать дерево по тэгу, при помощи метода .findall() перебираем все элементы среди детей 
for element in root.iter("scores"):
    print(element)
    score_sum = 0
    for child in element:
        score_sum += float(child.text)
    print(score_sum)
    

# Научимся и записывать деревья!
tree.write("example_copy.xml")

# Изменяем дерево
greg = root[0]
module1 = next(greg.iter("module1"))
print(module1, module1.text)
module1.text = str(float(module1.text) + 30)

tree.write("example_modified.xml")

tree = ElementTree.parse("example_modified.xml")
root = tree.getroot()
greg = root[0]

# Изменяем тип сертификата Грега - теперь он будет с отличием
certificate = greg[2]
certificate.set("type", "with distinction") # создаем атрибут!

tree.write("example_modified.xml")

# Создаем и добавляем элементы
tree = ElementTree.parse("example_modified.xml")
root = tree.getroot()
greg = root[0]

description = ElementTree.Element("description")
description.text = "Showed excellent skills during the course"
greg.append(description)

tree.write("example_modified.xml")

# Удаляем элементы
tree = ElementTree.parse("example_modified.xml")
root = tree.getroot()
greg = root[0]

description = greg.find("description")
greg.remove(description)
tree.write("example_modified.xml")

# Создаем дерево с самого начала

root = ElementTree.Element("student")
first_name = ElementTree.SubElement(root, "firstName")
first_name.text = "Greg"

second_name = ElementTree.SubElement(root, "secondName")
second_name.text = "Dean"

scores = ElementTree.SubElement(root, "scores")

module1 = ElementTree.SubElement(scores, "module1")
module1.text = "100"

module2 = ElementTree.SubElement(scores, "module2")
module2.text = "80"

module3 = ElementTree.SubElement(scores, "module3")
module3.text = "90"

tree = ElementTree.ElementTree(root)
tree.write("student.xml")


<Element 'studentsList' at 0x7fdfb80de458>
studentsList {}
student {'id': '1'}
student {'id': '2'}
Greg
<Element 'scores' at 0x7fdfb80de548>
240.0
<Element 'scores' at 0x7fdfb80de4a8>
240.2
<Element 'module1' at 0x7fdfb80de9f8> 70


In [23]:
# Вспомним про html

from lxml import etree
import requests

res = requests.get("https://docs.python.org/3/")
print(res.status_code)
print(res.headers["Content-Type"])

parser = etree.HTMLParser()
root = etree.fromstring(res.text, parser)

#for element in root.iter("a"):
#    print(element, element.attrib)

200
text/html


In [11]:
# Задача 1 - последняя!!! - разобрать XML и посчитать пирамиду из кубиков
# Вывести через пробел в следующем порядке: red, green, blue
# Кубик в корне имеет ценность 1.
# Дети root'a имеют ценность 2.
# Все остальные имеют ценность 3.

# <cube color="blue"><cube color="red"><cube color="green"></cube></cube><cube color="red"></cube></cube>
# <cube color="blue"><cube color="red"><cube color="green"><cube color="green"><cube color="red"></cube></cube></cube></cube><cube color="red"></cube></cube>
# <cute color="blue"><cute color="red"><cube color="green"><cube color="green"><cute color="red"></cute></cube></cube></cute><cube color="red"></cube></cute>


from xml.etree import ElementTree as ET

inp = input()
root = ET.fromstring(inp)

colors = {'red':0, 'green':0, 'blue':0}

def getchildren(node, level=1):
    if node.tag == "cube":
        if node.attrib.get('color', None):
            col = node.attrib['color']
            if col in colors:
                colors[col] += level
                #print(col, level)
    if node.iter('cube'):
        level += 1
        for child in node.findall('.*'):
            getchildren(child, level)
            
getchildren(root)

print(colors['red'], colors['green'], colors['blue'])

<cute color="blue"><cute color="red"><cube color="green"><cube color="green"><cute color="red"></cute></cube></cube></cute><cube color="red"></cube></cute>
2 6 0
