In [1]:
# Импортируем модуль ElementTree
import xml.etree.ElementTree as ET

In [2]:
# Для работы со структурой файла menu.xml считаем его содержимое в переменную tree, выполнив код:

tree = ET.parse('menu.xml')

In [3]:
# Запишем в переменную root корневой узел дерева tree и посмотрим, как выглядит содержимое переменной root
root = tree.getroot()
display(root)

<Element 'menu' at 0x10dca7790>

In [4]:
display(type(root))

xml.etree.ElementTree.Element

In [5]:
# Для того чтобы посмотреть список потомков корневого узла, выполним следующий код:

display(list(root))

[<Element 'dish' at 0x10dca7830>, <Element 'dish' at 0x10dca7a10>]

In [6]:
# Для того чтобы получить список потомков второго блюда в нашем меню и вывести его на экран, выполним код:

display(list(root[1]))

[<Element 'price' at 0x10dca7a60>,
 <Element 'weight' at 0x10dca7ab0>,
 <Element 'class' at 0x10dca7b00>]

In [7]:
# Мы можем непосредственно обратиться к атрибутам, используя attrib.

display(root[0].attrib)

{'name': 'Кура'}

In [8]:
# В XML-узлах часто хранятся количественные показатели. Эти показатели хранятся в виде текста, и прочитать их можно, обратившись к 
# атрибуту text у соответствующего объекта типа ElementTree.Element.
# Например, возьмём узел price первого блюда из меню:

display(root[0][0])

<Element 'price' at 0x10dca7880>

In [9]:
# Теперь прочитаем значение этого узла с помощью text:

display(root[0][0].text)

'40'

In [10]:
# Если вы хотите прочитать наименование тега конкретного узла, необходимо использовать tag. Например, получим наименование тега корневого узла:

display(root.tag)

'menu'

In [12]:
display(root[0][2])

<Element 'class' at 0x10dca7920>

In [13]:
# На этом шаге мы решим задачу вывода на экран наименование всех блюд из меню, а также информацию о них (иными словами, нам необходимо 
# обойти дерево и вывести на экран значения его листьев).
# Используя цикл for, автоматизируем обход дерева. Для этого напишем следующий код:

for dish in root:
    for param in dish:
        print(dish.attrib['name'], param.tag, param.text)
    print()

Кура price 40
Кура weight 300
Кура class Мясо

Греча price 20
Греча weight 200
Греча class Крупа



In [None]:
# Загружаем данные из XML-файла в DataFrame

import xml.etree.ElementTree as ET
tree = ET.parse('menu.xml')
root = tree.getroot()

import pandas as pd
column_names = ['name', 'price', 'weight', 'class']
df_list = []

for dish in root:
    row = [dish.attrib['name'], dish[0].text, dish[1].text, dish[2].text]
    df_list.append(row)

df = pd.DataFrame(df_list, columns=column_names)
display(df)

Unnamed: 0,name,price,weight,class
0,Кура,40,300,Мясо
1,Греча,20,200,Крупа


In [15]:
# Воссоздадим структуру нашего исходного XML-файла с нуля,  руководствуясь общими рекомендациями.
# Чтобы создать корень дерева, используем метод Element() из класса ElementTree:

import xml.etree.ElementTree as ET

new_root = ET.Element('menu')
display(new_root)

<Element 'menu' at 0x10dca69d0>

In [16]:
# Теперь мы можем добавлять новые узлы в наше дерево, используя метод SubElement() из того же класса.
# Добавим в наше меню двух потомков корневого узла, которые будут представлять два блюда, то есть будут узлами dish:

dish1 = ET.SubElement(new_root, 'dish', name='Кура')

dish2 = ET.SubElement(new_root, 'dish', name='Греча')

display(list(new_root))

[<Element 'dish' at 0x10dce51c0>, <Element 'dish' at 0x10dce42c0>]

In [None]:
# Добавим в создаваемую структуру по три потомка (атрибута) к двум новым узлам, которые будут содержать информацию о блюде — о его цене (price),
# весе (weight) и классе (class), а также значение этих атрибутов:

price1 = ET.SubElement(dish1, "price").text = "40"
weight1 = ET.SubElement(dish1, "weight").text = "300"
class1 = ET.SubElement(dish1, "class").text = "Мясо"
display(list(dish1))

price2 = ET.SubElement(dish2, "price").text = "20"
weight2 = ET.SubElement(dish2, "weight").text = "200"
class2 = ET.SubElement(dish2, "class").text = "Крупа"
display(list(dish2))

[<Element 'price' at 0x10dca6d90>,
 <Element 'weight' at 0x1084f3650>,
 <Element 'class' at 0x10fe954e0>]

[<Element 'price' at 0x10dce4ae0>,
 <Element 'weight' at 0x10e0d8310>,
 <Element 'class' at 0x10fe95ad0>]

In [18]:
# Проверим визуально корректность созданной нами структуры, выполнив фрагмент кода, разработанного ранее:

for dish in new_root:    
    for param in dish:
        print(dish.attrib['name'], param.tag, param.text)
    print()

Кура price 40
Кура weight 300
Кура class Мясо

Греча price 20
Греча weight 200
Греча class Крупа



In [19]:
# Сохранение XML-файла

new_root_string = ET.tostring(new_root)

with open("new_menu.xml", "wb") as f:
    f.write(new_root_string)

In [None]:
# Возможно, вы увидите проблему, связанную с кодировкой. Что делать в этом случае? Как вариант — записать файл,
# используя сам класс ElementTree() :
ET.ElementTree(new_root).write('new_menu_good.xml', encoding="utf-8")