# <center> Извлекаем контент из XML-файла

In [1]:
# импортируем модуль
import xml.etree.ElementTree as ET
tree = ET.parse('data/menu.xml')

In [3]:
root = tree.getroot()
root

<Element 'menu' at 0x0000018FE1EB5CC0>

In [4]:
list(root) # смотрим список потомков

[<Element 'dish' at 0x00000165BD2BDD10>,
 <Element 'dish' at 0x00000165BECF0680>]

In [5]:
list(root[1])

[<Element 'price' at 0x00000165BECF06D0>,
 <Element 'weight' at 0x00000165BECF0720>,
 <Element 'class' at 0x00000165BECF0770>]

In [6]:
root[0].attrib

{'name': 'Кура'}

In [4]:
root[0][2]

<Element 'class' at 0x0000018FE1EB5E50>

In [12]:
root[0][0].text

'40'

> Все значения в XML, даже числовые, хранятся как строки, поэтому преобразовывать их к нужному типу вам нужно самим.

In [13]:
root.tag

'menu'

In [16]:
root[0][2].tag

'class'

## <center>Использование циклов

Для обхода дерева используем цикл for

In [23]:
root[0].attrib['name']

'Кура'

In [24]:
for dish in root:
    for param in dish:
        print(dish.attrib['name'], param.tag, param.text)
    print()

Кура price 40
Кура weight 300
Кура class Мясо

Греча price 20
Греча weight 200
Греча class Крупа



## <center>Загружаем данные из XML-файла в DataFrame

In [25]:
import xml.etree.ElementTree as ET
tree = ET.parse('data/menu.xml')
root = tree.getroot()

In [28]:
import pandas as pd
column_names = ['name', 'price', 'weight', 'class']
df_list = []

for dish in root:
    row = [dish.attrib['name'], dish[0].text, dish[1].text, dish[2].text]
    df_list.append(row)
    df = pd.DataFrame(df_list, columns=column_names)
df

Unnamed: 0,name,price,weight,class
0,Кура,40,300,Мясо
1,Греча,20,200,Крупа


## <center> Создаем XML-файл

Чтобы создать корень дерева, используем метод Element() из класса ElementTree:

In [34]:
import xml.etree.ElementTree as ET

new_root = ET.Element('menu')
display(new_root)

<Element 'menu' at 0x00000165D79A54A0>

Теперь мы можем добавлять новые узлы в наше дерево, используя метод SubElement() из того же класса.

In [35]:
dish1 = ET.SubElement(new_root, 'dish', name='Кура')
dish2 = ET.SubElement(new_root, 'dish', name='Греча')
list(new_root)

[<Element 'dish' at 0x00000165BF56A0E0>,
 <Element 'dish' at 0x00000165D838BDB0>]

В метод SubElement() мы передали первым аргументом узел, к которому добавляем потомка, вторым аргументом — наименование нового тега (dish),  третьим аргументом — наименование атрибута нового узла( name ) и его значение.

Аналогичным образом можно добавлять новые узлы к любым существующим узлам, не только к корню.

In [36]:
price1 = ET.SubElement(dish1, 'price').text = '40'
weight1 = ET.SubElement(dish1, 'weight').text = '300'
class1 = ET.SubElement(dish1, 'class').text = 'Мясо'
display(list(dish1))

price2 = ET.SubElement(dish2, 'price').text = '20'
weight2 = ET.SubElement(dish2, 'weight').text = '200'
class2 = ET.SubElement(dish2, 'class').text = 'Крупа'
display(list(dish2))

[<Element 'price' at 0x00000165D786C310>,
 <Element 'weight' at 0x00000165BF3E5950>,
 <Element 'class' at 0x00000165BED6F220>]

[<Element 'price' at 0x00000165BED111D0>,
 <Element 'weight' at 0x00000165D83ABC70>,
 <Element 'class' at 0x00000165D83ABE00>]

In [37]:
for dish in new_root:
    for param in dish:
        print(dish.attrib['name'], param.tag, param.text)
    print()

Кура price 40
Кура weight 300
Кура class Мясо

Греча price 20
Греча weight 200
Греча class Крупа



## <center> Сохраняем XML-файл

Преобразуем созданный нами объект типа ElementTree.Element в строку c помощью метода tostring(), передав наше новое дерево как аргумент. Сохраним эту строку на диске, используя стандартные средства Python::

In [40]:
new_root_string = ET.tostring(new_root)
with open('data/new_menu.xml', 'wb') as f:
    f.write(new_root_string)

In [42]:
ET.ElementTree(new_root).write('data/new_menu_good.xml', encoding='utf-8')