# XML（eXtensible Markup Language，可擴展標記語言）是一種用於儲存和傳輸資料的標記語言。它是一種標準化的文本格式，用於表示結構化資料。XML 用標記來定義資料的結構和內容，並支持自定義標記，以便靈活地表示各種資料。

# XML 的基本特徵
標記：使用標籤（Tags）來描述數據，每個標籤都有開始標籤和結束標籤（如 <name> Alice </name>）。
結構：XML 資料由嵌套的標籤組成，形成樹狀結構。
屬性：標籤可以包含屬性，用於描述標籤的附加信息（如 <person age="30">Alice</person>）。
聲明：XML 檔案通常以 XML 聲明開頭，用於指定 XML 的版本和編碼（如 <?xml version="1.0" encoding="UTF-8"?>）。

# XML 格式示例

In [None]:
<?xml version="1.0" encoding="UTF-8"?>
<person>
    <name>Alice</name>
    <age>30</age>
    <is_student>false</is_student>
    <courses>
        <course>Math</course>
        <course>Science</course>
    </courses>
    <address>
        <street>123 Main St</street>
        <city>New York</city>
    </address>
</person>


# 使用 Python 讀取和寫入 XML
Python 提供了多種庫來處理 XML，常用的有 xml.etree.ElementTree 和 lxml。

使用 xml.etree.ElementTree 庫

讀取 XML 檔案

In [None]:
import xml.etree.ElementTree as ET

# 讀取 XML 檔案
tree = ET.parse('data.xml')
root = tree.getroot()

# 遍歷 XML 樹
for child in root:
    print(child.tag, child.attrib, child.text)


寫入 XML 檔案

In [None]:
import xml.etree.ElementTree as ET

# 建立 XML 結構
data = ET.Element('person')
name = ET.SubElement(data, 'name')
name.text = 'Alice'
age = ET.SubElement(data, 'age')
age.text = '30'

# 將結構寫入 XML 檔案
tree = ET.ElementTree(data)
tree.write('output.xml', encoding='utf-8', xml_declaration=True)


# 使用 lxml 庫
lxml 提供了更強大的功能來處理 XML，包括支持 XPath 和 XSLT。

讀取 XML 檔案

In [None]:
from lxml import etree

# 讀取 XML 檔案
tree = etree.parse('data.xml')
root = tree.getroot()

# 使用 XPath 查詢
name = root.find('.//name').text
print(name)


寫入 XML 檔案

In [None]:
from lxml import etree

# 建立 XML 結構
root = etree.Element('person')
name = etree.SubElement(root, 'name')
name.text = 'Alice'
age = etree.SubElement(root, 'age')
age.text = '30'

# 將結構寫入 XML 檔案
tree = etree.ElementTree(root)
tree.write('output.xml', encoding='utf-8', xml_declaration=True)


常見操作
解析 XML：使用解析器讀取 XML 文件，將其轉換為 Python 對象。
創建和修改 XML：建立新的 XML 結構，或修改現有的 XML 結構。
XPath 查詢：使用 XPath 表達式查詢和篩選 XML 資料。