## XML
XML 指可扩展标记语言（eXtensible Markup Language），标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。<br>
XML 被设计用来传输和存储数据。<br>
XML 是一套定义语义标记的规则，这些标记将文档分成许多部件并对这些部件加以标识。

### XML DOM基础概念
DOM基于树的概念存储，基于树读取、修改，是有一个个节点构成，每个节点必须挂载到上级节点(或者称为父节点)，整个DOM有一个根节点。
- 获取树

domTree = parse("./customer.xml")

- 创建树

domTree = xml.dom.minidom.Document()

- 节点创建

son_node = domTree.createElement("customer")

- 节点挂载

father_node.appendChild(son_node)

- 可以给节点添加属性（attribute）

使用函数：setAttribute()
```
-<student name="alex">

 </student>
```
- 可以给节点添加文本描述

使用函数createTextNode()
```
<book>"programming python"</book>
```

### 示例1：XML读

In [1]:
from xml.dom.minidom import parse
import xml.dom.minidom

# 使用minidom解析器打开 XML 文档
DOMTree = xml.dom.minidom.parse("resources/movies.xml")
# 文档根元素
collection = DOMTree.documentElement
if collection.hasAttribute("shelf"):
   print ("Root element : %s" % collection.getAttribute("shelf"))

# 在集合中获取所有电影
movies = collection.getElementsByTagName("movie")

# 打印每部电影的详细信息
for movie in movies:
   print ("*****Movie*****")
   if movie.hasAttribute("title"):
      print ("Title: %s" % movie.getAttribute("title"))

   type = movie.getElementsByTagName('type')[0]
   print ("Type: %s" % type.childNodes[0].data)
   format = movie.getElementsByTagName('format')[0]
   print ("Format: %s" % format.childNodes[0].data)
   rating = movie.getElementsByTagName('rating')[0]
   print ("Rating: %s" % rating.childNodes[0].data)
   description = movie.getElementsByTagName('description')[0]
   print ("Description: %s" % description.childNodes[0].data)

Root element : New Arrivals
*****Movie*****
Title: Enemy Behind
Type: War, Thriller
Format: DVD
Rating: PG
Description: Talk about a US-Japan war
*****Movie*****
Title: Transformers
Type: Anime, Science Fiction
Format: DVD
Rating: R
Description: A schientific fiction
*****Movie*****
Title: Trigun
Type: Anime, Action
Format: DVD
Rating: PG
Description: Vash the Stampede!
*****Movie*****
Title: Ishtar
Type: Comedy
Format: VHS
Rating: PG
Description: Viewable boredom


### 示例2：XML写

```
<?xml version="1.0" encoding="UTF-8"?>
-<customers>
    -<customer ID="C003">
        <name>kavin</name>
        <phone>32467</phone>
        -<comments>
        -<![CDATA[A small but healthy company.]]>
        </comments>
    </customer>
</customers>
```

In [25]:
from xml.dom.minidom import parse
import xml.dom.minidom

def writeXML():
    domTree = xml.dom.minidom.Document()
    # 文档根元素
    rootNode = domTree.createElement("customers")
    domTree.appendChild(rootNode)
    
    # 新建一个customer节点
    customer_node = domTree.createElement("customer")
    customer_node.setAttribute("ID", "C003")

    # 创建name节点,并设置textValue
    name_node = domTree.createElement("name")
    name_text_value = domTree.createTextNode("kavin")
    name_node.appendChild(name_text_value)  # 把文本节点挂到name_node节点
    customer_node.appendChild(name_node)

    # 创建phone节点,并设置textValue
    phone_node = domTree.createElement("phone")
    phone_text_value = domTree.createTextNode("32467")
    phone_node.appendChild(phone_text_value)  # 把文本节点挂到name_node节点
    customer_node.appendChild(phone_node)

    # 创建comments节点,这里是CDATA
    comments_node = domTree.createElement("comments")
    cdata_text_value = domTree.createCDATASection("A small but healthy company.")
    comments_node.appendChild(cdata_text_value)
    customer_node.appendChild(comments_node)

    rootNode.appendChild(customer_node)

    with open('resources/customer.xml', 'w') as f:
        # 缩进 - 换行 - 编码
        domTree.writexml(f, addindent='  ', encoding='utf-8')


In [26]:
writeXML()

### 示例3：XML写
新建文件并且将如下字符写入。
```
<?xml version="1.0" encoding="UTF-8"?>
-<root>
    <book price="199"/>
    <name>计算机程序设计语言 第1版</name>
</root>
```

In [14]:
from xml.dom import minidom

# 1.创建DOM树对象
dom = minidom.Document()
# 2.创建根节点。每次都要用DOM对象来创建任何节点。
root_node = dom.createElement('root')
# 3.用DOM对象添加根节点
dom.appendChild(root_node)

# 用DOM对象创建元素子节点
book_node = dom.createElement('book')
# 用父节点对象添加元素子节点
root_node.appendChild(book_node)
# 设置该节点的属性
book_node.setAttribute('price','199')
name_node=dom.createElement('name')
root_node.appendChild(name_node)
# 也用DOM创建文本节点，把文本节点（文字内容）看成子节点
name_text=dom.createTextNode('计算机程序设计语言 第1版')
# 用添加了文本的节点对象（看成文本节点的父节点）添加文本节点
name_node.appendChild(name_text)

# 每一个结点对象（包括dom对象本身）都有输出XML内容的方法，如：toxml()--字符串, toprettyxml()--美化树形格式。
try:
    with open('resources/dom_write.xml','w',encoding='UTF-8') as fh:
        # 4.writexml()第一个参数是目标文件对象，第二个参数是根节点的缩进格式，第三个参数是其他子节点的缩进格式，
        # 第四个参数制定了换行格式，第五个参数制定了xml内容的编码。
        dom.writexml(fh,indent='',addindent='\t',newl='\n',encoding='UTF-8')
        print('写入xml OK!')
except Exception as err:
    print('错误信息：{0}'.format(err))

写入xml OK!
