**`XPath` 是一门在 `XML` 文档中查找信息的语言**。`XPath` 是 `XSLT` 中的主要元素。`XQuery` 和 `XPointer` 均构建于 `XPath` 表达式之上。

# 简介

## 什么是XPath？

1. `XPath` **使用路径表达式在 `XML` 文档中进行导航**
2. `XPath` 包含一个标准函数库
3. `XPath` 是 `XSLT` 中的主要元素
4. `XPath` 是一个 `W3C` 标准

![](./image/xpath.gif)

## XPath路径表达式

`XPath` 使用路径表达式来选取 `XML` 文档中的节点或者节点集。**这些 路径表达式 和 我们在常规的电脑文件系统中看到的表达式 非常相似**。

## XPath标准函数

`XPath` 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 `QName` 处理、序列处理、逻辑值等等。

# 节点

## 术语

### 节点类型

在 `XPath` 中，有七种类型的节点：

#### 元素节点

元素: 指的是从（且包括）**开始标签**直到（且包括）**结束标签**的部分。一个元素可以包含：
    1. 其他元素
    2. 文本
    3. 属性
    4. 或混合以上所有...
    5. 比如属性：`<title>Harry Potter</title>`

#### 属性节点

属性（Attribute）提供有关元素的额外信息,必须被引号包围，不过单引号和双引号均可使用。比如一个人的性别，`person` 元素可以这样写：`<person sex="female">`

#### 文本节点

文本: 元素包含的内容可以是文本

#### 命名空间节点

`XML` 命名空间提供避免元素命名冲突的方法。在` XML` 中，元素名称是由开发者定义的，当两个不同的文档使用相同的元素名时，就会发生命名冲突。当在` XML` 中使用 `前缀`时，一个所谓的用于前缀的命名空间必须被定义。**命名空间是在元素的开始标签的 `xmlns `属性中定义的**。命名空间声明的语法如下: `xmlns:前缀="URI"`，例如：`<h:table xmlns:h="http://www.w3.org/TR/html4/"> ...</h:table>`,`<table>` 标签的 `xmlns `属性定义了` h: ` 前缀的合格命名空间。

#### 处理指令节点

#### 注释节点

注释: `<!-- This is a comment -->`

#### 文档节点

 文档（根）节点：`XML` 文档形成了一种树结构，它从"根部"开始，然后扩展到"枝叶"。根元素是所有其他元素的父元素。

`XML` 文档是被作为 **节点树** 来对待的。**树的根** 被称为 **文档节点** 或者 **根节点**。

### XML文档是一种树结构

`XML` 文档必须包含根元素。该元素是所有其他元素的父元素。

`XML` 文档中的元素形成了一棵文档树。这棵树从根部开始，并扩展到树的最底端。

所有的元素都可以有子元素。父、子以及同胞等术语用于描述元素之间的关系。

父元素拥有子元素。相同层级上的子元素成为同胞（兄弟或姐妹）。所有的元素都可以有文本内容和属性（类似 HTML 中）

#### 实例

```xml
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
    <book category="COOKING">
        <title lang="en">Everyday Italian</title>
        <author>Giada De Laurentiis</author>
        <year>2005</year>
        <price>30.00</price>
    </book>
    <book category="CHILDREN">
        <title lang="en">Harry Potter</title>
        <author>J K. Rowling</author>
        <year>2005</year>
        <price>29.99</price>
    </book>
    <book category="WEB">
        <title lang="en">Learning XML</title>
        <author>Erik T. Ray</author>
        <year>2003</year>
        <price>39.95</price>
    </book>
</bookstore>
```

#### 解析

第一行是` XML 声明`。它定义` XML 的版本`（1.0）和所使用的 `编码`（UTF-8 : 万国码, 可显示各种语言）,其它解释如下：

![](./image/nodetree.gif)

### 基本值，或称原子值,Atomic value

基本值是**无父或无子的节点**。例如，有如下文档

```xml
<?xml version="1.0" encoding="UTF-8"?>

<bookstore>
  <book>
    <title lang="en">Harry Potter</title>
    <author>J K. Rowling</author>
    <year>2005</year>
    <price>29.99</price>
  </book>
</bookstore> 
```

上面的XML文档中的节点例子：

```xml
<bookstore> (文档节点)

<author>J K. Rowling</author> (元素节点)

lang="en" (属性节点) 
```

**基本值的例子**：
```Python
J K. Rowling

"en" 
```

### 项目Item

项目 是 **基本值 或者 节点**。

## 节点关系

### 父(Parent)

每个元素以及属性都有一个父。 在下面的例子中，book 元素是 title、author、year 以及 price 元素的父：
```xml
<book>
  <title>Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book> 
```

### 子(Children)

元素节点可有零个、一个或多个子。 在下面的例子中，title、author、year 以及 price 元素都是 book 元素的子：
```xml
<book>
  <title>Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book> 
```

### 同胞(Sibling)

拥有相同的父的节点 在下面的例子中，title、author、year 以及 price 元素都是同胞：
```xml
<book>
  <title>Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book> 
```

### 先辈(Ancestor)

某节点的父、父的父，等等。 在下面的例子中，title 元素的先辈是 book 元素和 bookstore 元素：
```xml
<bookstore>

<book>
  <title>Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book>

</bookstore> 
```

### 后代(Descendant)

某个节点的子，子的子，等等。 在下面的例子中，bookstore 的后代是 book、title、author、year 以及 price 元素：
```xml
<bookstore>

<book>
  <title>Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book>

</bookstore> 
```

# 语法

`XPath `使用**路径表达式**来选取` XML `文档中的**节点或节点集**。节点是通过沿着**路径 (path) 或者步 (steps)** 来选取的。

## XML实例文档

我们将在下面的例子中使用这个` XML `文档:
```xml
<?xml version="1.0" encoding="UTF-8"?>

<bookstore>

<book>
  <title lang="eng">Harry Potter</title>
  <price>29.99</price>
</book>

<book>
  <title lang="eng">Learning XML</title>
  <price>39.95</price>
</book>

</bookstore> 
```

## 选取节点

`XPath` 使用路径表达式在 `XML` 文档中选取节点。节点是通过沿着路径或者 step 来选取的。 下面列出了最有用的路径表达式：

|表达式|描述|
|--|--|
|nodename|选取此节点的所有子节点|
|/|从根节点选取|
|//|从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置|
|**.**|选取当前节点|
|**..**|选取当前节点的父节点|
|@|选取属性|

以上文中的例子为例，在下面的表格中，我们已列出了一些路径表达式以及表达式的结果：

|路径表达式|结果|
|--|--|
|bookstore|选取 bookstore 元素的所有子节点|
|/bookstore|选取根元素 bookstore。注释：假如路径起始于正斜杠( / )，则此路径始终代表到某元素的绝对路径！|
|//book|选取所有 book 子元素，而不管它们在文档中的位置|
|bookstore//book|选择属于 bookstore 元素的后代的所有 book 元素，而不管它们位于 bookstore 之下的什么位置|
|//@lang|选取名为 lang 的所有属性|

## 谓语(Predicates)

**谓语用来查找某个特定的节点或者包含某个指定的值的节点。 谓语被嵌在方括号中**。在下面的表格中，我们列出了带有谓语的一些路径表达式，以及表达式的结果：

|路径表达式|结果|
|--|--|
|/bookstore/book[1]|选取属于 bookstore 子元素的第一个 book 元素|
|/bookstore/book[last()]|选取属于 bookstore 子元素的最后一个 book 元素|
|/bookstore/book[last()-1]|选取属于 bookstore 子元素的倒数第二个 book 元素|
|/bookstore/book[position()<3]|选取最前面的两个属于 bookstore 元素的子元素的 book 元素|
|//title[@lang]|选取所有拥有名为 lang 的属性的 title 元素|
|//title[@lang='eng']|选取所有 title 元素，且这些元素拥有值为 eng 的 lang 属性|
|/bookstore/book[price>35.00]|选取 bookstore 元素的所有 book 元素，且其中的 price 元素的值须大于 35.00|
|/bookstore/book[price>35.00]/title|选取 bookstore 元素中的 book 元素的所有 title 元素，且其中的 price 元素的值须大于 35.00|

## XPath通配符：选取未知节点

`XPath 通配符` 可用来**选取未知的` XML 元素`**：

|通配符|描述|
|--|--|
|*|匹配任何元素节点|
|@*|匹配任何属性节点|
|node()|匹配任何类型的节点|

在下面的表格中，我们列出了一些路径表达式，以及这些表达式的结果：

|路径表达式|结果|
|--|--|
|/bookstore/*|选取 bookstore 元素的所有子元素|
|//*|选取文档中的所有元素|
|//title[@*]|选取所有带有属性的 title 元素|

## 选取若干路径

通过**在路径表达式中使用"|"运算符**，您**可以选取若干个路径**。在下面的表格中，我们列出了一些路径表达式，以及这些表达式的结果：

|路径表达式|结果|
|--|--|
|//book/title \| //book/price|选取 book 元素的所有 title 和 price 元素|
|//title \| //price|选取文档中的所有 title 和 price 元素|
|/bookstore/book/title \| //price|选取属于 bookstore 元素的 book 元素的所有 title 元素，以及文档中所有的 price 元素|

# 轴(Axes)

## XML实例文档

```XML
<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
  <title lang="eng">Harry Potter</title>
  <price>29.99</price>
</book>

<book>
  <title lang="eng">Learning XML</title>
  <price>39.95</price>
</book>

</bookstore>
```

## XPath轴

轴可定义相对于当前节点的节点集:

![](./image/xpath_route.png)

## 位置路径表达式

位置路径可以是绝对的，也可以是相对的。

**绝对路径**起始于正斜杠( / )，而**相对路径**不会这样。在两种情况中，**位置路径均包括一个或多个步，每个步均被斜杠分割**：

### 绝对位置路径

`/step/step/...`

### 相对位置路径

`step/step/...`

### 步(step)

每个步均根据当前节点集之中的节点来进行计算，它包括：

#### 轴(axis)

定义所选节点与当前节点之间的树关系

#### 节点测试(node-test)

识别某个轴内部的节点

#### 零个或者更多谓语(predicate)

更深入地提炼所选的节点集

#### 步的语法

`轴名称::节点测试[谓语]`

### 用法举例

![](./image/xpath_route2.png)

# 运算符

`XPath `表达式可返回**节点集、字符串、逻辑值以及数字**。 下面列出了可用在 XPath 表达式中的运算符：
![](./image/xpath_route3.png)

# 实例

## 实例文档

我们将在下面的例子中使用这个 XML 文档'books.xml'：

```xml
<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book category="COOKING">
  <title lang="en">Everyday Italian</title>
  <author>Giada De Laurentiis</author>
  <year>2005</year>
  <price>30.00</price>
</book>

<book category="CHILDREN">
  <title lang="en">Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book>

<book category="WEB">
  <title lang="en">XQuery Kick Start</title>
  <author>James McGovern</author>
  <author>Per Bothner</author>
  <author>Kurt Cagle</author>
  <author>James Linn</author>
  <author>Vaidyanathan Nagarajan</author>
  <year>2003</year>
  <price>49.99</price>
</book>

<book category="WEB">
  <title lang="en">Learning XML</title>
  <author>Erik T. Ray</author>
  <year>2003</year>
  <price>39.95</price>
</book>

</bookstore>
```

## 选取所有title

下面的例子选取所有 title 节点：`/bookstore/book/title`,结果如下:
```Python
Harry Potter
Everyday Italian
Learning XML
XQuery Kick Start
```

## 选取第一个 book 的 title

下面的例子选取 bookstore 元素下面的第一个 book 节点的 title：`/bookstore/book[1]/title`,结果如下：
```Python
Harry Potter
```

这里有一个问题。上面的例子在` IE` 和`其他浏览器`中输出不同的结果。`IE5` 以及更高版本将` [0]` 视为第一个节点，而根据 W3C 的标准，应该是` [1]`

## 选取所有价格

下面的例子选取` price` 节点中的所有文本：`/bookstore/book/price/text()`,结果如下:
```Python
29.99
30.00
39.95
49.99
```

## 选取价格高于 35 的 price 节点

下面的例子选取价格高于 35 的所有 price 节点：`/bookstore/book[price>35]/price`,结果如下：
```Python
39.95
49.99
```

## 选取价格高于 35 的 title 节点

下面的例子选取价格高于 35 的所有 title 节点：`/bookstore/book[price>35]/title`,结果如下：
```Python
Learning XML
XQuery Kick Start
```

# XPath函数

1. 存取函数
2. 错误跟踪函数
3. 有关数值的函数
4. 有关字符串的函数
5. 针对anyURI的函数
6. 关于布尔值的函数
7. 有关持续时间、日期和时间的函数
8. 与 QNames 相关的函数
9. 关于节点的函数
10. 有关序列的函数
11. 上下文函数

具体可查阅http://www.w3school.com.cn/xpath/xpath_functions.asp