xml基础知识

GitJavaProgramming · GitJavaProgramming · commit dd7d2cc0271f · 2019-12-05T10:02:43.000+08:00
编写dtd验证xml
diff --git a/.idea/workspace.xml b/.idea/workspace.xml
diff --git a/README.md b/README.md
@@ -1,15 +1,89 @@
 # mybatis-test
  **mybatis源码研究-2019/12/04**
 
-***主要参考书籍：***  
+***主要参考资料：***  
 > - [x] [MyBatis技术内幕  徐郡明  2017/07](https://pan.baidu.com/s/1-JGtoXADDjQRw5v51np4vA "提取码是fcak")  
 > - [x] [MyBatis 3 源码深度解析  江荣波  2019/10](https://pan.baidu.com/s/1-JGtoXADDjQRw5v51np4vA "最新出版没有电子书")  
 > - [x] [MyBatis从入门到精通  刘增辉  2017/07](https://pan.baidu.com/s/1-JGtoXADDjQRw5v51np4vA "提取码是fcak")   
 > - [x] [深入浅出MyBatis 技术原理与实战  杨开振  2016/09](https://pan.baidu.com/s/1-JGtoXADDjQRw5v51np4vA "提取码是fcak")  
+> - [x] [xml](https://www.w3school.com.cn/xml/index.asp "W3CSchool") 
+> - [x] [dtd](https://www.w3school.com.cn/dtd/dtd_entities.asp "W3CSchool") 
+> - [x] [schema](https://www.w3school.com.cn/schema/index.asp "W3CSchool") 
+> - [x] [xpath](https://www.w3school.com.cn/xpath/xpath_nodes.asp "W3CSchool") 
+> - [x] [XML入门经典(第5版)  第I部分-->第III部分](https://pan.baidu.com/s/1M3HSfL3VQgpVvHa_ekUjvQ "提取码是9mfm")  
+> - [x] [疯狂XML讲义](https://pan.baidu.com/s/1M3HSfL3VQgpVvHa_ekUjvQ "提取码是9mfm")  
+> - [x] [XML揭秘 入门·应用·精通 Michael Morrison 陆新年](https://pan.baidu.com/s/1M3HSfL3VQgpVvHa_ekUjvQ "提取码是9mfm")  
+> - [x] [《XML简明教程》2009年清华大学出版社出版 张欣毅](https://www.baidu.com "xml基础简明教程，没找到电子版。")  
 
+  
 ***mybatis整体架构***  
 > mybatis整体架构分为三层，分别是基础支持层、核心处理层和接口层。
 > ![mybatis整体架构图](./mybatis整体架构图02.png "mybatis整体架构图")  
 
 ***mybatis思维导图***
 > ![mybatis思维导图](./mybatis整体架构图01.png "mybatis思维导图")
+
+
+# XML基础知识
+
+## XML
+所有的 XML 文档（以及 HTML 文档）均由以下简单的构建模块构成：  
+
+>   元素  
+>   属性  
+>   实体  
+>   PCDATA  
+>   CDATA   
+
+## XML名称空间  
+名称空间为了避免条目命名冲突  
+
+## DTD(Document Type Definition)  
+
+文档类型声明或DOCTYPE告诉解析器，XML文档必须遵循DTD定义。同时它也告诉解析器，到哪里找到文档定义的其余内容。  
+`<!DOCTYPE name [ ]>`
+
+引用外部DTD要用下面两种方法之一：系统标识符和公共标识符。
+
+### 系统标识符：  
+关键字SYSTEM和指向文档位置的URI引用。URI可以是硬盘上的一个文件，也可以是局域网或者internet上的一个文件。  
+`<!DOCTYPE name SYSTEM "name.dtd" [...]>`
+
+### 公共标识符：  
+以PUBLIC关键字开始，其后紧跟一个专用的标识符，但是公共标识不是用来表示对文件的引用，而是表示目录中的一个记录。
+根据XML规范，公共标识符可以采用任何格式，但是一种经常使用的格式是正式公共标识符(Formal Public Identifier, FPI)。
+>	FPI的语法要匹配下面的基本结构：  
+>	    -//Owner//Class Description//Language//Version  
+>   从底层的角度看，它与名称空间的作用相似，但是公共标识符不能把两个不同的词汇组合到同一个文档里。就因为这一点，名称空间比它功能更强大。
+
+在标识符字符串之后，还可以插入一个可选的系统标识符。这样，当处理器不能解析公共标识符时，可以查找这个文档的副本（大多数处理器不能解析公共标识符）。  
+`<!DOCTYPE name PUBLIC "-//Beginning XML//DTD Name Example//EN" "name.dtd">`
+
+### DTD详述
+通常，DTD由三个基本部分组成：  
+* 元素声明  
+* 属性声明  
+* 实体声明  
+
+#### 元素声明
+由三个部分组成：ELEMENT声明 元素名 元素内容模型
+```XML  
+<!ELEMENT name (first, middle, last)>
+```
+ELEMENT声明告诉解析器当前声明一个元素。
+##### 一个元素内容模型定义了可允许的元素内容。  
+就XML标准而言，有四类内容文档。（FAQ. 重点，请自行查阅相关资料）  
+* 元素内容
+* 混合内容
+* 空内容
+* 任意内容
+##### 基数是指这个元素在内容模型中出现的次数。DTD有4个基数指示符。
+
+指示符	|	说明
+--------|----------------
+[none]	|内容模型中默认方式，表示这个元素必须且只出现一次
+?		|表示元素出现一次或零次
+*		|表示元素出现零次或多次
++		|表示元素出现一次或多次
+    
+    
diff --git a/src/main/java/org/pp/mybatis/foundationsupportlayer/parser/XPathTest.java b/src/main/java/org/pp/mybatis/foundationsupportlayer/parser/XPathTest.java
@@ -0,0 +1,65 @@
+package org.pp.mybatis.foundationsupportlayer.parser;
+
+import org.w3c.dom.Document;
+import org.w3c.dom.NodeList;
+import org.xml.sax.SAXException;
+
+import javax.xml.parsers.DocumentBuilder;
+import javax.xml.parsers.DocumentBuilderFactory;
+import javax.xml.parsers.ParserConfigurationException;
+import javax.xml.xpath.*;
+import java.io.IOException;
+
+public class XPathTest {
+
+    public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException, XPathExpressionException {
+        // 参考 javadoc -- javax.xml.parsers.*
+        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
+        // 创建的解析器使用DTD验证 如果需要schema验证就指定false 然后使用{@link #setSchema(Schema)}
+        documentBuilderFactory.setValidating(true);
+        // 创建的解析器不支持XML命名空间
+        documentBuilderFactory.setNamespaceAware(false);
+        // 创建的解析器忽略注释
+        documentBuilderFactory.setIgnoringComments(true);
+        // 创建的解析器解析xml文档时是否删除元素内容中的空格
+        documentBuilderFactory.setIgnoringElementContentWhitespace(false);
+        // 解析器是否将CDATA节点转换为Text节点，并把它附加到相邻的Text节点
+        documentBuilderFactory.setCoalescing(false);
+        // 生成的解析器将扩展实体引用节点
+        documentBuilderFactory.setExpandEntityReferences(true);
+
+        // 创建DocumentBuilder 从而可以获取DOM文档实例
+        DocumentBuilder builder = documentBuilderFactory.newDocumentBuilder();
+        // 将文档加载到一个Document对象中
+        Document doc = builder.parse("src/main/java/org/pp/mybatis/foundationsupportlayer/parser/inventory.xml");
+
+        XPathFactory xPathFactory = XPathFactory.newInstance();
+        // XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。
+        // XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 都构建于 XPath 表达之上。
+        // 在 XPath 中，有七种类型的节点：元素、属性、文本、命名空间、处理指令、注释以及文档节点（或称为根节点）。
+        XPath xPath = xPathFactory.newXPath();
+
+        // 编译XPath表达式 --- FAQ 请自己查找答案
+        XPathExpression expr = xPath.compile("//book[author='Neal Stephenson']/title/text()");
+        Object result = expr.evaluate(doc, XPathConstants.NODESET/* {@link XPathConstants QName} */);
+        System.out.println("查询作者位Neal Stephenson的图书的标题：");
+        NodeList nodeList = (NodeList) result;
+        printNodeList(nodeList);
+
+        System.out.println("查询1997年之后的图书的标题");
+        nodeList = (NodeList) (xPath.evaluate("//book[@year>1997]/title/text()", doc, XPathConstants.NODESET));
+        printNodeList(nodeList);
+
+        System.out.println("查询1997年之后的图书的属性和标题");
+        nodeList = (NodeList) (xPath.evaluate("//book[@year>1997]/@*|//book[@year>1997]/title/text()", doc, XPathConstants.NODESET));
+        printNodeList(nodeList);
+
+    }
+
+    private static void printNodeList(NodeList nodeList) {
+        int len = nodeList.getLength();
+        for (int i = 0; i < len; i++) {
+            System.out.println(nodeList.item(i).getNodeValue());
+        }
+    }
+}
diff --git a/src/main/java/org/pp/mybatis/foundationsupportlayer/parser/inventory.dtd b/src/main/java/org/pp/mybatis/foundationsupportlayer/parser/inventory.dtd
@@ -0,0 +1,8 @@
+<!ELEMENT inventory (book*)>
+        <!ELEMENT book      (title, author*, publisher,isbn,price)>
+        <!ATTLIST book year CDATA #IMPLIED>
+        <!ELEMENT title    (#PCDATA)>
+        <!ELEMENT author (#PCDATA)>
+        <!ELEMENT publisher    (#PCDATA)>
+        <!ELEMENT isbn    (#PCDATA)>
+        <!ELEMENT price    (#PCDATA)>
diff --git a/src/main/java/org/pp/mybatis/foundationsupportlayer/parser/inventory.xml b/src/main/java/org/pp/mybatis/foundationsupportlayer/parser/inventory.xml
@@ -0,0 +1,26 @@
+<?xml version="1.0" encoding="UTF-8" ?>
+<!DOCTYPE inventory SYSTEM "inventory.dtd">
+<inventory>
+    <book year="2000">
+        <title>Snow Crash</title>
+        <author>Neal Stephenson</author>
+        <publisher>Spectra</publisher>
+        <isbn>0553380958</isbn>
+        <price>14.95</price>
+    </book>
+    <book year="2005">
+        <title>Burning Tower</title>
+        <author>Larry Niven</author>
+        <author>Jerry Pournelle</author>
+        <publisher>Pocket</publisher>
+        <isbn>0743416910</isbn>
+        <price>5.99</price>
+    </book>
+    <book year="1995">
+        <title>Zodiac</title>
+        <author>Neal Stephenson</author>
+        <publisher>Spectra</publisher>
+        <isbn>0553573862</isbn>
+        <price>7.50</price>
+    </book>
+</inventory>