XPath、XPointer与XLink:XML数据处理与链接的高级技术
立即解锁
发布时间: 2025-08-17 01:16:05 阅读量: 5 订阅数: 14 


ASP.NET与XML开发指南
# XPath、XPointer与XLink:XML数据处理与链接的高级技术
## 1. XPath计数与测试工具
在处理XML文档时,我们常常需要统计特定元素的数量。例如,要统计`golfer`元素的数量,可以使用以下XPath语句:
```plaintext
count(/golfers/child::golfer)
count(//golfer)
```
看到这些XPath语句后,你可能会想如何测试它们是否真的有效,也可能想练习创建自己的XPath语句。幸运的是,DevelopMentor的Aaron Skonnard创建了一个优秀的基于浏览器的XPath语句测试工具,可从[http://staff.develop.com/aarons/xmllinks.htm](http://staff.develop.com/aarons/xmllinks.htm)下载。
## 2. XPointer基础
### 2.1 XPointer简介
XPointer(XML Pointer)由W3C的一些工作组与XPath联合开发。它借助XPath的功能,为从分散的XML文档中检索信息提供了更多可能性。W3C的XPointer候选推荐指出,XPointer支持对XML文档内部结构的寻址,允许根据元素类型、属性值、字符内容和相对位置等属性检查文档的层次结构并选择其内部部分,能对XML文档的元素、字符串等部分进行特定引用,无论这些部分是否带有显式的ID属性。
### 2.2 XPath与XPointer的区别
XPath和XPointer都能访问XML文档中的特定项,但XPointer与XPath不同,它提供了一种访问本地或远程文档中特定内容(即文档片段)的机制。这些内容不仅限于节点,XPointer甚至可以选择文本字符串中的单个字符。
例如,假设有一个包含研究数据的XML文档,由引言、正文和结论三部分组成,但正文和结论部分不在该文档中,而是分别位于另外两个XML文档中。仅使用XPath无法访问这些远程文档中的正文和摘要文本,因为XPath旨在定位本地XML文档中的特定节点。而XPointer可以利用部分XPath语法,从远程文档中收集正文和摘要文本部分,并将其放入当前XML文档中,且无需加载整个远程文档。这就好比HTML中的锚点,但XPointer更加灵活,无需加载整个页面再滚动到内容。
### 2.3 XPointer关键定义
| 术语 | 定义 |
| ---- | ---- |
| 子资源(sub - resource) | XPointer所标识的XML文档部分。整个XML文档为资源,XPointer访问的部分为子资源。 |
| 点(point) | W3C定义为“XML信息中的一个位置”。可以是XML文档中的节点,也可以是节点XML字符数据中的特定位置,由容器节点和索引值定义其位置。点可以在任何字符之前,也可以在节点之前或之后,但不能在字符上。例如,在`<golfer><firstName>Ted</firstName></golfer>`中,“T”字符的容器类型为元素,索引为0,“e”的索引为1,“d”的索引为2。 |
| 字符点(character point) | 容器节点没有子节点的点,例如文本、注释、处理指令等中的点。 |
| 节点点(node point) | 容器节点有子节点的点。 |
| 范围(range) | 位于两个端点之间的XML内容选择。就像在Word中用光标高亮显示一段文本,所选区域有起点和终点,可视为一个范围。 |
| 折叠范围(collapsed range) | 起点和终点相同的范围。例如,从第3个字符开始并在第3个字符结束的范围就是折叠范围。 |
| 位置(location) | 类似于XPath中的节点,但XPointers可以从一个段落开始并在另一个段落结束,不一定指定特定节点,因此位置可以是节点、点或范围。 |
| 位置集(location - set) | 类似于XPath表达式创建的节点集,但除了节点外,还可以包括点和/或范围。 |
| 单例(singleton) | 当XPointer定位到一个范围、字符串范围或单个节点时使用该术语。XPointer标识的多个XML内容区域不被视为单例。 |
| 片段标识符(fragment identifier) | 具有转义URI的XPointer标识符(表达式)。转义是指将字符(如`<`)替换为其URI转义值(如`<`)。 |
### 2.4 XPointer表达式语法
在处理XPointer表达式时,会用到点和范围。点确定在文档中搜索XML内容的起始和结束位置,范围包含两个点之间的XML内容。使用两个点创建XPointer表达式的语法如下:
```plaintext
http://www.someURL.com/someDOC.xml#xpointer(<point1> to <point2>)
```
这个语法会链接到`point1`和`point2`之间指定的范围,并加载整个文档。这与HTML锚点的工作方式类似,但XPointer更加灵活。当解析器支持此功能后,就可以精确地挑选出远程文档中的XML部分。
## 3. XPointer对XPath的扩展
为避免与XPath语言的功能重复,XPointer尽可能利用XPath的功能,但它在以下方面扩展了XPath的功能:
- **添加位置类型**:在现有的XPath节点集中添加了点和范围位置类型。因此,XPointer节点测试除了包含XPath中的其他节点集测试外,还可以包括对位置集中的点或范围的测试。
- **引入定位器集概念**:基于XPath节点集的概念,添加了定位器集(locator - set)概念,除了包含XPath节点集中的项目外,还包括点和范围。
- **规定评估上下文**:XPath表达式的评估上下文由XPointer规则控制。
- **新增函数**:添加了几个新函数,如`string - range()`、`range - to()`、`range()`、`range - inside()`、`here()`、`origin()`、`start - point()`、`end - point()`。
### 3.1 XPointer函数
| 函数名 | 用途 | 示例 |
| ---- | ---- | ---- |
| range - to(expression) | 为上下文中的每个位置返回一个范围。 | `xpointer(id("1111")/range - to(id("2222")))`返回从ID为1111的元素到ID为2222的元素的范围;`xpointer(golfer[1]/range - to(golfer[3]))`返回从第一个`golfer`元素到第三个`golfer`元素的范围。 |
| string - range(location - set, string, number, n
0
0
复制全文
相关推荐









