活动介绍

XML技术全面解析:从基础到实践

立即解锁
发布时间: 2025-08-18 00:08:32 阅读量: 1 订阅数: 9
### XML 技术全面解析:从基础到实践 #### 1. XML 简介 在软件开发中,我们常常需要描述程序的配置信息。以往,我们会使用属性文件,它包含一组键值对,例如: ```plaintext fontname=Times Roman fontsize=12 windowsize=400 200 color=0 50 100 ``` 我们可以使用 `Properties` 类通过一个方法调用读取这样的文件。但属性文件存在一些局限性: - **结构表达能力有限**:很多时候,我们要描述的信息结构比属性文件能处理的更复杂。比如,将字体名称和大小合并为一个条目 `font=Times Roman 12` 会使解析变得困难,需要确定字体名称和大小的边界。 - **层次结构单一**:属性文件是扁平的层次结构,虽然程序员可以通过一些技巧(如 `title.fontname=Helvetica`)来绕过这个限制,但并不理想。 - **键的唯一性问题**:键必须唯一,存储值序列时需要额外的处理,如 `menu.item.1=Times Roman`。 而 XML 格式可以解决这些问题,它能够表达层次结构,比属性文件的扁平结构更加灵活。一个描述程序配置的 XML 文件可能如下所示: ```xml <configuration> <title> <font> <name>Helvetica</name> <size>36</size> </font> </title> <body> <name>Times Roman</name> <size>12</size> </body> <window> <width>400</width> <height>200</height> </window> <color> <red>0</red> <green>50</green> <blue>100</blue> </color> <menu> <item>Times Roman</item> <item>Helvetica</item> <item>Goudy Old Style</item> </menu> </configuration> ``` XML 和 HTML 都源于标准通用标记语言(SGML),但它们之间存在重要差异: | 对比项 | XML | HTML | | ---- | ---- | ---- | | 大小写敏感性 | 区分大小写,如 `<H1>` 和 `<h1>` 是不同的标签 | 不区分大小写 | | 结束标签 | 不能省略结束标签 | 某些情况下可以省略结束标签 | | 单标签元素 | 单标签元素必须以 `/` 结尾,如 `<img src="coffeecup.png"/>` | 无此要求 | | 属性值引号 | 属性值必须用引号括起来 | 引号可选 | | 属性值要求 | 所有属性必须有值 | 可以有不带值的属性名 | #### 2. XML 文档结构 一个 XML 文档通常以头部开始,例如: ```xml <?xml version="1.0"?> ``` 或者 ```xml <?xml version="1.0" encoding="UTF-8"?> ``` 虽然头部是可选的,但强烈建议添加。 头部之后通常是文档类型声明,例如: ```xml <!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.2//EN" "http://java.sun.com/j2ee/dtds/web-app_2_2.dtd"> ``` 文档类型声明是确保文档正确性的重要机制,但不是必需的。 最后,XML 文档的主体包含根元素,根元素可以包含其他元素。例如: ```xml <?xml version="1.0"?> <!DOCTYPE configuration ...> <configuration> <title> <font> <name>Helvetica</name> <size>36</size> </font> </title> ... </configuration> ``` 一个元素可以包含子元素、文本或两者。例如,`font` 元素有两个子元素 `name` 和 `size`,`name` 元素包含文本 `"Helvetica"`。 XML 元素可以包含属性,如 `<size unit="pt">36</size>`。在 XML 设计中,关于何时使用元素和何时使用属性存在一些争议。一般来说,属性应仅用于修改值的解释,而不是指定值。如果对某个设置是否是对值解释的修改存在疑问,建议使用元素而不是属性。许多有用的 DTD 根本不使用属性。 此外,XML 文档中还有一些其他的标记指令: - **字符引用**:形式为 `&#d;` 或 `&#xh;`,其中 `d` 是十进制 Unicode 值,`h` 是十六进制 Unicode 值,如 `&#233;` 表示字符 `é`,`&#x2122;` 表示字符 `™`。 - **实体引用**:形式为 `&name;`,如 `&lt;` 表示小于号,`&gt;` 表示大于号等。可以在文档类型定义(DTD)中定义其他实体引用。 - **CDATA 部分**:由 `<![CDATA[` 和 `]]>` 分隔,用于包含包含 `<`、`>`、`&` 等字符的字符串,而不将它们解释为标记,例如 `<![CDATA[< & > are my favorite delimiters]]>`。 - **处理指令**:由 `<?` 和 `?>` 分隔,例如 `<?xml-stylesheet href="mystyle.css" type="text/css"?>`,用于为处理 XML 文档的应用程序提供信息。 - **注释**:由 `<!--` 和 `-->` 分隔,例如 `<!-- This is a comment. -->`,注释仅用于人类读者,不应包含隐藏命令。 #### 3. 解析 XML 文档 要处理 XML 文档,需要对其进行解析。XML 解析器有两种类型: - **文档对象模型(DOM)解析器**:将 XML 文档读入树结构。 - **简单 XML API(SAX)解析器**:在读取 XML 文档时生成事件。 对于大多数情况,DOM 解析器更易于使用。如果处理非常长的文档,其树结构会占用大量内存,或者只对少数元素感兴趣而不关心其上下文,则可以考虑使用 SAX 解析器。 以下是使用 DOM 解析器读取 XML 文档的步骤: 1. 获取 `DocumentBuilderFactory` 实例: ```java DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); ``` 2. 获取 `DocumentBuilder` 实例: ```java DocumentBuilder builder = factory.newDocumentBuilder(); ``` 3. 读取文档: - 从文件读取: ```java File f = ... Document doc = builder.parse(f); ``` - 从 URL 读取: ```java URL u = ... Document doc = builder.parse(u); ``` - 从输入流读取: ```java InputStream in = ... Document doc = builder.parse(in); ``` `Document` 对象是 XML 文档树结构的内存表示,它由实现 `Node` 接口及其各种子接口的对象组成。 要分析文档内容,可以通过以下步骤: 1. 获取根元素: ```java Element root = doc.getDocumentElement(); ``` 2. 获取元素的标签名: ```java String tagName = root.getTagName(); ``` 3. 获取元素的子节点: ```java NodeList children = root.getChildNodes(); ``` 在分析子节点时需要注意,解析器可能会包含空白字符。例如,对于以下文档: ```xml <font> <name>Helvetica</name> <size>36</size> </font> ``` `font` 元素的子节点可能包含空白字符,实际会有 5 个节点。如果只关心子元素,可以忽略空白字符: ```java for (int i = 0; i < children.getLength(); i++) { Node child = children.item(i); if (child instanceof Element) { Element childElement = (Element) child; // 处理子元素 } } ``` 要获取元素中的文本内容,可以使用以下方法: ```java for (int i = 0; i < children.getLength(); i++) { Node child = children.item(i); if (child instanceof Element) { Element childElement = (Element) child; Text textNode = childElement.getFirstChild(); String text = textNode.getData().trim(); if (childElement.getTagName().equals("name")) { name = text; } else if (childElement.getTagName().equals("size")) { size = Integer.parseInt(text); } } } ``` 还可以通过 `getLastChild` 获取最后一个子节点,通过 `getNextSibling` 获取下一个兄弟节点。遍历子节点的另一种方式是: ```java for (Node childNode = element.getFirstChild(); childNode != null; childNode = childNode.getNextSibling()) { // 处理子节点 } ``` 要枚举节点的属性,可以使用 `getAttributes` 方法: ```java NamedNodeMap attributes = element.getAttributes(); for (int i = 0; i < attributes.getLength(); i++) { Node attribute = attributes.item(i); String name = attribute.getNodeName(); String value = attribute.getNodeValue(); // 处理属性 } ``` 或者直接通过属性名获取属性值: ```java String unit = element.getAttribute("unit"); ``` 以下是一个完整的示例代码(`DOMTreeTest.java`),用于将 XML 文档显示为树: ```java import java.awt.*; import java.awt.event.*; import java.io.*; import javax.swing.*; import javax.swing.event.*; import javax.swing.tree.*; import javax.xml.parsers.*; import org.w3c.dom.*; import org.xml.sax.*; /** * This program displays an XML document as a tree. */ public class DOMTreeTest { public static void main(String[] args) { JFrame frame = new DOMTreeFrame(); frame.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE); frame.show(); } } /** * This frame contains a tree that displays ```
corwn 最低0.47元/天 解锁专栏
赠100次下载
继续阅读 点击查看下一篇
profit 400次 会员资源下载次数
profit 300万+ 优质博客文章
profit 1000万+ 优质下载资源
profit 1000万+ 优质文库回答
复制全文

相关推荐

李_涛

知名公司架构师
拥有多年在大型科技公司的工作经验,曾在多个大厂担任技术主管和架构师一职。擅长设计和开发高效稳定的后端系统,熟练掌握多种后端开发语言和框架,包括Java、Python、Spring、Django等。精通关系型数据库和NoSQL数据库的设计和优化,能够有效地处理海量数据和复杂查询。
最低0.47元/天 解锁专栏
赠100次下载
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
千万级 优质文库回答免费看
立即解锁

专栏目录

最新推荐

Clojure多方法:定义、应用与使用场景

### Clojure 多方法:定义、应用与使用场景 #### 1. 定义多方法 在 Clojure 中,定义多方法可以使用 `defmulti` 函数,其基本语法如下: ```clojure (defmulti name dispatch-fn) ``` 其中,`name` 是新多方法的名称,Clojure 会将 `dispatch-fn` 应用于方法参数,以选择多方法的特定实现。 以 `my-print` 为例,它接受一个参数,即要打印的内容,我们希望根据该参数的类型选择特定的实现。因此,`dispatch-fn` 需要是一个接受一个参数并返回该参数类型的函数。Clojure 内置的

在线票务系统解析:功能、流程与架构

### 在线票务系统解析:功能、流程与架构 在当今数字化时代,在线票务系统为观众提供了便捷的购票途径。本文将详细解析一个在线票务系统的各项特性,包括系统假设、范围限制、交付计划、用户界面等方面的内容。 #### 系统假设与范围限制 - **系统假设** - **Cookie 接受情况**:互联网用户不强制接受 Cookie,但预计大多数用户会接受。 - **座位类型与价格**:每场演出的座位分为一种或多种类型,如高级预留座。座位类型划分与演出相关,而非个别场次。同一演出同一类型的座位价格相同,但不同场次的价格结构可能不同,例如日场可能比晚场便宜以吸引家庭观众。 -

响应式Spring开发:从错误处理到路由配置

### 响应式Spring开发:从错误处理到路由配置 #### 1. Reactor错误处理方法 在响应式编程中,错误处理是至关重要的。Project Reactor为其响应式类型(Mono<T> 和 Flux<T>)提供了六种错误处理方法,下面为你详细介绍: | 方法 | 描述 | 版本 | | --- | --- | --- | | onErrorReturn(..) | 声明一个默认值,当处理器中抛出异常时发出该值,不影响数据流,异常元素用默认值代替,后续元素正常处理。 | 1. 接收要返回的值作为参数<br>2. 接收要返回的值和应返回默认值的异常类型作为参数<br>3. 接收要返回

并发编程:多语言实践与策略选择

### 并发编程:多语言实践与策略选择 #### 1. 文件大小计算的并发实现 在并发计算文件大小的场景中,我们可以采用数据流式方法。具体操作如下: - 创建两个 `DataFlowQueue` 实例,一个用于记录活跃的文件访问,另一个用于接收文件和子目录的大小。 - 创建一个 `DefaultPGroup` 来在线程池中运行任务。 ```plaintext graph LR A[创建 DataFlowQueue 实例] --> B[创建 DefaultPGroup] B --> C[执行 findSize 方法] C --> D[执行 findTotalFileS

编程中的数组应用与实践

### 编程中的数组应用与实践 在编程领域,数组是一种非常重要的数据结构,它可以帮助我们高效地存储和处理大量数据。本文将通过几个具体的示例,详细介绍数组在编程中的应用,包括图形绘制、随机数填充以及用户输入处理等方面。 #### 1. 绘制数组图形 首先,我们来创建一个程序,用于绘制存储在 `temperatures` 数组中的值的图形。具体操作步骤如下: 1. **创建新程序**:选择 `File > New` 开始一个新程序,并将其保存为 `GraphTemps`。 2. **定义数组和画布大小**:定义一个 `temperatures` 数组,并设置画布大小为 250 像素×250 像

Hibernate:从基础使用到社区贡献的全面指南

# Hibernate:从基础使用到社区贡献的全面指南 ## 1. Hibernate拦截器基础 ### 1.1 拦截器代码示例 在Hibernate中,拦截器可以对对象的加载、保存等操作进行拦截和处理。以下是一个简单的拦截器代码示例: ```java Type[] types) { if ( entity instanceof Inquire) { obj.flushDirty(); return true; } return false; } public boolean onLoad(Object obj, Serial

JavaEE7中的MVC模式及其他重要模式解析

### Java EE 7中的MVC模式及其他重要模式解析 #### 1. MVC模式在Java EE中的实现 MVC(Model-View-Controller)模式是一种广泛应用于Web应用程序的设计模式,它将视图逻辑与业务逻辑分离,带来了灵活、可适应的Web应用,并且允许应用的不同部分几乎独立开发。 在Java EE中实现MVC模式,传统方式需要编写控制器逻辑、将URL映射到控制器类,还需编写大量的基础代码。但在Java EE的最新版本中,许多基础代码已被封装好,开发者只需专注于视图和模型,FacesServlet会处理控制器的实现。 ##### 1.1 FacesServlet的

AWSLambda冷启动问题全解析

### AWS Lambda 冷启动问题全解析 #### 1. 冷启动概述 在 AWS Lambda 中,冷启动是指函数实例首次创建时所经历的一系列初始化步骤。一旦函数实例创建完成,在其生命周期内不会再次经历冷启动。如果在代码中添加构造函数或静态初始化器,它们仅会在函数冷启动时被调用。可以在处理程序类的构造函数中添加显式日志,以便在函数日志中查看冷启动的发生情况。此外,还可以使用 X-Ray 和一些第三方 Lambda 监控工具来识别冷启动。 #### 2. 冷启动的影响 冷启动通常会导致事件处理出现延迟峰值,这也是人们关注冷启动的主要原因。一般情况下,小型 Lambda 函数的端到端延迟

设计与实现RESTfulAPI全解析

### 设计与实现 RESTful API 全解析 #### 1. RESTful API 设计基础 ##### 1.1 资源名称使用复数 资源名称应使用复数形式,因为它们代表数据集合。例如,“users” 代表用户集合,“posts” 代表帖子集合。通常情况下,复数名词表示服务中的一个集合,而 ID 则指向该集合中的一个实例。只有在整个应用程序中该数据类型只有一个实例时,使用单数名词才是合理的,但这种情况非常少见。 ##### 1.2 HTTP 方法 在超文本传输协议 1.1 中定义了八种 HTTP 方法,但在设计 RESTful API 时,通常只使用四种:GET、POST、PUT 和

ApacheThrift在脚本语言中的应用

### Apache Thrift在脚本语言中的应用 #### 1. Apache Thrift与PHP 在使用Apache Thrift和PHP时,首先要构建I/O栈。以下是构建I/O栈并调用服务的基本步骤: 1. 将传输缓冲区包装在二进制协议中,然后传递给服务客户端的构造函数。 2. 构建好I/O栈后,打开套接字连接,调用服务,最后关闭连接。 示例代码中的异常捕获块仅捕获Apache Thrift异常,并将其显示在Web服务器的错误日志中。 PHP错误通常在Web服务器的上下文中在服务器端表现出来。调试PHP程序的基本方法是检查Web服务器的错误日志。在Ubuntu 16.04系统中