新闻中心
怎么用Rust语言解析XML quick-xml库教程
quick-xml是Rust中解析XML最常用、性能最佳且文档最全的库,支持流式(Reader)和serde反序列化两种方式;需在Cargo.toml中添加quick-xml = { version = "0.35", features = ["encoding"] }以支持非UTF-8编码。

用 Rust 解析 XML,quick-xml 是目前最常用、性能最好、文档较全的库。它支持流式(Reader)和树状(events + BytesStart 等)两种解析方式,兼顾内存效率和开发便利性。
安装 quick-xml 依赖
在 Cargo.toml 中添加:
[dependencies]
quick-xml = { version = "0.35", features = ["encoding"] }
注意:加 features = ["encoding"] 才能正确处理 UTF-8 以外的编码(如 GBK,不过实际中建议 XML 文件统一用 UTF-8)。
基础流式解析:读取元素和文本
适合大文件或只需提取部分字段的场景,不加载整个 XML 到内存。
示例 XML(book.xml):
<library>
<book id="1">
<title>Rust编程入门</title>
<author>张三</author>
</book>
<book id="2">
<title>XML精讲</title>
<author>李四</author>
</book>
</library>
用 Reader 逐事件解析:
use quick_xml::events::BytesStart;
use quick_xml::Reader;
fn main() -> Result<(), Box<std::error::Error>> {
let xml = r#"
<library>
<book id="1">
<title>Rust编程入门</title>
<author>张三</author>
</book>
</library>"#;
let mut reader = Reader::from_reader(xml.as_bytes());
reader.trim_text(true); // 自动忽略纯空白文本节点
let mut buf = Vec::new();
let mut books = Vec::new();
loop {
match reader.read_event_into(&mut buf) {
Ok(quick_xml::events::BytesEvent::Start(e)) => {
if e.name().as_ref() == b"book" {
let id = e.attributes()
.find(|a| a.key.as_ref() == b"id")
.map(|a| std::str::from_utf8(&a.value).unwrap_or("").to_string());
books.push((id, String::new(), String::new()));
}
}
Ok(quick_xml::events::BytesEvent::Text(e)) => {
let tex
t = e.unescape_and_decode(&reader)?; // 安全解码实体(& → &)
if let Some(last) = books.last_mut() {
// 简单逻辑:紧接在 title/author 开始标签后的文本即为内容
// 实际中建议用状态机或栈记录当前路径
}
}
Ok(quick_xml::events::BytesEvent::Eof) => break,
Err(e) => return Err(e.into()),
_ => {}
}
buf.clear();
}
Ok(())
}
⚠️ 流式解析需手动维护上下文(比如当前在哪个标签内),适合结构简单或性能敏感场景。
拾贝
一键同步微信读书所有笔记和划线,并在新标签页回顾
186
查看详情
更推荐:用 events + 辅助类型提取结构化数据
不用自己写状态机,借助 BytesStart、BytesText 和 Reader::read_element 可清晰提取嵌套结构。
例如,定义一个结构体并从 XML 构建它:
use quick_xml::de::from_str;
use serde::{Deserialize, Serialize};
#[derive(Deserialize, Debug)]
struct Book {
#[serde(rename = "@id")]
id: String,
title: String,
author: String,
}
#[derive(Deserialize, Debug)]
struct Library {
#[serde(rename = "$value")]
books: Vec<Book>,
}
// 注意:quick-xml 的 serde 支持要求 XML 标签名与字段名匹配(或用 rename)
// 且需确保 XML 是形如 <library><book>...</book></library> 这样扁平嵌套
然后直接反序列化:
let data = r#"
<library>
<book id="1">
<title>Rust编程入门</title>
<author>张三</author>
</book>
</library>"#;
let library: Library = from_str(data).map_err(|e| e.to_string())?;
println!("{:#?}", library);
✅ 前提是开启 quick-xml 的 serialize feature(已在 0.35+ 默认启用),并引入 serde 和 serde_derive。
常见问题与技巧
-
中文乱码? 确保 XML 声明里写了
<?xml version="1.0" encoding="UTF-8"?>,且文件本身是 UTF-8 编码;Rust 字符串默认 UTF-8,无需额外转码 -
解析失败报 “invalid UTF-8”? 检查是否误把二进制数据(如 ZIP 内的 XML)当纯文本传入;用
std::fs::read而非read_to_string读取原始字节再交给Reader::from_reader -
想跳过某个标签? 用
reader.read_to_end(name)?快速消耗掉整段(含子节点) -
需要修改后再输出 XML? 用
Writer类型,配合BytesStart/BytesText构造事件写回
基本上就这些。quick-xml 上手不难,关键在于分清“流式遍历”和“结构反序列化”两种模式的适用场景——小文件、结构固定,优先用 serde;大文件、只取几个字段,用 Reader + 事件循环。
以上就是怎么用Rust语言解析XML quick-xml库教程的详细内容,更多请关注其它相关文章!
# 编码
# 阿西网站推广系统最新版
# 南山百度推广网站优化
# 组群营销推广
# 旅游绿色营销推广
# 做网站优化要注意什么
# 构建一个
# 大文件
# 最常用
# 如何处理
# 序列化
# 拾贝
# 两种
# 流式
# 高性能
# 自定义
# 常见问题
# ai
# 栈
# 中文乱码
# 字节
# go
# 线上网站推广推荐
# 大足高效网站建设项目
# 药品推广营销活动
# 灰色seo技术
# 北京专业网站建设教程
相关栏目:
【
科技资讯46185 】
【
网络学院92790 】
相关推荐:
iCloud登录入口网页版 苹果iCloud官网登录
LINUX的I/O重定向是什么_深入理解LINUX中 >、>> 与 < 的区别
Bing引擎入口最新2025 Bing搜索免费官方登录
火锅吃太多会怎样 火锅吃太多会上火吗
随机参数递归函数的基准调用次数与时间复杂度探究
Android Studio计算器C键功能异常排查与修复教程
React/Next.js中实现列表项的动态移动与状态管理:兼论唯一键的重要性
zookeeper 都有哪些功能?
Flexbox布局实践:实现粘性导航栏与底部固定页脚
AO3网页版最新入口合集 Archive of Our Own在线访问指南
css链接悬停下划线样式如何自定义_使用::after结合content和transition
为什么我的微信朋友圈看不到别人的更新_微信朋友圈更新显示异常解决方法
Go语言中Map存储的结构体如何调用指针方法:深入解析与实践
电脑屏幕颜色不舒服怎么办_Windows夜间模式与色彩校准教程【护眼技巧】
SteamMachine定价或为699美元 大家想入手吗?
163邮箱网页版入口导航平台 163邮箱网页版登录入口官网导航
QQ邮箱在线登录平台 QQ邮箱个人邮箱网页版入口
夸克浏览器图书入口 夸克手机浏览器阅读入口
Go与Ruby之间实现AES加密互通:CFB模式下的密钥长度匹配策略
J*a最大堆Heapify方法修复:索引计算与边界条件深度解析
荣耀Play7T运行卡顿解决_荣耀Play7T性能优化
css元素hover动画延迟生效怎么办_使用animation-delay调整触发时间
Go语言中JSON数据解析与字段访问教程
邮政编码查询不到怎么办_邮政编码查询不到的常见原因与对策
整合Supabase认证与Django模型:跨模式迁移的解决方案
手机CPU怎么影响游戏体验_手机CPU对游戏性能的影响分析
2026春节假期时间安排 2026春节假日查询
在python-socketio事件处理器中安全访问Flask应用上下文
解决 Express.js 中 PUT 请求密码修改失败的路由配置指南
铁路12306卧铺选择攻略 铁路12306下铺座位预定技巧
Lar*el DB::listen 事件中的查询执行时间单位解析
谷歌邮箱网页版官方页面入口 谷歌邮箱网页端快速访问
网易大神账号申诉需要多久_网易大神账号申诉流程说明
C++如何生成随机数_C++ random库使用方法与范围设置
服务端验证_j*ascript输入检查
蓝湖怎样用切图标注提对接效率_蓝湖用切图标注提对接效率【设计对接】
58动漫网在线官方网 58动漫网正版动漫入口网址
1688商家版怎样分析买家画像精准供货_1688商家版分析买家画像精准供货【供货策略】
Win11怎么修改默认浏览器_Windows 11设置Chrome为默认
poki网页游戏推荐_poki免费游戏平台入口
Win11怎么关闭触摸屏_Windows 11禁用HID符合标准触摸屏
深入理解J*a编译器的兼容性选项:从-source到--release
AngularJS $http POST请求数据传递与Go后端接收实践
如何在Promise链中有效终止错误处理后的执行
使用 Pandas 高效处理 .dat 文件:数据清洗与数值计算实战
KFC游戏互动怎么赢取优惠券_KFC线上游戏活动参与与优惠代码赢取教程
css滚动动画效果怎么实现_使用Animate.css滚动触发动画类
sublime怎么进行远程开发编辑_配置rsub/rmate实现sublime编辑服务器文件
如何优雅地扩展SprykerGlue后端API授权逻辑,使用spryker/glue-backend-api-application-authorization-connector-extension
AO3官方在线访问地址 Archive of Our Own最新镜像合集


2025-12-13
浏览次数:次
返回列表
t = e.unescape_and_decode(&reader)?; // 安全解码实体(& → &)
if let Some(last) = books.last_mut() {
// 简单逻辑:紧接在 title/author 开始标签后的文本即为内容
// 实际中建议用状态机或栈记录当前路径
}
}
Ok(quick_xml::events::BytesEvent::Eof) => break,
Err(e) => return Err(e.into()),
_ => {}
}
buf.clear();
}
Ok(())
}