新闻中心
Go语言中 binary.Uvarint 与固定长度整数解码的深入理解

本文深入探讨go语言中`binary.uvarint`函数的工作原理,解释其基于protocol buffers变长编码的特性,并通过实例详细分析为何在特定字节序列下可能无法得到预期结果。文章还将对比`uvarint`与`binary.littleendian.uint32`等固定长度解码器的区别,指导开发者根据实际编码需求选择正确的解码方法,避免常见的混淆。
引言:理解Go的 binary 包与整数编码
在Go语言中,encoding/binary 包提供了对数字和字节序列之间转换的支持,这在网络通信、文件存储或与外部系统交互时尤为重要。它包含了一系列用于处理不同编码格式的函数,例如变长整数(Varint)编码和固定长度整数(如uint32、int64)的字节序(大端或小端)编码。然而,不理解这些编码方式的具体差异,可能会导致解码时得到非预期的结果。本文将聚焦于binary.Uvarint与固定长度整数解码的区别,并通过具体案例进行深入剖析。
binary.Uvarint 的工作原理:Protocol Buffers 变长编码
binary.Uvarint 函数用于解码变长无符号整数(Unsigned Varint)。这种编码方式起源于Protocol Buffers,其主要目的是用更少的字节存储较小的数值,从而节省存储空间和传输带宽。
Varint编码的核心规则如下:
- 最高有效位 (MSB) 作为延续标志:每个字节的最高位(第8位)用于指示当前字节是否是Varint的一部分。如果MSB为1,表示后续还有字节需要继续解码;如果MSB为0,表示当前字节是Varint的最后一个字节。
- 低7位存储实际数据:每个字节的低7位用于存储整数的实际数据。
- 小端序存储7位组:这些7位数据组是按照小端序(Least Significant Group First)存储的。这意味着最低有效位的7位组会出现在字节序列的最前面。
案例分析:binary.Uvarint 的行为解析
假设我们有一个字节切片 [159 124 0 0],并尝试使用 binary.Uvarint 进行解码。
package main import ( "encoding/binary" "fmt" ) func main() { slice := []byte{159, 124, 0, 0} val, encodeBytes := binary.Uvarint(slice) fmt.Printf("Uvarint decoding: val = %d, encodeBytes = %d\n", val, encodeBytes) }
运行上述代码,输出结果将是 val = 15903, encodeBytes = 2。这可能与我们期望的 31903 不同。下面我们详细分析 binary.Uvarint 如何得出 15903:
-
字节序列的二进制表示:
- 159 对应 1001 1111
- 124 对应 0111 1100
- 0 对应 0000 0000
- 0 对应 0000 0000
-
解码过程:
-
第一个字节 159 (1001 1111):
- MSB 是 1,表示这不是Varint的最后一个字节。
- 低7位是 001 1111。
-
第二个字节 124 (0111 1100):
- MSB 是 0,表示这是Varint的最后一个字节。
- 低7位是 111 1100。
- 由于第二个字节的MSB为0,binary.Uvarint 会停止解码,后续的 0 0 字节将被忽略。
-
第一个字节 159 (1001 1111):
-
组合7位数据组: 我们提取到的两个7位数据组是:
- 来自第一个字节:001 1111
- 来自第二个字节:111 1100
-
反序与拼接: 根据Varint编码规则,这些7位组是按照小端序(least significant group first)存储的。因此,在组合成最终的数值时,需要将它们反序(即把最高有效组放在前面)。
- 反序后:111 1100 (来自第二个字节), 001 1111 (来自第一个字节)
- 拼接成一个完整的二进制序列:0011 1110 0001 1111
转换为十进制: 将 0011 1110 0001 1111 转换为十进制: 1*2^0 + 1*2^1 + 1*2^2 + 1*2^3 + 0*2^4 + 0*2^5 + 0*2^6 + 1*2^7 + 1*2^8 + 1*2^9 + 1*2^10 + 1*2^11 + 0*2^12 + 0*2^13 + 1*2^14 + 0*2^151 + 2 + 4 + 8 + 128 + 256 + 512 + 1024 + 2048 + 4096 + 8192 = 15903
因此,binary.Uvarint 正确地按照其定义的Varint编码规则,将 [159 124] 解码为 15903。期望的 31903 并不是Varint编码 [159 124 0 0] 的结果。
固定长度整数解码:binary.LittleEndian.Uint32
如果我们的字节序列 [159 124 0 0] 实际上代表的是一个固定长度的32位无符号整数(uint32),并且是按照小端序(Little-Endian)存储的,那么 binary.Uvarint 就不是正确的选择。在这种情况下,我们应该使用 binary.LittleEndian.Uint32。
美图云修
商业级AI影像处理工具
50
查看详情
小端序 (Little-Endian) 意味着多字节数值的最低有效字节存储在内存地址最低的位置,而最高有效字节存储在内存地址最高的位置。对于字节序列 [159 124 0 0],如果它是一个小端序的 uint32:
- 159 是最低有效字节 (byte 0)
- 124 是次低有效字节 (byte 1)
- 0 是次高有效字节 (byte 2)
- 0 是最高有效字节 (byte 3)
其十进制值为: 159 * 256^0 + 124 * 256^1 + 0 * 256^2 + 0 * 256^3= 159 + 124 * 256 + 0 + 0= 159 + 31744= 31903
这正是我们期望的结果。
下面是使用 binary.LittleEndian.Uint32 进行解码的示例代码:
package main
import (
"encoding/binary"
"fmt"
)
func main() {
slice := []byte{159, 124, 0, 0}
// 使用 LittleEndian.Uint32 解码固定长度的uint32
// 确保切片长度至少为4字节
if len(slice) >= 4 {
val := binary.LittleEndian.Uint32(slice[:4])
fmt.Printf("LittleEndian.Uint32 decoding: val = %d\n", val)
} else {
fmt.Println("Slice too short for Uint32 decoding.")
}
}运行此代码,将输出 LittleEndian.Uint32 decoding: val = 31903。
选择正确的解码方法
理解不同编码机制是关键。
- binary.Uvarint:适用于处理 Protocol Buffers 等场景中使用的变长整数编码。它的特点是根据数值大小动态占用字节数,并且通过MSB来判断数值的结束。
- binary.LittleEndian.Uint32 / binary.BigEndian.Uint32:适用于处理固定长度整数(如 uint32、uint64 等),这些整数的字节序列按照特定的字节序(小端序或大端序)排列。在与C/C++程序、网络协议或特定文件格式交互时,这种固定长度的字节序编码更为常见。
注意事项:
- 使用 binary.Uvarint 时,它会返回解码的字节数 (encodeBytes),这对于处理连续的Varint序列非常有用。
- 使用固定长度解码器时,务必确保输入的字节切片长度足够,否则会引发运行时错误(如 panic: slice bounds out of range)。
总结
Go语言的 encoding/binary 包提供了灵活的整数与字节序列转换功能。然而,开发者必须清楚地了解数据源所采用的具体编码方式,无论是变长整数编码(如Protocol Buffers的Varint)还是固定长度整数的字节序编码(大端或小端),并据此选择匹配的解码函数。混淆这些概念是导致解码错误和程序行为异常的常见原因。通过本文的详细分析和示例,希望能帮助开发者更准确地理解和应用Go语言中的整数编码与解码机制。
以上就是Go语言中 binary.Uvarint 与固定长度整数解码的深入理解的详细内容,更多请关注其它相关文章!
# 转换为
# 小店开店营销推广方案
# fb产品营销推广
# 商城类型网站建设
# 南京网络推广网站
# 怎么做线下招聘网站推广
# 站长工具seo网站排行
# 朋友圈前期推广营销
# 苏州抖音seo广告
# 餐厅设计有哪些网站推广
# 南阳抖音seo效果
# 的是
# 反序
# 工作原理
# go
# 多字
# 适用于
# 第一个
# 美图
# 变长
# 第二个
# 排列
# 区别
# c++
# ai
# 字节
# 编码
# go语言
相关栏目:
【
科技资讯46185 】
【
网络学院92790 】
相关推荐:
如何使用 Excel 发布器与 Power BI 分享 Excel 洞察
树莓派传感器触发:通过Twilio API发送WhatsApp消息教程
Mac怎么使用表情符号_Mac Emoji快捷键面板
Python模块化编程:有效管理依赖与避免循环引用
美团外卖商家服务中心入口 美团商家版官网入口
Golang如何使用new_Go new分配内存机制讲解
CKEditor 5 自定义构建在React应用中渲染失败的调试与解决
Win11怎么隐藏桌面图标 Win11一键隐藏所有桌面元素及恢复显示
b站赚钱渠道_b站收益来源
windows10怎么查看本机ip_windows10命令提示符ipconfig使用
c++如何实现一个简单的ECS框架_c++数据驱动设计与游戏开发
TikTok网页版直接登录 TikTok网页端官方平台入口
必由学官方平台入口 必由学在线课堂登录地址
如何优雅地解决Livewire文件上传难题?SpatieLivewireFilepond让一切变得简单
EMS快递官网app_中国邮政速递物流手机客户端
QQ邮箱官方邮箱登录入口 QQ邮箱网页版快速访问
外媒分析《GTA6》定价:卖100美元可以但真没必要!
漫蛙官网正版漫画入口 漫蛙2官方网页登录地址
韩剧圈正版入口页面_韩剧圈官网登录链接
192.168.1.1管理中心入口 192.168.1.1路由器网页设置平台
Linux如何构建多环境配置管理_Linux多环境配置方案
如何在CSS中使用浮动制作导航栏_float实现水平菜单
Vue.js 图片显示异常排查:理解应用挂载范围与DOM ID唯一性
LINUX的perf命令入门_LINUX官方性能分析工具的使用与解读
从J*aScript对象中精确提取指定属性的教程
大象笔记网页版入口 印象笔记网页版登录入口
Web Components中自定义开关组件状态同步的常见陷阱与解决方案
PHP 枚举:根据字符串获取枚举案例的策略与实现
斑马英语APP如何开启夜间护眼阅读_斑马英语APP夜间模式与低蓝光设置教程
Golang切片为何属于引用类型_Golang slice底层结构与引用语义说明
如何使用Rector自动化升级旧代码_通过Composer安装和配置Rector进行代码重构
铁路12306卧铺选择攻略 铁路12306下铺座位预定技巧
J*a里如何使用N*igableMap进行导航操作_可导航Map操作技巧解析
Golang如何处理RPC请求负载均衡_Golang RPC请求负载均衡策略与实践
多闪网页版在线观看免费入口_多闪官网访问入口
C++指针和引用有什么区别_C++内存管理核心概念深度解析
vivo云服务网页版登录 怎么登录vivo云服务网页版
怎么在浏览器上运行HTML文件_浏览器运行HTML文件技巧【技巧】
126邮箱手机版登录官网2026_126手机邮箱免费入口最新
qq邮箱发邮件给国外发不出去_QQ邮箱国际邮件发送失败原因与解决
邮政快递包裹最新位置 邮政快递实时追踪入口
4399体育竞技小游戏_4399小游戏赛事入口
AO3最新官网入口公告_2025AO3镜像站实时查询方法
HTML转PPT成品工具有哪些?HTML网页转PPT成品工具大全
《GTA6》开发画面疑似泄露!这次可不是AI了
iwriter统一登录平台 iwrite账号密码登录页面
优化大型XML文件解析:基于Python流式处理的内存高效方案
qq浏览器如何查看和导出已保存的密码 qq浏览器密码管理器数据备份教程
PHP中SSG-WSG API的AES加密实践:正确使用初始化向量
yy漫画网页版官方入口_yy漫画官网登录页面链接


2025-11-24
浏览次数:次
返回列表
ort (
"encoding/binary"
"fmt"
)
func main() {
slice := []byte{159, 124, 0, 0}
val, encodeBytes := binary.Uvarint(slice)
fmt.Printf("Uvarint decoding: val = %d, encodeBytes = %d\n", val, encodeBytes)
}