新闻中心

Golang如何使用 text/scanner 解析文本_Golang text/scanner 文本扫描与分析

2025-11-13
浏览次数:
返回列表
text/scanner是Go标准库的轻量级词法分析工具,用于分词处理;通过Init设置源文本,Scan逐个读取token,结合fset.Position获取位置信息,支持自定义错误回调和跳过空白与注释,适用于解析表达式、配置文件等场景。

golang如何使用 text/scanner 解析文本_golang text/scanner 文本扫描与分析

在Go语言中,text/scanner 是标准库 go/scanner 提供的一个轻量级工具,用于对文本进行词法扫描(lexical scanning),适合编写简单的解析器、配置文件读取器或自定义脚本语言的前端处理。它不像完整的解析器生成器那样强大,但对于大多数需要逐词分析文本的场景已经足够高效且易于使用。

初始化 scanner 并设置源文本

要使用 text/scanner,先导入 "go/scanner" 包。虽然名字叫 "go/scanner",但它可以用于任意文本扫描,不局限于 Go 代码。

创建一个 scanner.Scanner 实例,并通过 Init 方法传入一个 io.Reader 或字节切片作为输入源。

package main
<p>import (
"fmt"
"strings"
"go/scanner"
"go/token"
)</p><p>func main() {
src := "x := 42 + y"
var s scanner.Scanner
fset := token.NewFileSet()                      // 用于记录位置信息
file := fset.AddFile("", fset.Base(), len(src)) // 创建文件对象
s.Init(file, []byte(src), nil, 0)</p><pre class="brush:php;toolbar:false;">for {
    tok := s.Scan()
    if tok == scanner.EOF {
        break
    }
    pos := fset.Position(s.Pos()) // 获取当前 token 的位置
    fmt.Printf("%s: %s\n", pos, scanner.TokenString(tok))
}

}

输出示例:

1:1: IDENT
1:3: DEFINE
1:5: INT
1:8: ADD
1:10: IDENT

可以看到每个 token 的位置和类型被依次打印出来。

识别标识符与自定义处理

默认情况下,scanner 会将关键字、操作符、数字、字符串等识别为对应 token。如果想捕获标识符的具体内容,可以通过 s.TokenText() 获取原始文本。

for {
    tok := s.Scan()
    if tok == scanner.EOF {
        break
    }
    text := s.TokenText()
    switch tok {
    case scanner.IDENT:
        fmt.Printf("变量或关键字: %s\n", text)
    case scanner.INT:
        fmt.Printf("整数: %s\n", text)
    case '+', '-', '*', '/':
        fmt.Printf("运算符: %s\n", text)
    default:
        fmt.Printf("其他: %s\n", text)
    }
}

这样可以根据 token 类型做进一步处理,比如构建抽象语法树的节点,或者执行简单计算逻辑。

处理错误与跳过空白字符

scanner 支持错误回调机制,在遇到非法字符时调用指定函数。同时可以通过设置 Mode 来控制哪些 token 被忽略(如空格、注释)。

Perplexity Perplexity

Perplexity是一个ChatGPT和谷歌结合的超级工具,可以让你在浏览互联网时提出问题或获得即时摘要

Perplexity 302 查看详情 Perplexity

例如,只关注标识符和数字,忽略空格和换行:

s.Init(file, []byte(src), func(pos token.Position, msg string) {
    fmt.Printf("扫描错误: %s: %s\n", pos, msg)
}, scanner.SkipComments)

常用 Mode 标志包括:

  • scanner.ScanComments:返回注释作为 token
  • scanner.SkipComments:自动跳过注释
  • scanner.GoTokens:仅识别 Go 语言关键字(可选)

实际应用场景举例:简易表达式解析

假设你要解析类似 a + b * 10 这样的算术表达式,可以用 scanner 拆分成 token 流,再配合简单的递归下降解析逻辑处理优先级。

扫描阶段只需完成“分词”任务:

tokens := []string{}
for {
    tok := s.Scan()
    if tok == scanner.EOF {
        break
    }
    tokens = append(tokens, s.TokenText())
}
fmt.Println("Token 列表:", tokens) // 输出: [a + b * 10]

后续可用栈或优先级表法进行求值,而扫描部分由 text/scanner 稳定支持。

基本上就这些。对于大多数轻量级文本分析需求,text/scanner 提供了简洁高效的接口,无需引入复杂依赖即可实现可靠的词法分析功能。

以上就是Golang如何使用 text/scanner 解析文本_Golang text/scanner 文本扫描与分析的详细内容,更多请关注其它相关文章!


# 跳过  # 网上推广营销模式  # 代刷网站如何推广赚钱快  # 网站制作建设方案  # 抖音商品推广关键词排名  # 网站长时间优化有效果吗  # 做营销推广的目的  # 沙田网站建设服务  # seo专员年终总结  # 嘉兴seo网站外包机  # 推广网站工作职责  # 是一个  # 复用  # 如何实现  # 回调  # 可以通过  # golang  # 自定义  # 如何使用  # 递归  # 标准库  # 配置文件  # switch  # ai  #   # 工具  # 字节  # app  # go语言  # go  # 前端 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: 漫画星球免费下拉式入口 漫画星球免费漫画在线阅读网站  处理嵌套交互式控件:前端可访问性指南  支付宝如何管理隐私设置_支付宝隐私保护的配置技巧  c++中的std::basic_string的SSO优化_c++短字符串优化深度解析  微信网页版登录教程_微信网页版登录入口在哪  解决深度学习模型训练初期异常高损失与完美验证准确率问题  铁路12306的积分有效期是多久_铁路12306积分有效期说明  企业名称高精度匹配:N-gram方法在结构相似性分析中的应用  Win10自动更新怎么关闭 Win10永久关闭系统更新的两种方法【终极版】  AngularJS $http POST请求数据传递与Go后端接收实践  优化 Python 函数中的条件逻辑:解决 if-else 嵌套与参数选择问题  Win10双系统截图高效法 截屏快捷键速记【技巧】  AO3官网镜像链接 Archive of Our Own同人文在线浏览  网易大神账号申诉需要多久_网易大神账号申诉流程说明  小猿搜题在线学习页面在哪_小猿搜题在线学习中心入口  QQ邮箱登录官网首页 腾讯QQ邮箱网页入口  PHP表单数据传递:如何通过隐藏输入字段获取动态ID  c++如何实现一个简单的软件渲染器_c++从零开始的3D图形学  中兴Axon42Ultra怎样在文件App筛图_iPhone中兴Axon42Ultra文件App筛图【图片筛选】  微博网页版首页入口 微博电脑端官网登录链接  Win11怎么查看显卡显存 Win11显示适配器属性及专用视频内存查询  Win11怎么设置鼠标主按键_Win11鼠标左右键功能互换  Python多版本共存与虚拟环境管理深度指南  Excel函数批量查找替换超快方法_Excel用REPLACE和FIND函数秒级替换  QQ邮箱官方网页版登录 QQ邮箱个人邮箱快速访问  Go语言中动态执行代码字符串的策略与实践  晋江读书网页版在线登录 晋江读书电脑版官网  Pyrogram与g4f集成:异步编程实践与常见错误解决  解决macOS Tkinter应用双击启动崩溃:PyInstaller打包指南  Golang如何优化CPU绑定任务分配策略_Golang CPU任务分配优化实践  邮编格式怎么匹配地址_根据邮编格式快速匹配详细地址的技巧  不会效仿卡普空!《铁拳》制作人澄清:不采取赛事付费|直播|  Mac怎么使用表情符号_Mac Emoji快捷键面板  J*a里如何使用N*igableMap进行导航操作_可导航Map操作技巧解析  Excel如何用迷你图显趋势_Excel用迷你图显趋势【趋势小图】  在Go语言中利用后缀数组处理多字符串:实现高效文本匹配与自动补全  葱吃多了会怎样 葱吃多了会伤胃吗  Win10快速启动功能利弊分析 Win10开启或关闭快速启动教程【技巧】  wps文字怎么插入目录并自动更新_wps文字如何插入目录并自动更新方法  Angular Material 垂直步进器:实现底部到顶部排序的教程  lar*el怎么安全地存储和获取配置文件中的敏感信息_lar*el敏感信息安全存储方法  新手怎么开始学化妆 零基础化妆入门教程  如何将HTML表格多行数据保存到Google Sheet  如何在低配置电脑上搭建轻量级J*a环境_占用更小的环境选择技巧  精准捕获:如何在页面中监听除特定元素外的所有点击事件  TikTok网页版直接登录 TikTok网页端官方平台入口  SteamMachine定价或为699美元 大家想入手吗?  PHP中获取MongoDB服务器运行时间(Uptime)的专业指南  Lar*el如何正确地在控制器和模型之间分配逻辑_Lar*el代码职责分离与架构建议  内存检查:在VS Code中调试C++时的内存视图 

搜索