新闻中心
热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?
机器之心报道
编辑:Panda
上周三,DeepSeek 推出了新的基础模型版本,但并非外界翘首以待的 V4,而是 V3.1-Base。而在此前,DeepSeek-V3.1 已经陆续上线了网页端、App 端以及小程序。
经过近一周时间的实际用户使用反馈,DeepSeek-V3.1 被发现存在一个令人哭笑不得的问题:部分输出 token 会随机被替换为汉字「极」。
具体而言,据知乎用户 Fun10165 反映,她在使用火山引擎提供的 DeepSeek V3.1 版本整理物理试卷时,发现模型输出中频繁出现莫名其妙的「极」字。
图源:知乎 @Fun10165
随后她在 Trae 平台测试 DeepSeek-V3.1 时,同样观察到了这一异常现象。
更有趣的是,她尝试通过调用官方 API 来修复该问题,结果在修复过程中,问题本身又再次浮现。
图源:知乎 @Fun10165
她指出:「实测可在官方网页和 API 上复现,虽然概率不高,但多试几次就会出现。而 VolcEngine API 的复现频率则非常高。」
在该帖评论区,不少其他用户也纷纷分享了自己的类似经历。
例如,知乎用户「去码头整点薯条」提到,R1 版本也曾出现相近问题。他还尝试推测原因:「早在使用 R1 0528 版本时就多次遇到,我看到的现象更夸张——代码里会被插入‘极客园’三个字,还不止一次。怀疑是不是训练时混入了某种电子水印,导致模型‘吃坏肚子’了。」
知乎用户「琪洛」则发现,V3-0324 版本也有类似情况,只是这次冒出来的字符串是「**|直播|」。
图源:知乎 @琪洛
她推测:「可能是训练数据清洗不彻底所致,即便重新训练了 base 模型,这类痕迹仍可能残留。前面提到的‘极’或‘极速’,或许正是这个长串文本的碎片遗留。」
与此同时,在 Reddit 社区,相关讨论也在持续升温。
发帖人 u/notdba 表示,在测试 DeepSeek V3.1 时,他注意到模型会在毫无预兆的位置输出以下 token:
extreme (id:15075)极 (id:2577)極 (id:16411)这三个显然都指向同一个词义。
他进一步说明,除了在贪婪解码中这些「极」类 token 成为首选外,它们还常常作为第二或第三候选潜伏在预料之外的位置。
他表示:「我已经对主流编码模型做过类似的系统性测试,这种情况还是头一回见。」
Sider
多功能AI浏览器助手,帮助用户进行聊天、写作、阅读、翻译等
3249
查看详情
他猜测这个问题可能被 MTP(多 token 预测)机制所掩盖,而在不支持 MTP 的推理环境中会更加凸显,比如当前的 llama.cpp 就尚未支持 MTP。这一假设也得到一定佐证——使用官方 API(支持 MTP)时问题较少,而第三方部署的同款模型则更容易暴露此 bug。
另一位用户 u/nekofneko 分享了另一个实例:
图源:Reddit u/nekofneko
他提出一种可能性:「极」的 token ID 是 2577,而省略号「...」的 token ID 是 2576,两者数值相邻,可能存在混淆风险。
不仅如此,还有用户反馈 DeepSeek-V3.1 存在多语言混杂的现象。u/Kitano_o 提到:「我在用 3.1 进行中文到俄语翻译时,遇到了一些奇怪行为。模型开始混合多种语言——夹杂英文词汇,甚至保留中文字符。有时占比高达 5%,有时低至 1% 或完全正常。而且这个问题在 OpenRouter 上多个提供商都会出现,即使选择 DeepSeek 自家服务也不例外。」
图源:Reddit u/Kitano_o
综合来看,关于 DeepSeek-V3.1 出现此类显著异常的原因,社区普遍倾向于「数据污染」这一解释。
阶跃星辰工程师黄哲威分析认为:「很可能是 SFT 数据合成或预训练数据构建阶段未清理干净,引入了诸如‘极长的数组’之类的异常内容(从 R1 的表现看,似乎大量采用了 RAG 方法生成难题解答)。在 RL 阶段,模型可能误将‘极’当作终止符或语言切换标记来使用。」
图源:知乎 @hzwer 黄哲威
他还补充道:「推理阶段暴露出 bug,大概率根源都在数据上,业内很多人都清楚这一点。只是 R1 的其他问题发生频率较低,社区关注度不够罢了。」
此次事件也为整个 AI 模型开发圈敲响警钟:在追逐更高性能、更大参数量的同时,最根本的数据质量,才是决定 AI 是否“神志清醒”的关键所在。
我们也将此事反馈给了 DeepSeek 官方模型,让它自行分析可能成因:
长图滚动查看上下滑动查看
你是否也遇到过类似情况?你认为背后真正原因是什么?
参考链接
https://www.php.cn/link/0f0c5117cdf71e86cd21ee67f05f20c2
https://www.php.cn/link/4cadfa5ff153fb1c686f5f7535a23dc6
以上就是热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?的详细内容,更多请关注其它相关文章!
# 他还
# 菏泽建设职业中专网站
# 杭州抖音查看搜索关键词排名
# 家电行业免费推广网站
# 中国网站建设配置
# 网站关键词排名诚信商家
# 和平精英推广网站有哪些
# 关于营销推广的短文
# 湘潭网站推广 找c金石下拉首荐
# 宁海农业农村网站建设
# 固始seo推广公司
# 极速
# 她在
# 这个问题
# 而在
# 编码
# 这一
# 热议
# 网易
# 惊现
# trae
# deepseek
# red
# 数据清洗
# 多语言
# ai
# 小程序
# 知乎
# app
相关栏目:
【
科技资讯46185 】
【
网络学院92790 】
相关推荐:
蛙漫漫画官网在线入口 蛙漫全本漫画免费阅读平台
如何使用spryker/configurable-bundles-products-resource-relationship模块解决复杂产品捆绑关系难题
c++ 获取系统当前时间 c++时间戳获取方法
Composer的 "licenses" 命令如何帮助你遵守开源协议_检查项目依赖的许可证合规性
GemBox Document HTML转PDF垂直文本渲染问题及解决方案
React/Next.js中实现列表项的动态移动与状态管理:兼论唯一键的重要性
Python getattr() 异常处理深度解析:避免程序意外退出
小红书网页版入口链接分享 小红书官网直接进
单12V-2×6实现为RTX 5090供电750W!甚至都没敢跑分
Golang如何使用new_Go new分配内存机制讲解
蛙漫画网页版全站入口 蛙漫热门作品免费浏览
sublime怎么设置启动时打开的窗口_sublime会话管理与热退出
Go语言中JSON数据解码与字段访问指南
J*a里如何使用N*igableMap进行导航操作_可导航Map操作技巧解析
composer 和 npm/yarn 在管理依赖方面有什么核心思想差异?
1688商家版怎样分析买家画像精准供货_1688商家版分析买家画像精准供货【供货策略】
新手怎么开始学化妆 零基础化妆入门教程
Win11网速慢怎么解决 Win11网络设置优化解除限速
c++如何使用Meson构建系统_c++比CMake更快的构建工具
处理Kafka消费者会话超时:深入理解消息处理语义与幂等性
谷歌浏览器浏览体验优化_谷歌浏览器新版直连永久可用提示
钉钉视频会议声音异常如何处理 钉钉会议音频修复技巧
163邮箱登录密码 163邮箱忘记密码找回
QQ邮箱登录首页官网地址2026 QQ邮箱官方网页入口
自定义Bag-of-Words实现:处理带负号的词汇权重
sublime怎么覆盖插件的默认快捷键_sublime快捷键优先级与设置
深入理解Go语言中Map值与方法接收器的交互:为什么需要临时变量
星露谷物语官网入口 星露谷物语游戏官网入口
荣耀Play7TPro怎样在信息App置顶客服对话_iPhone荣耀Play7TPro信息App置顶客服对话【优先查看】
腾讯QQ邮箱官方网站_QQ邮箱网页版在线登录
飞书妙记怎样用语音转文字速记_飞书妙记用语音转文字速记【速记方法】
126邮箱手机版登录官网2026_126手机邮箱免费入口最新
DLsite中文平台入口 DLsite官网内容在线查看
汽水音乐在线版入口_汽水音乐网页播放手册
为什么我的微信朋友圈看不到别人的更新_微信朋友圈更新显示异常解决方法
深入理解Go语言中的指针类型:以*string为例
PPT平滑切换怎么做 PPT炫酷“平滑”切换动画制作教程【必学】
黑鲨3Pro怎样在相册开漫画风滤镜_iPhone黑鲨3Pro相册开漫画风滤镜【趣味滤镜】
C#中解析不规范的HTML为XML 常见的坑与解决办法
内存检查:在VS Code中调试C++时的内存视图
抖音从哪里进入网页版_抖音官方入口链接
Python异步编程实践:使用Binance API构建实时交易数据流
Go语言中Map值调用指针接收器方法的限制与应对
win11怎么查看应用耗电情况 Win11电池设置查看应用能耗排行榜【优化】
外媒分析《GTA6》定价:卖100美元可以但真没必要!
在python-socketio事件处理器中安全访问Flask应用上下文
漫蛙漫画网页端入口 漫蛙2官方正版漫画站点
C++ typeid如何获取类型信息_C++ RTTI运行时类型识别用法
腾讯视频怎么使用多账号家庭管理_腾讯视频家庭多账号统一管理与权限分配教程
Bilibili动漫最新防封地址发布-Bilibili动漫2025年最稳正版入口推荐


2025-12-02
浏览次数:次
返回列表