新闻中心

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?

2025-12-02
浏览次数:
返回列表

机器之心报道

编辑:Panda

上周三,DeepSeek 推出了新的基础模型版本,但并非外界翘首以待的 V4,而是 V3.1-Base。而在此前,DeepSeek-V3.1 已经陆续上线了网页端、App 端以及小程序。

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?经过近一周时间的实际用户使用反馈,DeepSeek-V3.1 被发现存在一个令人哭笑不得的问题:部分输出 token 会随机被替换为汉字「极」。

具体而言,据知乎用户 Fun10165 反映,她在使用火山引擎提供的 DeepSeek V3.1 版本整理物理试卷时,发现模型输出中频繁出现莫名其妙的「极」字。

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?图源:知乎 @Fun10165

随后她在 Trae 平台测试 DeepSeek-V3.1 时,同样观察到了这一异常现象。

更有趣的是,她尝试通过调用官方 API 来修复该问题,结果在修复过程中,问题本身又再次浮现。

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?图源:知乎 @Fun10165

她指出:「实测可在官方网页和 API 上复现,虽然概率不高,但多试几次就会出现。而 VolcEngine API 的复现频率则非常高。」

在该帖评论区,不少其他用户也纷纷分享了自己的类似经历。

例如,知乎用户「去码头整点薯条」提到,R1 版本也曾出现相近问题。他还尝试推测原因:「早在使用 R1 0528 版本时就多次遇到,我看到的现象更夸张——代码里会被插入‘极客园’三个字,还不止一次。怀疑是不是训练时混入了某种电子水印,导致模型‘吃坏肚子’了。」

知乎用户「琪洛」则发现,V3-0324 版本也有类似情况,只是这次冒出来的字符串是「**|直播|」。

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?图源:知乎 @琪洛

她推测:「可能是训练数据清洗不彻底所致,即便重新训练了 base 模型,这类痕迹仍可能残留。前面提到的‘极’或‘极速’,或许正是这个长串文本的碎片遗留。」

与此同时,在 Reddit 社区,相关讨论也在持续升温。

发帖人 u/notdba 表示,在测试 DeepSeek V3.1 时,他注意到模型会在毫无预兆的位置输出以下 token:

extreme (id:15075)极 (id:2577)極 (id:16411)这三个显然都指向同一个词义。

他进一步说明,除了在贪婪解码中这些「极」类 token 成为首选外,它们还常常作为第二或第三候选潜伏在预料之外的位置。

他表示:「我已经对主流编码模型做过类似的系统性测试,这种情况还是头一回见。」

Sider Sider

多功能AI浏览器助手,帮助用户进行聊天、写作、阅读、翻译等

Sider 3249 查看详情 Sider

他猜测这个问题可能被 MTP(多 token 预测)机制所掩盖,而在不支持 MTP 的推理环境中会更加凸显,比如当前的 llama.cpp 就尚未支持 MTP。这一假设也得到一定佐证——使用官方 API(支持 MTP)时问题较少,而第三方部署的同款模型则更容易暴露此 bug。

另一位用户 u/nekofneko 分享了另一个实例:

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?图源:Reddit u/nekofneko

他提出一种可能性:「极」的 token ID 是 2577,而省略号「...」的 token ID 是 2576,两者数值相邻,可能存在混淆风险。

不仅如此,还有用户反馈 DeepSeek-V3.1 存在多语言混杂的现象。u/Kitano_o 提到:「我在用 3.1 进行中文到俄语翻译时,遇到了一些奇怪行为。模型开始混合多种语言——夹杂英文词汇,甚至保留中文字符。有时占比高达 5%,有时低至 1% 或完全正常。而且这个问题在 OpenRouter 上多个提供商都会出现,即使选择 DeepSeek 自家服务也不例外。」

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?图源:Reddit u/Kitano_o

综合来看,关于 DeepSeek-V3.1 出现此类显著异常的原因,社区普遍倾向于「数据污染」这一解释。

阶跃星辰工程师黄哲威分析认为:「很可能是 SFT 数据合成或预训练数据构建阶段未清理干净,引入了诸如‘极长的数组’之类的异常内容(从 R1 的表现看,似乎大量采用了 RAG 方法生成难题解答)。在 RL 阶段,模型可能误将‘极’当作终止符或语言切换标记来使用。」

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?图源:知乎 @hzwer 黄哲威

他还补充道:「推理阶段暴露出 bug,大概率根源都在数据上,业内很多人都清楚这一点。只是 R1 的其他问题发生频率较低,社区关注度不够罢了。」

此次事件也为整个 AI 模型开发圈敲响警钟:在追逐更高性能、更大参数量的同时,最根本的数据质量,才是决定 AI 是否“神志清醒”的关键所在。

我们也将此事反馈给了 DeepSeek 官方模型,让它自行分析可能成因:

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?长图滚动查看上下滑动查看

你是否也遇到过类似情况?你认为背后真正原因是什么?

参考链接

https://www.php.cn/link/0f0c5117cdf71e86cd21ee67f05f20c2

https://www.php.cn/link/4cadfa5ff153fb1c686f5f7535a23dc6

以上就是热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?的详细内容,更多请关注其它相关文章!


# 他还  # 菏泽建设职业中专网站  # 杭州抖音查看搜索关键词排名  # 家电行业免费推广网站  # 中国网站建设配置  # 网站关键词排名诚信商家  # 和平精英推广网站有哪些  # 关于营销推广的短文  # 湘潭网站推广 找c金石下拉首荐  # 宁海农业农村网站建设  # 固始seo推广公司  # 极速  # 她在  # 这个问题  # 而在  # 编码  # 这一  # 热议  # 网易  # 惊现  # trae  # deepseek  # red  # 数据清洗  # 多语言  # ai  # 小程序  # 知乎  # app 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: 蛙漫漫画官网在线入口 蛙漫全本漫画免费阅读平台  如何使用spryker/configurable-bundles-products-resource-relationship模块解决复杂产品捆绑关系难题  c++ 获取系统当前时间 c++时间戳获取方法  Composer的 "licenses" 命令如何帮助你遵守开源协议_检查项目依赖的许可证合规性  GemBox Document HTML转PDF垂直文本渲染问题及解决方案  React/Next.js中实现列表项的动态移动与状态管理:兼论唯一键的重要性  Python getattr() 异常处理深度解析:避免程序意外退出  小红书网页版入口链接分享 小红书官网直接进  单12V-2×6实现为RTX 5090供电750W!甚至都没敢跑分  Golang如何使用new_Go new分配内存机制讲解  蛙漫画网页版全站入口 蛙漫热门作品免费浏览  sublime怎么设置启动时打开的窗口_sublime会话管理与热退出  Go语言中JSON数据解码与字段访问指南  J*a里如何使用N*igableMap进行导航操作_可导航Map操作技巧解析  composer 和 npm/yarn 在管理依赖方面有什么核心思想差异?  1688商家版怎样分析买家画像精准供货_1688商家版分析买家画像精准供货【供货策略】  新手怎么开始学化妆 零基础化妆入门教程  Win11网速慢怎么解决 Win11网络设置优化解除限速  c++如何使用Meson构建系统_c++比CMake更快的构建工具  处理Kafka消费者会话超时:深入理解消息处理语义与幂等性  谷歌浏览器浏览体验优化_谷歌浏览器新版直连永久可用提示  钉钉视频会议声音异常如何处理 钉钉会议音频修复技巧  163邮箱登录密码 163邮箱忘记密码找回  QQ邮箱登录首页官网地址2026 QQ邮箱官方网页入口  自定义Bag-of-Words实现:处理带负号的词汇权重  sublime怎么覆盖插件的默认快捷键_sublime快捷键优先级与设置  深入理解Go语言中Map值与方法接收器的交互:为什么需要临时变量  星露谷物语官网入口 星露谷物语游戏官网入口  荣耀Play7TPro怎样在信息App置顶客服对话_iPhone荣耀Play7TPro信息App置顶客服对话【优先查看】  腾讯QQ邮箱官方网站_QQ邮箱网页版在线登录  飞书妙记怎样用语音转文字速记_飞书妙记用语音转文字速记【速记方法】  126邮箱手机版登录官网2026_126手机邮箱免费入口最新  DLsite中文平台入口 DLsite官网内容在线查看  汽水音乐在线版入口_汽水音乐网页播放手册  为什么我的微信朋友圈看不到别人的更新_微信朋友圈更新显示异常解决方法  深入理解Go语言中的指针类型:以*string为例  PPT平滑切换怎么做 PPT炫酷“平滑”切换动画制作教程【必学】  黑鲨3Pro怎样在相册开漫画风滤镜_iPhone黑鲨3Pro相册开漫画风滤镜【趣味滤镜】  C#中解析不规范的HTML为XML 常见的坑与解决办法  内存检查:在VS Code中调试C++时的内存视图  抖音从哪里进入网页版_抖音官方入口链接  Python异步编程实践:使用Binance API构建实时交易数据流  Go语言中Map值调用指针接收器方法的限制与应对  win11怎么查看应用耗电情况 Win11电池设置查看应用能耗排行榜【优化】  外媒分析《GTA6》定价:卖100美元可以但真没必要!  在python-socketio事件处理器中安全访问Flask应用上下文  漫蛙漫画网页端入口 漫蛙2官方正版漫画站点  C++ typeid如何获取类型信息_C++ RTTI运行时类型识别用法  腾讯视频怎么使用多账号家庭管理_腾讯视频家庭多账号统一管理与权限分配教程  Bilibili动漫最新防封地址发布-Bilibili动漫2025年最稳正版入口推荐 

搜索