新闻中心
DeepSeek 更新了,我更期待量化版
大家好,我是专注 ai 学习的老章
昨天大模型圈异常热闹,其实近期新版本层出不穷,尤其是 Qwen 系列,我也抽空做了一些测试,只是时间有限没来得及出文分享
DeepSeek-V3.1-Terminus
这是对 V3.1 的一次小幅迭代更新,主要修复了此前曝光的“极”字漏洞以及多语言混合输入的问题
| 基准 | DeepSeek-V3.1 | DeepSeek-V3.1-Terminus |
|---|---|---|
| 无工具使用推理模式 | ||
| MMLU-Pro | 84.8 | 85.0 |
| GPQA-Diamond | 80.1 | 80.7 |
| huanity's last test | 15.9 | 21.7 |
| LiveCodeBench | 74.8 | 74.9 |
Codefor ces
|
2091 | 2046 |
| Aider-Polyglot | 76.3 | 76.1 |
| 代理工具使用 | ||
| BrowseComp | 30.0 | 38.5 |
| BrowseComp-zh | 49.2 | 45.0 |
| SimpleQA | 93.4 | 96.8 |
| SWE Verified | 66.0 | 68.4 |
| SWE-bench 多语言 | 54.5 | 57.8 |
| Terminal-bench | 31.3 | 36.7 |
Terminius 最亮眼的提升在于 Agent 能力,在 Code Agent 和 Search Agent 场景下的表现均有增强。
不过细心的朋友可能已经注意到,升级后的模型在 Codeforces 和 Aider-Polyglot 两个编程竞技类评测中分数反而略有下滑。但整体影响不大,关键是“极”bug 已被修复,实际使用体验更加稳定可靠。
目前访问 https://chat.deepseek.com/ 使用的就是最新的 Terminius 版本
该模型也已开放开源:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
网趣网上购物系统HTML静态版
网趣购物系统静态版支持网站一键静态生成,采用动态进度条模式生成静态,生成过程更加清晰明确,商品管理上增加淘宝数据包导入功能,与淘宝数据同步更新!采用领先的AJAX+XML相融技术,速度更快更高效!系统进行了大量的实用性更新,如优化核心算法、增加商品图片批量上传、谷歌地图浏览插入等,静态版独特的生成算法技术使静态生成过程可随意掌控,从而可以大大减轻服务器的负担,结合多种强大的SEO优化方式于一体,使
0
查看详情
模型大小高达 689 GB!整整 689 GB!
这个体积实在太大,本地部署对我来说基本不可能。我倒是准备了一台拥有 500GB 内存的高性能机器,打算用 llama.cpp 尝试纯内存运行量化版模型。
不过还得等 unsloth 发布 Terminius 的量化版本才行,我还是挺期待的。之前 unsloth 对 V3.1 做的量化效果惊人:
1 位 Dynamic 量化将 DeepSeek-V3.1 从 671GB 压缩到仅 192GB(减少超 75%),在无思考模式下性能甚至超过 GPT-4.1(2025 年 4 月版)、GPT-4.5 和 DeepSeek-V3-0324。3 位 Unsloth DeepSeek-V3.1(思考模式)GGUF 版本,性能还能超越 Claude-4-Opus(思考模式)。
最后,V4 会不会在国庆节发布?按照以往规律,每逢重大节日,DeepSeek 总会推出新模型。

以上就是DeepSeek 更新了,我更期待量化版的详细内容,更多请关注其它相关文章!
# 今日
# 网站异地关键词排名
# 白杨seo博客分类
# 兰州seo排名服务平台
# 洛阳seo矩阵推广团队
# seo诊断优化方案模板
# 安徽公安局网站建设
# SEO文章排列组合
# 永川美食网站建设素材
# 诸城定制化网站建设企业
# 福安seo公司
# 淘宝
# 在线观看
# 软件下载
# 网上
# 工具
# 代练
# 头条
# 购物系统
# 我更
# qwen
# 本地部署
# 2025
# deepseek
# 大模型
# claude
# gpt-4
# 多语言
# gpt
# ai
相关栏目:
【
科技资讯46185 】
【
网络学院92790 】
相关推荐:
小猿搜题在线学习页面在哪_小猿搜题在线学习中心入口
qq浏览器如何查看和导出已保存的密码 qq浏览器密码管理器数据备份教程
J*a里如何使用N*igableMap进行导航操作_可导航Map操作技巧解析
想当下一个《2077》?《心之眼》Steam评价升至"多半好评"
C++如何实现一个智能指针_手动实现C++ shared_ptr的引用计数功能
铁路12306官网网页端快速入口 铁路12306官方首页登录教程
利用5118提升短视频内容效果_5118短视频关键词优化方法
抖音网页版平台入口 抖音网页版官网在线访问教程
Composer如何处理Git子模块(submodule)依赖_Composer与Git Submodule的对比与选择
ArrayList与LinkedList操作复杂度详解:遍历与修改
ACG动漫手机版官网入口 手机ACG动漫APP在线观看正版
QQ邮箱在线登录平台 QQ邮箱个人邮箱网页版入口
微信怎么把收藏的内容分类管理 微信收藏内容标签分类方法
Mudbox图层蒙版怎么用_Mudbox图层蒙版数字雕刻应用技巧
可靠CSGO开箱平台解析 CSGO开箱网合集
163邮箱登录密码 163邮箱忘记密码找回
微信网页版官方入口直达 微信网页版网页版登录使用方法
在J*a里如何理解依赖关系的方向_依赖方向在模块结构中的作用
厨房不锈钢水槽发黑生锈怎么处理_水槽用可乐+锡纸2分钟抛亮如新
c++如何实现一个简单的ECS框架_c++数据驱动设计与游戏开发
Spyder启动失败:字体文件权限拒绝错误解决方案
J*aScript打印功能_j*ascript输出控制
漫蛙2(台版)官方入口地址 漫蛙2(台版)正版漫画网页端
Lar*el 递归关系中排除指定分支的教程
word邮件合并后日期格式不对怎么改_Word邮件合并日期格式修改方法
深入理解字体排版:Adobe光学字偶距与CSS字偶距的差异与实现
使用 Pandas 高效处理 .dat 文件:字符清理与数据计算
一加 14R 快充无反应_一加 14R 充电优化
Fabric模组开发:自定义物品与物品组的现代管理方法
4399免费游戏网址入口 4399小游戏免费入口点开即玩
如何在复杂的电商平台中优雅地管理共享资源并确保正确重定向,使用spryker-shop/resource-share-page模块助你一臂之力
CSS Flexbox如何实现多行排列_flex-wrap wrap自动换行显示
解决深度学习模型训练初期异常高损失与完美验证准确率问题
Go语言JSON解析深度指南:动态访问与结构体映射实践
抖音怎么赚钱_抖音创作者变现方法与途径指南
如何有效阻止外部脚本意外修改内联样式的高度属性
解决Python logging 中 datefmt 导致时间戳固定不变的问题
探索高级语言到原生C/C++的转译:挑战与内存管理策略
J*a 递归快速排序中静态变量的状态管理与陷阱
Win10双系统截图高效法 截屏快捷键速记【技巧】
J*aScript map 迭代中检测空数组元素的有效方法
使用Python高效删除Word宏并转换DOCM为DOCX格式
大麦的“候补”是什么意思 大麦候补购票规则【详解】
Win11怎么开启省电模式_Win11电池节电模式自动开启
在FastAPI中利用lifespan与依赖注入高效管理Redis连接池
铁路12306的积分有效期是多久_铁路12306积分有效期说明
Go语言中对Map值调用带指针接收者方法:原理与最佳实践
J*a应用集成GitHub CLI与API认证指南
打开就能玩的植物大战僵尸 植物大战僵尸网页版传送门
移动端XML文件怎么转换成Excel 手机和平板上的解决方案


2025-12-09
浏览次数:次
返回列表
ces