新闻中心

美国初创公司 Arcee AI 发布开源 MoE 模型 Trinity

2025-12-02
浏览次数:
返回列表

美国人工智能初创企业 arcee ai 近日发布了全新的开放权重模型系列 trinity,涵盖已上线的 trinity nanotrinity mini,以及预计于 2026 年 1 月发布的 trinity large

该系列模型从数据采集、架构设计到训练流程均实现全栈自研,官方强调其“在美国完成端到端训练”,具备开放权重、强大推理性能及对开发者的全面控制能力。

Trinity 系列采用先进的多专家混合架构(afmoe),每层集成 128 个专家模块,每个 token 动态激活 8 个专家,并额外配备共享专家以增强泛化能力。训练基于超过 10T tokens 的高质量数据,并融合了 grouped-query attention、gated attention 及长上下文支持等关键技术,显著提升模型稳定性与推理效率。

  • Trinity Nano:参数规模约为 6B 的 MoE 模型(激活参数约 1B),专为移动设备、嵌入式系统和注重隐私的本地部署场景优化。
  • Trinity Mini:拥有 26B 参数的 MoE 架构(激活参数达 3B),适用于云端或本地数据中心,支持复杂多步推理、工具调用和超长文本处理任务。
    两款模型均已开源,遵循 Apache 2.0 许可协议,用户可通过 Hugging Face 下载权重或调用 API 使用。

https://www.php.cn/link/f5685cb5d80c3249a9770cfd98cf71eb

美国初创公司 Arcee AI 发布开源 MoE 模型 Trinity

美国初创公司 Arcee AI 发布开源 MoE 模型 Trinity

码上飞 码上飞

码上飞(CodeFlying) 是一款AI自动化开发平台,通过自然语言描述即可自动生成完整应用程序。

码上飞 430 查看详情 码上飞

美国初创公司 Arcee AI 发布开源 MoE 模型 Trinity

Arcee AI 指出,当前多数所谓“开源”模型依赖第三方基础模型进行微调,存在能力瓶颈、数据不透明及合规风险等问题。Trinity 系列坚持从零开始自主预训练,旨在打造可长期演进、支持企业在私有环境中持续训练与迭代的可信 AI 基础设施。

公司还确认,Trinity Large 正在训练中,总参数量约 420B(激活参数约 13B),依托 2048 张 B300 GPU 构建的高性能集群,训练数据扩展至 20T tokens。完整技术白皮书将于 2026 年 1 月随模型发布时公开。

源码下载地址:点击获取

以上就是美国初创公司 Arcee AI 发布开源 MoE 模型 Trinity的详细内容,更多请关注其它相关文章!


# 自然语言  # 容桂seo报价  # 芙蓉区图文营销推广方式  # 山东营销网站推广优势  # 珠海关键词排名费用高么  # 线上营销推广怎么去了解  # 北京正规营销培训推广  # 西安企业抖音SEO  # 胶南网站优化  # 上海搜索引擎营销推广  # 太康网站建设价格表  # 将于  # 适用于  # 下载地址  # apache  # 你好  # 续写  # 之路  # 嵌入式系统  # 开源  # 美国  # 本地部署  # gate  # ai  #   # 工具  # 人工智能 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: 机构:以往存储涨价周期小米利润率实际上有所改善 能转嫁给消费者等  Golang如何使用context实现超时取消_Golang context超时取消模式实践  MAC的“快捷指令”怎么同步到iPhone_MAC利用iCloud同步所有设备的自动化指令  基于动态规划的房屋花卉种植最小成本算法详解  必由学登录入口 必由学官方网站在线访问链接  小红书网页版入口链接分享 小红书官网直接进  如何在Promise链中有效终止错误处理后的执行  CSS条件样式无法按设备触发怎么排查_media条件语句正确设置解决触发问题  Python字典中优雅地迭代剩余元素的方法  如何提高微信支付的安全性_微信支付安全防护与设置建议  Python多版本共存与虚拟环境管理深度指南  12306选座怎么选到商务座_12306商务座选择与配置说明  快速CSGO开箱网站指南 CSGO开箱平台推荐  在Typer应用中优雅地处理和重组任意命令行参数  单射、满射与双射的关系 一文理清所有逻辑  Windows电脑怎么截图最方便_系统自带截图工具的5种神仙用法【技巧】  批改网学生版PC登录 批改网官网登录系统入口  MongoDB Aggregation:在嵌套对象数组中精确匹配ObjectId  css卡片内容溢出如何处理_使用overflow隐藏或scroll显示内容  C++如何实现一个智能指针_手动实现C++ shared_ptr的引用计数功能  响应式CSS Grid布局:优化网格项在小屏幕下的堆叠与宽度适配  如何使 Jest 模拟函数默认抛出错误以提高测试效率  如何在离线环境中使用Composer_Composer离线安装依赖包的技巧与策略  微信网页版官方入口直达 微信网页版网页版登录使用方法  J*aScript异步迭代器_j*ascript异步遍历  漫蛙漫画官方主页入口 漫蛙MANWA网页直达访问链接  C++如何生成随机数_C++ random库使用方法与范围设置  从J*aScript对象中精确提取指定属性的教程  C#如何安全地从用户上传的XML文件中读取数据? 验证与清理策略  React中useState与局部变量:理解组件状态管理与渲染机制  晋江读书网页版在线登录 晋江读书电脑版官网  J*aScript中安全有效地处理localStorage字符串数据  Win10如何开启蓝牙功能_Windows10找不到蓝牙开关解决方法  J*aScript中在Map循环中检测并处理空数组元素  Go语言中JSON数据解析与字段访问教程  css子元素高度不一致导致布局错位怎么办_使用align-items:stretch解决高度差异  京东单号查询入口_京东快递订单追踪入口  星露谷物语官网入口 星露谷物语游戏官网入口  中兴BladeV30怎样用测距估书架层高_iPhone中兴BladeV30测距估书架层高【家装参考】  J*a如何使用AtomicInteger控制计数_J*a无锁计数器性能分析  顺丰快递查询系统 官方正版查询入口  win11 Snap Layouts怎么用 Win11窗口布局与分屏多任务高效指南【必学】  Golang如何实现容器化日志收集与分析_Golang容器日志收集分析方法  J*a递归快速排序中静态变量导致数据累积的陷阱与解决方案  如何在更新Composer依赖后自动运行测试_使用post-update-cmd钩子触发PHPUnit  Angular中单选按钮的正确使用与常见陷阱解析  Django模型中自动计算可用余额的实现方法  Vue.js 图片显示异常排查:理解应用挂载范围与DOM ID唯一性  手机CPU怎么影响游戏体验_手机CPU对游戏性能的影响分析  Win10怎么制作U盘启动盘 Win10系统安装U盘制作教程【详解】 

搜索