新闻中心
-
12-15通义百聆语音双子星升级并开源,大幅提升语音合成与识别能力据通义大模型官方发布,通义百聆正式推出升级版语音大模型Fun-CosyVoice3与Fun-ASR,并同步向全球开源。本次迭代重点强化模型的核心能力与落地实用性...
-
12-15WoTerm v10.4.2 发布很早以前,我就实现了终端辅助输入框与窗口半透明这两项功能,但一直未能真正理解它们所服务的用户场景与深层价值。直到某天,我注意到同事正用Xshell在终端和桌面之...
-
12-14Firecrawl 开源基于 AI 的 Web 监控平台:Open ScoutsFirecrawl正式开源了名为OpenScouts的AI驱动Web监控平台,允许用户创建可编程的自动化“scouts”(侦察员),按预设时间周期持续扫描网络,...
-
12-14RemoveWindowsAI:移除 Windows 11 AI 功能的开源脚本近日,开发者zoicware在GitHub平台开源了一款名为“RemoveWindowsAI”的PowerShell脚本工具,旨在帮助用户清理Windows11...
-
12-14智元机器人开源 VideoDataset:基于 GPU 硬件解码的 VLM 训练加速利器智元机器人团队正式开源一款面向GPU硬件加速解码的高性能视频数据加载库——VideoDataset,旨在突破海量视频训练场景下长期存在的存储压力与计算资源瓶颈。...
-
12-13蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0蚂蚁技术研究院正式发布LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开其核心技术报告,称其为“业界首个达到100B参数规模的扩散式语言模型”。LL...

