新闻中心

国内首款AI助盲眼镜发布,通义千问驱动解决视障出行难题

2025-12-13
浏览次数:
返回列表

近日,杭州瞳行科技正式推出国内首台ai助盲眼镜,致力于以人工智能技术切实缓解视障人士在日常出行与生活场景中面临的现实困境。该产品已完*套化设计并上架销售,包含ai眼镜本体、专属配套手机、可穿戴遥控指环及一根智能适配盲杖,用户可一站式购齐、即开即用。

这款眼镜功能全面,覆盖出行避障、物品查找与文本识别、语音交互助手、一键紧急求助亲友等核心需求。在出行模式下,系统端到端延迟控制在约300毫秒以内,响应极为迅捷,能精准匹配人体自然步频——每迈出一步,即可同步获取实时路况语音提示。

硬件层面,设备搭载121度超广角双摄像头模组,协同手机端强大算力与指环式交互操作,构建起“感知—决策—反馈”的闭环式人机协作体系。技术实现上,并未采用单一模型架构。瞳行融合自研视觉理解模型与通义千问Qwen-VL多模态大模型、OCR识别系列模型,并针对不同使用情境进行精细化参数调优与任务分流。

例如,在避障类场景中,系统需在毫秒级内判断前方是否存在大型障碍物及其可通行性(如能否迈过台阶),此时模型输出高度精简、指令明确,如“正前方有三级台阶,左侧2米处有慢行行人”,信息被压缩为可立即执行的动作指引;而在找店点餐类场景中,系统需准确识别招牌文字、菜单段落排版、窗口价目表等多源异构信息,会对图像内容进行深度结构化解析与语义整合,再通过语音清晰复述关键要素,处理耗时略长但信息维度更完整、上下文更连贯。

研发团队在模型选型与硬件配置之间进行了大量权衡取舍。为保障避障响应的极致低延时,他们将大模型能力按场景解耦:对强时效性任务(如动态避让)优先启用轻量化本地推理逻辑,大模型仅作辅助校验;而对依赖深层语义解析与长文本理解的任务(如菜单解读、公告阅读),才激活高复杂度模型参与运算。

硬件选型亦围绕实用性展开:超宽视角双摄显著缩小视觉盲区;指环支持无感切换功能模式与触发SOS求助;手机承担主要计算负载与网络连接任务;传统盲杖则予以保留并做智能化适配,延续用户既有使用习惯。

出行难,长期是视障群体最突出的生活痛点。我国视力障碍人口逾1700万,日常通勤高度依赖电子导航与他人协助,却频繁遭遇“最后十米”导航失效问题——门牌模糊不清、出入口被临时占用、楼道标识缺失或位置隐蔽等情形屡见不鲜;加之公共服务响应存在不确定性,不少视障者被迫大幅减少外出频次,甚至长期居家。

本款AI助盲眼镜正是直击上述高频难点,重点强化复杂城市环境下的毫秒级环境感知能力与自然语言交互体验。从行业方法论看,瞳行采取“通用基座模型+垂直场景微调”的技术路径,提升模型复用效率与落地适配性。

市场与技术总监曾指出:“在大模型尚未普及的阶段,独立部署高性能AI算力的成本极高,中小创业公司往往难以承受。如今随着通义千问等高质量开源基础模型的成熟与算力基础设施成本持续下降,企业得以将资源重心转向场景工程打磨与用户体验优化,真正让这类软硬一体的助残硬件具备规模化落地与可持续运营的商业基础。”

星声AI 星声AI

可分享的AI播客内容生成器和效率工具

星声AI 185 查看详情 星声AI

该产品在多样化真实场景中展现出差异化性能表现:

  • 在人流密集街区,系统侧重对移动目标的轨迹预测与简洁化语音提示;
  • 行至公交站或地铁口时,自动识别线路指示牌与到站车次信息,优先播报与用户目的地强相关的关键字段;
  • 进入餐厅或需阅读纸质材料时,OCR模块将图像实时转为可读文本,大模型进一步提炼要点并逐句语音播报;
  • 若识别置信度不足或结果存疑,系统主动提示用户确认,或一键发起远程求助,即时向预设联系人发送当前位置与现场语音片段。

操作流程同样贴合用户实际:开机佩戴后,可通过语音或指环快捷选择“出行”或“阅读”主模式;指环支持多档位切换子功能;遇突发状况仅需单击指环,即可自动上传定位坐标与最近10秒音频至紧急联系人终端。

从企业发展策略来看,瞳行坚持“自研模型打底 + 大模型赋能”的双轨协同路线:自研模型专注高速响应与边缘端稳定执行,大模型负责高阶语义理解与复杂上下文推理,二者经由场景驱动的任务调度机制与联合微调,在速度与精度间取得动态平衡。

面向市场,整套“眼镜+手机+指环+盲杖”组合设计,既降低初次使用门槛,又尊重传统辅具使用惯性,是一种务实且具包容性的产品哲学。关于成本控制与长期可持续性,算力成本的实质性下降成为关键支点——过去同类项目常因算力投入过高导致资金链承压,如今依托成熟的基础模型生态,企业可聚焦于真实场景的问题定义、交互设计与服务闭环建设。

目前,该AI助盲眼镜已全面开放购买,用户可直接选购含眼镜主机、定制手机、遥控指环及智能盲杖在内的完整套装。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜



以上就是国内首款AI助盲眼镜发布,通义千问驱动解决视障出行难题的详细内容,更多请关注其它相关文章!


# 首款  # 教育类市场营销推广方案  # 网站排名优化 ur建站  # 咸阳网站设计建设公司  # 黄山公司网站推广怎么样  # 通用网站建设图片大全  # 安顺营销抖音推广哪家好  # 企业为什么推广网站  # 甘肃seo服务的好方法  # 外贸seo手法有哪些  # 优化一个网站推荐的软件  # 逐句  # 一键  # 通义千问  # 变身  # 国内  # 多模  # 腾讯  # 闭环  # 景中  # 句话  # qwen  # 大模型  # ai  # 人工智能 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: 优化HTML表单样式:解决输入框焦点跳动与元素间距问题  Win10自动更新怎么关闭 Win10永久关闭系统更新的两种方法【终极版】  TikTok搜索结果不显示如何解决 TikTok搜索刷新优化方法  Golang如何通过reflect获取匿名字段方法_Golang reflect匿名字段方法访问技巧  Win11怎么安装Linux子系统 Win11 WSL2安装Ubuntu及环境配置指南  高德地图公交到站提醒失败如何解决 高德提醒权限设置  如何在网页中实现特定地点的随机图片展示  微博网页版怎么开启两步验证_微博网页版账号安全两步验证设置方法  印象笔记如何设离线包出差查阅_印象笔记设离线包出差查阅【离线阅读】  聚水潭ERP登录页面入口 聚水潭ERP官网登录界面  Spyder启动失败:字体文件权限拒绝错误解决方案  MAC怎么在地图App里使用“四处看看”_MAC体验部分城市的3D实景街景  Angular中单选按钮的正确使用与常见陷阱解析  在React函数组件中利用原生HTML5进行邮箱地址验证  qq音乐在线播放入口_qq音乐电脑版登录链接  CSS图片焦点样式实现教程:理解与应用tabindex属性  Win11怎么修改默认浏览器_Windows 11设置Chrome为默认  Lar*el递归关系中排除子孙节点的策略  使用Python高效删除Word宏并转换DOCM为DOCX格式  学习通网页版快速入口 学习通官网网页版直接打开  抖音网页版快捷访问 抖音网页版网页版入口操作教程  CSS Flexbox与媒体查询:实现响应式布局中元素的并排与堆叠  Excel Power Pivot如何处理XML数据源 构建高级数据模型  俄罗斯浏览器官网直达链接 俄罗斯浏览器最新在线入口导航  J*aScript数据结构转换:将对象数组按类别分组  163邮箱注册官网 免费申请163个人邮箱  AO3中文官网链接_AO3网页版稳定镜像站  如何解决电商平台定制报价请求的“黑洞”问题,SprykerQuoteRequest模块助你提升客户体验与销售效率  html怎么在cmd下运行php文件_cmd运行html中php文件方法【教程】  《铁拳8》黑皮辣妹新实机:元气满满的18岁少女!  Gmail邮箱申请注册直达_Gmail邮箱免费注册PC版官网入口2025  腾讯QQ邮箱官方网站_QQ邮箱网页版在线登录  Golang并发任务中错误如何聚合_Golang goroutine error收集方式  Angular响应式表单:实现提交后表单及按钮的禁用与只读化  12306选座怎么选到特殊座位_12306特殊座位选择注意事项  12306怎么选座位选到安静区_12306选座安静区域选择策略  如何在更新Composer依赖后自动运行测试_使用post-update-cmd钩子触发PHPUnit  Golang如何实现简单的Web表单_Golang表单提交与验证处理方法  在J*a中如何开发简易电子商务商品管理系统_商品管理系统项目实战解析  cad如何更改注释性对象的比例_cad注释性比例调整方法  J*aScript中安全有效地处理localStorage字符串数据  淘宝支付提示失败如何解决 淘宝支付流程优化方法  天猫双十一预售商品怎么退款_天猫双十一预售退款操作指南  XML中包含HTML标签导致解析错误? 正确嵌入非XML数据的两种方法  Golang如何安装Swagger工具_GoSwagger文档生成环境  怎么在浏览器上运行HTML文件_浏览器运行HTML文件技巧【技巧】  利用Bokeh CustomJS动态控制DataTable列可见性  谷歌学术网站直达地址 谷歌学术搜索网页版一键进入  Win11怎么开启卓越性能模式 Win11电源选项启用高性能释放硬件潜力【方法】  解决深度学习模型训练初期异常高损失与完美验证准确率问题 

搜索