会员动态 > 正文
喜讯!瑞为技术蜻豚视觉大模型算法通过国家网信办备案
12-05   瑞为技术      关键字:瑞为技术 蜻豚 视觉大模型 算法 网信办备案      浏览量:
近日,国家互联网信息办公室公布第十四批深度合成服务算法备案信息,瑞为技术自研的“Reconova QTune瑞为蜻豚视觉大模型算法”成功入选,正式获得国家级算法备案资质。
  近日,国家互联网信息办公室公布第十四批深度合成服务算法备案信息,瑞为技术自研的“Reconova QTune瑞为蜻豚视觉大模型算法”成功入选,正式获得国家级算法备案资质。
  蜻豚视觉大模型是以通用视觉语义理解为核心,融合异构传感器输入与动态专家路由架构,解决复杂场景下的感知与认知决策问题,目前已成功应用于晓蚁行李转运机器人、晓瑞旅服机器人等实体场景。
  2025年,蜻豚视觉大模型在全球权威评测平台OpenCompass轻量级模型(参数量<4B)中位列第四,在精度与效率的平衡上达到领先水平。
构建全栈技术闭环,重塑视觉认知边界
  瑞为蜻豚视觉大模型基于“感知-理解-规划”一体化架构,通过多项关键技术实现视觉能力系统升级:
  全栈训练架构
  支持预训练、有监督微调(SFT)到强化学习偏好优化(RLHF/GSPO)的全流程训练,结合混合精度训练与参数高效微调技术(LoRA/QLoRA),降低算力需求。
  采用Encoder动态平铺与Token智能压缩,兼容多源数据与长视频理解,结合视觉强化微调(RFT)提升模型泛化与跨任务迁移能力,适配多场景部署。
  高效推理引擎
  基于混合专家(MoE)架构,实现动态专家路由,平衡精度与效率。
  通过分层量化与蒸馏技术,将10B级模型压缩为轻量化版本,并借助汇编级指令优化,支持端侧低功耗运行。
  集成检索增强(RAG)技术,接入实时知识图谱,构建端到端推理闭环,实现从感知到自主任务规划,推动模型向高效可用化演进,助力交通、商业等场景普惠应用。
深耕场景化落地,驱动产业智能化变革
  瑞为蜻豚视觉大模型已在实际业务场景中验证其价值,包括晓蚁行李转运机器人通过多模态感知与动态路径规划,实现机场行李转运的全程自动化;晓瑞旅服机器人依托长视频语义解析与意图理解能力,为旅客提供精准的导引与问答服务。
  这些应用不仅体现了模型在复杂环境中的鲁棒性,更彰显瑞为技术“技术-场景-产业”深度融合的落地策略。
  未来,瑞为技术将继续以“通用视觉语义理解”为核心,联合产业伙伴共建开放生态,推动视觉大模型在更多垂直领域行业和场景的应用,助力中国人工智能的高质量发展,以人工智能构建更美好社会生活。

微信扫描二维码,关注公众号。