6月18-22日,一年一度的AI顶会 CVPR 2023 在加拿大举行。CVPR全称为Computer Vision and Pattern Recognition,即国际计算机视觉与模式识别,是人工智能领域的顶级学术会议。近年来,CVPR 的投稿数量持续增加,今年收到有效投稿 9155 篇,和 CVPR 2022 相比增加 12%,创历史新高。最终,大会收录论文 2360 篇,接收率为 25.78 %。
6月18-22日,一年一度的AI顶会 CVPR 2023 在加拿大举行。CVPR全称为Computer Vision and Pattern Recognition,即国际计算机视觉与模式识别,是人工智能领域的顶级学术会议。近年来,CVPR 的投稿数量持续增加,今年收到有效投稿 9155 篇,和 CVPR 2022 相比增加 12%,创历史新高。最终,大会收录论文 2360 篇,接收率为 25.78 %。
旷视已经连续多年在 CVPR 会议上取得优异成绩。本次,旷视科技有 13 篇论文入选,涵盖 3D 目标检测、多目标跟踪、模型压缩、知识蒸馏、自动驾驶等多个备受关注的 AI 研究与产业前沿领域和方向,为解决行业应用痛点提供了新的解题思路,再次展示了旷视在人工智能领域的技术实力。
除了论文,每年 CVPR 会议期间举办的各项挑战赛也吸引了全球顶尖 AI 人才和公司参与。2023年,旷视在 CVPR 2023 NTIRE Super-Resolution Challenge 图像恢复与增强新趋势-高效超分辨率赛道上取得冠军,这也是旷视连续第三年在 NTIRE 的图像超分辨率赛道上夺冠。
NTIRE全称为New Trends in Image Restoration and Enhancement(图像恢复与增强的新趋势)是极具影响力的国际竞赛,在学术界和工业界影响广泛。2022年,旷视获得NTIRE 双目图像超分辨率比赛(Stereo Image Super-Resolution Challenge)第一。2021年,旷视在NTIRE图像超分辨率(Burst Super-Resolution)赛道上取得冠军。这些荣誉再次证明了旷视在计算摄影领域的技术实力。
此外,旷视在 CVPR 2023 自动驾驶国际挑战赛 OpenLane Topology 赛道中击败30余支国内外队伍,夺得冠军。CVPR 2023 自动驾驶国际挑战赛将自动驾驶技术分为对背景场景的理解、对前景物体的感知和对未来运动的规划三个方面,并举办了四个不同的赛道进行深入探讨。在OpenLane Topology 赛道中,旷视结合自研的PETRv2框架和YOLO系列最新的模型YOLOv8,搭建了一个多阶段的网络框架,将其拓展到拓扑关系的预测中,最终凭借OLS指标的显著优势取得了第一名的好成绩。
这些成绩再次印证了旷视在基础模型科研领域的领先地位。基础模型科研是 AI 创新突破的基石,旷视坚持长期主义,以原创、实用和本质作为基础科研的指导原则,致力于解决人工智能最本质的难题。目前,旷视研究院已在ICCV、CVPR、ECCV 等国际学术会议、期刊上发表论文200余篇,在各项国际人工智能顶级竞赛中累计揽获 56 项世界冠军或最高荣誉。
当下,大模型已成为 AI 重要的技术发展方向。旷视一直坚定投入大模型研发,具备领先的大模型原创科研能力。旷视研究院基础模型科研聚焦于通用图像大模型、视频理解大模型、计算摄影大模型和自动驾驶感知大模型四个方向,并取得了多项突出的科研成果。面向未来,旷视将积极拥抱多模态大模型,将大模型与机器人等硬件载体结合,针对需要复杂决策的物联网场景打造行业应用。