• 官方微信

    官方微信
  • 官方APP

    官方APP
  • 官方视频号

    官方视频号
  • 电子报

洞察金融市场

传播中国价值

Global Perspective, China Value

商汤科技,重磅发布

来源:中国基金报 2025-04-12 00:18

【导读】商汤科技,重磅发布!

中国基金报记者 赵心怡

“AI之道,在于百姓之日用。商汤日日新SenseNova V6(以下简称日日新V6)将跨越多模态边界,释放推理与智能的无限可能。”商汤科技董事长兼首席执行官徐立表示。
4月10日,商汤科技在上海举办2025技术交流日活动,推出全新升级的日日新V6大模型体系,通过多模态长思维链训练、全局记忆、强化学习的技术突破,形成领先的多模态推理能力,并突破成本边界。
“多模态”成热词
徐立在现场演讲时提到,今年与大模型相关的热词离不开“多模态”,因为多模态模型的发展和通用人工智能的发展画上了约等号。“很多人说多模态模型是走向通用人工智能的必由之路,很多图灵奖得主也说纯粹的语言模型不能真正完整地表达人类的智能,这是有迹可循的。”徐立表示。
据徐立介绍,日日新V6今年在多模态的建设上有了更多优势。首先,构造多模态的长思维链数据,这使得大模型变得更加聪明。其次,完成多模态强化学习的引擎,包括很多激励函数。最后,模态越多,上下文就越长,使多模态数据拥有全局的记忆是实时交互中的一个重点。
他说,凭借“全局记忆”能力,日日新V6打破了传统模型仅支持短视频的限制,可支持10分钟级视频全帧率解析。基于强大的理解能力,日日新V6还可以对视频的精彩内容进行智能剪辑输出,帮助用户保留珍贵瞬间。
此外,伴随日日新V6的发布,商汤日日新实时交互融合大模型升级至“SenseNova V6 Omni”,拥有更像人的感知和表达能力、情感理解能力,并已在具身智能等领域实现多行业、多场景落地。
深耕两个重点落地方向
行业竞争愈发激烈,不少科技巨头都在多模态大模型上发力。商汤科技联合创始人兼大模型首席科学家林达华称,商汤科技聚焦原生多模态融合,并解决“模态跷跷板”问题(通过桥接技术避免多模态训练导致单模态能力下降)。此外,商汤科技专注多模态推理,而非纯文本赛道竞争,因为未来交互必然是全模态的。
“多模态模型能更好地模拟人类与世界的交互方式,超过50%的互联网内容消费是视频。”林达华说。
林达华表示,商汤科技将深耕两个重点落地方向:一是开发生产力工具,以进入高附加值的商业领域,涵盖金融、政务以及企业等业务;二是深耕最终的内容消费端,致力于多模态实时交互技术的开发,并将其应用于实际的营销场景中。
针对当下“算力需求旺盛”“智算中心供大于求”的声音,商汤科技联合创始人兼大装置事业群总裁杨帆表示,AI基础设施包括算力、算法、数据三要素,整体增量的发展趋势依然十分明显。
杨帆认为,若要实现人工智能产业更优质、更持久、更可持续发展,必须降低整个行业的进入门槛,优化所有AI创新者的性价比和工作效率。
杨帆表示,目前人工智能产业呈现出三个关键趋势:首先,开源模型与工具逐渐成为行业发展的主流方向;其次,性价比依旧是所有大型模型应用的核心竞争点;第三,多模态技术成为最新且备受关注的技术焦点,这一新兴技术趋势将开启更多应用场景,并促进行业深度拓展。
编辑:黄梅
校对:乔伊
制作:舰长
审核:许闻
APP