商汤发布可控人物视频生成大模型Vimi，实现分钟级视频

7月4日，世界人工智能大会在上海召开，由商汤科技打造的首个面向C端用户的可控人物视频生成大模型Vimi亮相。商汤方面介绍，基于商汤日日新大模型的能力，仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频，并支持多种驱动方式，可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

与图片表情控制类技术只能控制头部表情动作不同，商汤介绍，Vimi能够实现精准的人物表情控制，还可实现在半身区域内控制照片中人物的自然肢体变化，并自动生成与人物相符的头发、服饰及背景变化，可稳定生成1分钟的单镜头人物类视频，据悉Vimi将完全面向C端用户开放使用。