智谱清影是智谱 AI 推出的视频生成工具。
7 月 26 日,智谱宣布生成式视频能力全面上线,其旗下的清影功能正式与用户见面。清影依托于智谱自研的视频生成模型 CogVideoX,普通用户即日起可在智谱清言 PC 和 APP 端使用。
清影具有诸多显著特点。它生成 6 秒视频仅需 30 秒,生成的视频清晰度可达 1440×960,帧率为 16fps。用户输入文本或图片后,可选择自己想要生成的风格,包括卡通 3D、黑白、油画、电影感等,配上自带的音乐,即可生成充满 AI 想象力的视频片段。其提供文生视频和图生视频能力,带来了诸多新玩法,如表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的「老照片动起来」小程序也会同步上线,只需上传老照片,AI 就能让照片灵动起来。此外,清影(Ying)API 也同步上线大模型开放平台 bigmodel.cn,企业和开发者通过调用 API 的方式,可体验和使用文生视频以及图生视频的模型能力。
在技术方面,CogVideoX 具有核心技术特点。针对内容连贯性问题,智谱 AI 自主研发了高效的三维变分自编码器结构(3D VAE),结合 3D RoPE 位置编码模块,提升了在时间维度上对帧间关系的捕捉能力。在可控性方面,打造了端到端的视频理解模型,增强了对文本的理解和对指令的遵循能力。模型采纳了将文本、时间、空间三维一体融合的 transformer 架构,优化了模态间的交互效果。
智谱 AI 表示,随着技术的不断发展,清影的生成能力很快将可用于短视频制作、广告生成甚至电影剪辑等工作。
智谱清影的使用教程
智谱清影的使用非常便捷。用户可以在智谱清言的 PC 端和 APP 端进行操作。首先,打开相应的平台,找到 AI 视频生成功能“清影”。用户输入文本或图片后,可选择自己想要生成的风格,比如卡通 3D、黑白、油画、电影感等。在输入文本时,有一些注意事项,比如要保证描述的结构性,遵循一定的公式,如“(摄像机移动)+(建立场景)+(更多细节)”或“(镜头语言) + (光影) + (主体 (主体描述)) + (主体运动)+(场景 (场景描述)) +(情绪/氛围/风格)”,这样能获得更理想的生成效果。此外,还可以配上自带的音乐,为生成的视频增添氛围。对于图片生成视频,用户只需上传图片,按照提示进行操作即可。同时,基于清影的「老照片动起来」小程序也为用户提供了独特的体验,只需上传老照片,AI 就能让照片灵动起来。而企业和开发者还可以通过调用清影(Ying)API 的方式,体验和使用文生视频以及图生视频的模型能力。
智谱清影的技术优势
智谱清影具有显著的技术优势。其依托于智谱自研的视频生成模型 CogVideoX,在技术方面表现出色。针对内容连贯性问题,智谱 AI 自主研发了高效的三维变分自编码器结构(3D VAE),结合 3D RoPE 位置编码模块,极大提升了在时间维度上对帧间关系的捕捉能力,从而建立了视频中的长期依赖关系。在可控性方面,打造了端到端的视频理解模型,增强了对文本的理解和对指令的遵循能力,确保生成的视频更加符合用户的输入需求,并能够处理超长且复杂的 prompt 指令。模型采纳了将文本、时间、空间三维一体融合的 transformer 架构,优化了模态间的交互效果,使生成的视频更加自然、流畅。此外,CogVideoX 相比前代推理速度提升了 6 倍,大大提高了生成效率。
智谱清影在广告制作中的应用
智谱清影在广告制作领域具有广泛的应用前景。它能够根据用户输入的创意和需求,快速生成具有吸引力的广告视频片段。比如,用户可以输入产品特点、品牌形象等相关文本,选择适合的风格,如时尚、科技感等,清影就能生成相应的广告视频。无论是展示产品细节、营造品牌氛围还是讲述品牌故事,清影都能为广告制作提供丰富的创意和高效的制作方式。而且,其生成的视频清晰度可达 1440×960,帧率为 16fps,能够满足广告对于画质和流畅度的要求。通过智谱清影,广告制作的成本和时间都能得到有效降低,同时创意和效果也能得到更好的保障。
智谱清影生成视频的质量评估
智谱清影生成视频的质量具有较高的水准。其能够生成清晰度可达 1440×960,帧率为 16fps 的视频,画面质量清晰、流畅。在风格方面,能够提供多种选择,包括卡通 3D、黑白、油画、电影感等,满足不同用户的需求。从生成的视频内容来看,对于风景、动物、科幻、人文历史等类型的表现较好,擅长生成的视频风格包括卡通风格、真实摄影风格、二次元动漫风格等。在实体类型呈现效果上,动物的呈现效果优于植物,植物优于物品,物品优于建筑,建筑优于人物。不过,在某些复杂场景和人物细节的处理上,可能还需要进一步优化和提升。
智谱清影与其他视频生成工具的比较
在当前的视频生成工具市场中,智谱清影具有独特的优势。与一些工具相比,智谱清影生成 6 秒视频仅需 30 秒,具有较高的生成效率。在风格多样性方面,提供了丰富的选择,满足用户的个性化需求。在内容生成能力上,对于多种类型的视频,如风景、动物、科幻等都有较好的表现。与快手的“可灵”等工具相比,智谱清影在多模态算法和算力储备上展现出独特的“肌肉”,率先在超 200 亿估值的大模型公司中发布视频生成成果。然而,不同的视频生成工具都有其特点和适用场景,用户可以根据自己的具体需求和使用习惯进行选择。
类似智谱清影-AI生视频的软件
暂无评论...