【全球首个中文音视频一体化视频生成模型】
9月25日,全球首个中文音视频一体化视频生成模型百度蒸汽机再次升级,发布通用AI长视频生成功能。该功能支持用户生成无限长度的AI视频,并带来“流式无限生成”的全新体验。
本次升级在行业尚属首次,突破了此前AI仅能生成5秒、10秒短视频,或依赖首尾帧控制续写时长的局限,采用流式生成技术实现了在通用长视频上的“无限”生成能力。此外,蒸汽机还首创“可交互需求”,支持生成过程中随时提交prompt。这意味着,用户在生成过程中可随时暂停,并基于已生成的画面提交新的Prompt(提示词)来引导后续剧情发展。这相当于为AI视频创作配备了“无限画布”,能随时捕捉并落地迸发的灵感,实现更灵活、连续的创作流程。
据悉,百度蒸汽机视频生成模型主打“多人对话音视频一体化生成”。用户仅需输入一张参考图和一段文本描述,即可直接生成具备电影级质感、包含多人对话与精准口型同步的视频内容。据透露,百度蒸汽机还将于10月中旬进一步升级,支持实时交互的长视频生成功能,包括可交互数字人、VR/AR视频内容以及动态游戏世界的生成能力。#蒸汽机#