|
阿里整大活 一张照片就能生成视频时间:2023-04-17 只要一张照片加上音频,就能让你说话唱歌,阿里做到了。 最近,阿里新上线了一款AI图片-音频-视频模型技术EMO,用户只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的AI视频。以及实现无缝对接的动态小视频,最长时间可达1分30秒左右。 阿里研究团队表示,EMO可以生成具有表情丰富的面部表情和各种头部姿势的声音头像视频,同时,其可以根据输入视频的长度生成任意持续时间的视频。 你可以想象一下,用单张静态AI美女头像就可以生成唱歌视频,让前段时间OpenAI sora生成的女主唱歌,或者说用一张张国荣的肖像就可以“复活”张国荣唱粤语歌。 值得一提的是,生成的视频中人物表情非常到位,口型、语速也都能完全匹配。 |