AI快讯 | 人工智能系统可以使用静态图像将语音轨道转换为人说话的视频

人工智能系统可以使用静态图像将语音轨道转换为人说话的视频

来源：房产-巴蜀在线发布日期：2024-03-08

阿里巴巴集团智能计算研究院的一个人工智能研究人员小组通过他们创建的视频演示了一款新的人工智能应用程序，该应用程序可以接受一张人脸照片以及某人说话或唱歌的配乐，并使用它们来创建说话或演唱音轨的人的动画版本。该小组发表了一篇论文，描述了他们在arXiv预印本服务器上的工作。

先前的研究人员已经演示了人工智能应用程序，可以处理脸部照片并用它来创建半动画版本。在这项新的努力中，阿里巴巴团队通过添加声音更进一步。也许，同样重要的是，他们在没有使用 3D 模型甚至面部标志的情况下就做到了这一点。相反，该团队使用了基于在大型音频或视频文件数据集上训练人工智能的扩散建模。在本例中，该团队使用了大约 250 小时的此类数据来创建他们的应用程序，他们将其称为 Emote Portrait Alive ( EMO )。

通过直接将音频波形转换为视频帧，研究人员创建了一个应用程序，可以捕获微妙的人类面部姿势、言语怪癖以及其他特征，从而将动画图像识别为人类面部。这些视频忠实地再现了用于形成单词和句子的可能的嘴形，以及通常与之相关的表情。

该团队发布了多个视频，展示了他们生成的惊人准确的性能，并声称它们在真实性和表现力方面优于其他应用程序。他们还指出，完成的视频长度是由原始音轨的长度决定的。在视频中，原始图片与该人一起显示，该人以原始音轨上录制的声音说话或唱歌。

如何在 iPhone 上使用 Google 地图 Glanceable 导航

Galaxy Z Fold 6设计曝光从各个角度展示

官方Nothing Phone (2a) 拆箱视频已上线

整个 iPhone 17 系列预计将使用 LTPO ProMotion 显示屏

TECNO 在 MWC 上推出 Camon 30 Premier 等三款机型

Wear OS 4 的混合界面提高了 OnePlus Watch 2 的电池寿命

Big Lot 收购了儿童玩具品牌 Hearthsong 的全部库存

沃尔玛通过 Gigaton 项目提前六年实现可持续发展目标

科学家提出了如何破解地球变暖的新想法：干燥高层大气

全新跑车玛莎拉蒂 GranCabrio 亮相

vivo X Fold3 即将上市成为首款搭载 Snapdragon 8 Gen 3 的可折叠手机

BP 在选定的 Wild Bean 咖啡馆试点提供定制食品

每周还款额低于 550 美元的郊区

人工智能系统可以使用静态图像将语音轨道转换为人说话的视频

我们从未想过会看到的 4 个奇怪的人工智能集成

由 Raspberry Pi 驱动的漫游车是机器人技术的一个良好开端

人工智能对公开照片进行排序显示恢复中的太平洋座头鲸已达到气候上限

人工智能系统可以使用静态图像将语音轨道转换为人说话的视频

石头扫地机器人P10S Pro大吸力热水清洗可伸缩边刷发布

人工智能专业吴老师高级讲师

亚马逊推出人工智能聊天机器人 Rufus 测试版

AI大模型创作内容助手

5.5 智能采集文章：支持9个AI大模型创作文章

刷屏！特斯拉擎天柱机器人亮相！预计价...

微软(MSFT.US)宣布举办“工作新时代”数字发布会，聚焦CopilotAI、Windows和Surface

时报会客厅｜申万宏源林起贤：AI大模型产业趋势很确定，但需注意成长股的波动性

元宇宙：连接现实与虚拟的无限可能

中国正在加速进入元宇宙时代，预计2023年将会有大发展

金融元宇宙赋能实体经济-赵永新教授演讲

妈祖文化|推进妈祖元宇宙建设！这份协议签了

疫情时代，元宇宙旅游

元宇宙与数字藏品的联系

普陀创办“元宇宙”工博会，为企业发展建构“内循环”新赛道

光谷元宇宙研究院成立推动科幻产业发展

元宇宙服装已形成产业？Roblox公司在数字服装上赚取数数亿美元

“元宇宙”直播展现顺义冰雪魅力

人工智能系统可以使用静态图像将语音轨道转换为人说话的视频

我们从未想过会看到的 4 个奇怪的人工智能集成

由 Raspberry Pi 驱动的漫游车是机器人技术的一个良好开端

人工智能对公开照片进行排序 显示恢复中的太平洋座头鲸已达到气候上限

人工智能系统可以使用静态图像将语音轨道转换为人说话的视频

石头扫地机器人P10S Pro大吸力热水清洗可伸缩边刷发布

人工智能专业吴老师高级讲师

亚马逊推出人工智能聊天机器人 Rufus 测试版

AI大模型创作内容助手

5.5 智能采集文章：支持9个AI大模型创作文章

刷屏！特斯拉擎天柱机器人亮相！预计价...

微软(MSFT.US)宣布举办“工作新时代”数字发布会，聚焦CopilotAI、Windows和Surface

时报会客厅｜申万宏源林起贤：AI大模型产业趋势很确定，但需注意成长股的波动性

元宇宙：连接现实与虚拟的无限可能

中国正在加速进入元宇宙时代，预计2023年将会有大发展

金融元宇宙赋能实体经济-赵永新教授演讲

妈祖文化|推进妈祖元宇宙建设！这份协议签了

疫情时代，元宇宙旅游

元宇宙与数字藏品的联系

普陀创办“元宇宙”工博会，为企业发展建构“内循环”新赛道

光谷元宇宙研究院成立 推动科幻产业发展

元宇宙服装已形成产业？Roblox公司在数字服装上赚取数数亿美元

“元宇宙”直播展现顺义冰雪魅力

人工智能对公开照片进行排序显示恢复中的太平洋座头鲸已达到气候上限

光谷元宇宙研究院成立推动科幻产业发展