新的Google DeepMind AI技术可以为无声视频生成音乐和声音效果

来源:网界网 | 2024-06-19 09:44:31

  谷歌的 DeepMind 推出了一项新的 AI 技术,可以为无声视频生成背景音乐和音效。这种“视频到音频”系统旨在简化视频编辑过程,特别是对于内容创作者而言。

  该技术仍在开发中,但它提供了一些令人兴奋的功能。以下是该过程的细分:

  用户输入:创作者上传他们的无声视频,并可以提供关键字或短语来指导人工智能生成所需的音景。例如,一个人在黑暗中行走的无声视频可以与“电影、恐怖电影、音乐、紧张、混凝土上的脚步声”等提示配对,以帮助人工智能理解情绪和环境。

  人工智能在行动:DeepMind 的 AI 模型首先拆解视频以分析视觉效果。然后,将这些分解的视频数据与用户的文本提示相结合。使用扩散模型,人工智能迭代处理这些信息,最终生成补充视频内容的背景声音。

  定制音景:该模型可以为单个视频创建各种音频选项,允许创作者选择最适合其项目的音频选项。DeepMind的系统还可以考虑提示词的情感语气。例如,强调“紧张”的提示可能会导致悬疑的背景音乐,而像“欢乐的庆祝”这样的提示可能会导致更欢快的声音。

  展望未来,DeepMind正在积极完善该技术。未来的发展包括使人工智能能够仅根据视频内容自动生成声音,从而消除对用户提示的需求。此外,他们还致力于提高系统将生成的对话与视频中角色的嘴唇动作同步的能力。

  这种“视频到音频”技术有可能彻底改变视频编辑,特别是对于无法获得专业音频工具或专业知识的创作者。

相关阅读

每日精选