新闻 硬件和技术 谷歌推出实时音乐即兴表演的人工智能

谷歌推出实时音乐即兴表演的人工智能

Arkadiy Andrienko
在完整版本中阅读

实验音乐爱好者现在有了一个实时创作的工具:谷歌的Magenta RealTime。这个人工智能的独特之处在于它不构建完整的曲目,而是处理仅有两秒钟长的微小片段。

这种技术解锁了一些令人惊讶的好处。首先,该系统即使在标准笔记本电脑上也能流畅运行;演示在谷歌Colab的免费层上也能可靠工作。其次,音乐家可以在生成过程中即时调整声音,模拟现场即兴演奏。人工智能不断“倾听”最后10秒的输出,确保无缝过渡。

在后台,Magenta RealTime是一个拥有8亿参数的Transformer模型,经过190,000小时的器乐音乐训练。用户通过文本提示或音频样本引导它,系统则返回两秒钟的录音室质量(48 kHz)片段。结果感觉就像与算法一起即兴演奏。

不过,这项技术确实有一些怪癖。由于其训练数据,它对西方音乐风格的处理更好,无法产生可理解的声乐。此外,风格变化的反应延迟略有,需2-3秒才能生效。开发者们已经在努力缩短这种延迟。

该模型的源代码和权重现在已开源,让爱好者可以在后台对系统进行调整。目前,Magenta RealTime更像是一个实验性的沙盒,用于声音探索,而不是一个打磨精致的产品。尽管如此,团队强调他们的目标不是取代音乐家,而是通过提供一种根本上新的数字乐器来激发自发的创造力。

    关于作者
    评论0
    留下评论