谷歌推出实时音乐即兴表演的人工智能

Arkadiy Andrienko

2025年6月25日, 18:04

实验音乐爱好者现在有了一个实时创作的工具：谷歌的Magenta RealTime。这个人工智能的独特之处在于它不构建完整的曲目，而是处理仅有两秒钟长的微小片段。

这种技术解锁了一些令人惊讶的好处。首先，该系统即使在标准笔记本电脑上也能流畅运行；演示在谷歌Colab的免费层上也能可靠工作。其次，音乐家可以在生成过程中即时调整声音，模拟现场即兴演奏。人工智能不断“倾听”最后10秒的输出，确保无缝过渡。

在后台，Magenta RealTime是一个拥有8亿参数的Transformer模型，经过190,000小时的器乐音乐训练。用户通过文本提示或音频样本引导它，系统则返回两秒钟的录音室质量（48 kHz）片段。结果感觉就像与算法一起即兴演奏。

不过，这项技术确实有一些怪癖。由于其训练数据，它对西方音乐风格的处理更好，无法产生可理解的声乐。此外，风格变化的反应延迟略有，需2-3秒才能生效。开发者们已经在努力缩短这种延迟。

该模型的源代码和权重现在已开源，让爱好者可以在后台对系统进行调整。目前，Magenta RealTime更像是一个实验性的沙盒，用于声音探索，而不是一个打磨精致的产品。尽管如此，团队强调他们的目标不是取代音乐家，而是通过提供一种根本上新的数字乐器来激发自发的创造力。

PC 新闻硬件和技术 Google 音乐和音轨

关于作者

Arkadiy Andrienko

文章和新闻的作者

作为VGTimes的技术记者，我同样乐于讨论最新的图形处理器，也深入探讨经典RPG的细节。自2018年以来，我一直在撰写关于游戏和设备的文章，我在音频制作领域的工作经验使我能够很好地理解音频技术的细微差别，我总是在寻找游戏设备领域的新事物。当我不在写技术文章时，我很可能在《辐射》中探索后末日的荒原，在《边缘世界》中管理一个殖民地，或者在《钢铁雄心IV》中指挥军队。对我来说，游戏不仅仅是一种爱好——它是一种激情，激发我的创造力，并与不断发展的技术世界保持联系。

留下评论