稳定性人工智能推出轻量级离线声音生成AI模型

2025年5月15日, 11:39

Stability AI，以其在生成性人工智能方面的创新而闻名，宣布了一种新的音频生成模型：Stable Audio Open Small。这个工具的独特之处在于它能够在没有互联网连接的情况下在智能手机上运行，这得益于对Arm处理器的优化。

该模型与芯片制造商Arm合作开发，旨在生成短音频片段——样本、音效或乐器草图，最长可达11秒。开发者表示，即使在移动设备上，生成这样的音频也只需不到八秒钟。这一性能得益于将神经网络缩小到3.41亿个参数，并为节能芯片量身定制。

与像Suno或Udio这样的基于云的服务不同，Stable Audio Open Small完全在本地工作。这消除了延迟和对互联网连接的依赖。该模型仅在来自Free Music Archive和Freesound的开源数据集上进行训练，从而降低了版权风险——这与一些依赖更可疑训练材料的竞争对手形成了显著对比。

尽管如此，该工具也有其局限性：它仅支持英语提示，不生成人声或复杂的作品。使用条款各不相同——对于初创公司和研究人员是免费的，但年收入超过100万美元的公司需要购买商业许可证。虽然它不能替代专业录音室，但Stable Audio Open Small为您提供了一个实用的解决方案，可以直接从手机快速创建音频。

帖子已翻译显示原文 (EN)

新闻硬件和技术公告

关于作者

Arkadiy Andrienko

文章和新闻的作者

作为VGTimes的技术记者，我同样乐于讨论最新的图形处理器，也深入探讨经典RPG的细节。自2018年以来，我一直在撰写关于游戏和设备的文章，我在音频制作领域的工作经验使我能够很好地理解音频技术的细微差别，我总是在寻找游戏设备领域的新事物。当我不在写技术文章时，我很可能在《辐射》中探索后末日的荒原，在《边缘世界》中管理一个殖民地，或者在《钢铁雄心IV》中指挥军队。对我来说，游戏不仅仅是一种爱好——它是一种激情，激发我的创造力，并与不断发展的技术世界保持联系。

...展开