稳定性人工智能推出轻量级离线声音生成AI模型

稳定性人工智能推出轻量级离线声音生成AI模型

Arkadiy Andrienko

Stability AI,以其在生成性人工智能方面的创新而闻名,宣布了一种新的音频生成模型:Stable Audio Open Small。这个工具的独特之处在于它能够在没有互联网连接的情况下在智能手机上运行,这得益于对Arm处理器的优化。

该模型与芯片制造商Arm合作开发,旨在生成短音频片段——样本、音效或乐器草图,最长可达11秒。开发者表示,即使在移动设备上,生成这样的音频也只需不到八秒钟。这一性能得益于将神经网络缩小到3.41亿个参数,并为节能芯片量身定制。

与像Suno或Udio这样的基于云的服务不同,Stable Audio Open Small完全在本地工作。这消除了延迟和对互联网连接的依赖。该模型仅在来自Free Music Archive和Freesound的开源数据集上进行训练,从而降低了版权风险——这与一些依赖更可疑训练材料的竞争对手形成了显著对比。

尽管如此,该工具也有其局限性:它仅支持英语提示,不生成人声或复杂的作品。使用条款各不相同——对于初创公司和研究人员是免费的,但年收入超过100万美元的公司需要购买商业许可证。虽然它不能替代专业录音室,但Stable Audio Open Small为您提供了一个实用的解决方案,可以直接从手机快速创建音频。

    关于作者
    评论0