新闻 硬件和技术 离线人工智能:谷歌将Gemini Nano带入移动应用,无需云端

离线人工智能:谷歌将Gemini Nano带入移动应用,无需云端

Arkadiy Andrienko
在完整版本中阅读

谷歌正在推出工具,让开发者能够将生成式人工智能直接嵌入移动应用程序,而无需依赖云服务器。更新后的 ML Kit SDK 现在支持 Gemini Nano,这是一种设计用于在智能手机上本地运行的紧凑型语言模型。这使得诸如文本摘要、内容改写或生成图像说明等功能成为可能——所有这些都能将用户数据保留在设备上。

这里的主要优势是隐私。所有内容——从输入到输出——都是在本地处理的。这意味着像通知摘要或文本编辑这样的功能即使在没有互联网连接的情况下也能工作。然而,与基于云的模型相比,Gemini Nano 有一些限制:其文本输出限制为三点,并且图像说明目前仅支持英语。性能也因模型版本而异:最小的(XXS)仅重 25MB,只处理文本,而标准的(XS)大约需要 100MB 的内存。

在发布时,Gemini Nano 支持像谷歌 Pixel 9a、三星 Galaxy S25 和小米 15 等旗舰设备,未来还会有更多设备支持。使用设备内 AI 的应用程序数量也预计会增长。开发者已经可以开始测试 API 的测试版,但有一些限制:应用程序受到请求配额的限制,后台处理也受到限制。例如,如果用户最小化应用程序,其 AI 功能将暂停。

有趣的是,谷歌并不是第一个追求设备内 AI 的公司。高通和联发科也推出了自己的解决方案,但这些方案在不同手机之间的适应性较差。通过 ML Kit 集成 Gemini Nano,谷歌简化了这一过程——开发者无需从头开始构建模型或为每个芯片组进行微调。不过,许多智能手机的有限处理能力将减缓更广泛的采用。

现实世界的好处已经开始显现:例如,Pixel 可以在设备上分析屏幕截图,而摩托罗拉 Razr Ultra 可以生成离线通知摘要。借助 Gemini Nano,这些功能可能会成为常态——但目前,稳定的性能将依赖于开发者和硬件制造商的持续努力。

    关于作者
    评论0
    留下评论