离线人工智能：谷歌将Gemini Nano带入移动应用，无需云端

Arkadiy Andrienko

2025年5月19日, 12:35

谷歌正在推出工具，让开发者能够将生成式人工智能直接嵌入移动应用程序，而无需依赖云服务器。更新后的 ML Kit SDK 现在支持 Gemini Nano，这是一种设计用于在智能手机上本地运行的紧凑型语言模型。这使得诸如文本摘要、内容改写或生成图像说明等功能成为可能——所有这些都能将用户数据保留在设备上。

这里的主要优势是隐私。所有内容——从输入到输出——都是在本地处理的。这意味着像通知摘要或文本编辑这样的功能即使在没有互联网连接的情况下也能工作。然而，与基于云的模型相比，Gemini Nano 有一些限制：其文本输出限制为三点，并且图像说明目前仅支持英语。性能也因模型版本而异：最小的（XXS）仅重 25MB，只处理文本，而标准的（XS）大约需要 100MB 的内存。

在发布时，Gemini Nano 支持像谷歌 Pixel 9a、三星 Galaxy S25 和小米 15 等旗舰设备，未来还会有更多设备支持。使用设备内 AI 的应用程序数量也预计会增长。开发者已经可以开始测试 API 的测试版，但有一些限制：应用程序受到请求配额的限制，后台处理也受到限制。例如，如果用户最小化应用程序，其 AI 功能将暂停。

有趣的是，谷歌并不是第一个追求设备内 AI 的公司。高通和联发科也推出了自己的解决方案，但这些方案在不同手机之间的适应性较差。通过 ML Kit 集成 Gemini Nano，谷歌简化了这一过程——开发者无需从头开始构建模型或为每个芯片组进行微调。不过，许多智能手机的有限处理能力将减缓更广泛的采用。

现实世界的好处已经开始显现：例如，Pixel 可以在设备上分析屏幕截图，而摩托罗拉 Razr Ultra 可以生成离线通知摘要。借助 Gemini Nano，这些功能可能会成为常态——但目前，稳定的性能将依赖于开发者和硬件制造商的持续努力。

Android 新闻硬件和技术 Google

关于作者

Arkadiy Andrienko

文章和新闻的作者

作为VGTimes的技术记者，我同样乐于讨论最新的图形处理器，也深入探讨经典RPG的细节。自2018年以来，我一直在撰写关于游戏和设备的文章，我在音频制作领域的工作经验使我能够很好地理解音频技术的细微差别，我总是在寻找游戏设备领域的新事物。当我不在写技术文章时，我很可能在《辐射》中探索后末日的荒原，在《边缘世界》中管理一个殖民地，或者在《钢铁雄心IV》中指挥军队。对我来说，游戏不仅仅是一种爱好——它是一种激情，激发我的创造力，并与不断发展的技术世界保持联系。

留下评论