谷歌文档获得了人工智能驱动的“朗读”功能，配备富有表现力的声音

Arkadiy Andrienko

2025年8月19日, 18:46

一些用户在 Google Docs 中出现了一项新功能，可以将任何文档转换为音频轨道。现在，您可以直接听取文本，而不是在屏幕上重新阅读，感谢 Google 的 Gemini AI 模型直接集成到文字处理器中。

在 Docs 的网页版中，“工具”菜单下出现了一个新的“音频”选项。激活它会弹出一个紧凑的音频播放器，您可以在工作区内拖动它而不打断播放。

这不仅仅是一个机器人声音在朗读您的文本。该功能提供了几种声音风格以匹配您的材料。您可以选择“解释性”语调用于复杂主题，选择“激励”声音用于鼓舞人心的文本，或选择“叙述者”风格用于教育内容，使得听取信息变得更加容易。

还有第二个巧妙的协作功能：作者可以直接在文档文本中插入特殊的音频按钮。这非常适合突出需要同事注意的特定段落。这类工具对多任务处理、听觉学习者以及捕捉那些在阅读时容易忽略的错别字非常有帮助。

目前，这项新功能仅适用于英文文本，并且仅在网络上可用。接下来几周内，Google 的 AI Pro 和 Ultra 计划的付费订阅用户，以及符合条件的企业和教育客户将逐步获得访问权限。暂时其他用户将无法使用。

在相关消息中，AI Pro 和 Ultra 订阅用户还获得了另一个工具的访问权限：在 Android 上使用 Google Docs 应用直接生成 AI 图像的能力。

Google 继续积极发展 AI 领域，将其引入越来越多的自有产品中。因此，早些时候该功能已被添加到 NotebookLM，它将用户上传的文档转换为带有语音伴奏的视觉幻灯片。此外，语音助手 Gemini 已学会拨打电话，而 Google Meet 可以自动记录会议笔记。

帖子已翻译显示原文 (EN)

PC 新闻硬件和技术 Google

关于作者

Arkadiy Andrienko

文章和新闻的作者

作为VGTimes的技术记者，我同样乐于讨论最新的图形处理器，也深入探讨经典RPG的细节。自2018年以来，我一直在撰写关于游戏和设备的文章，我在音频制作领域的工作经验使我能够很好地理解音频技术的细微差别，我总是在寻找游戏设备领域的新事物。当我不在写技术文章时，我很可能在《辐射》中探索后末日的荒原，在《边缘世界》中管理一个殖民地，或者在《钢铁雄心IV》中指挥军队。对我来说，游戏不仅仅是一种爱好——它是一种激情，激发我的创造力，并与不断发展的技术世界保持联系。

...展开