一些用户在 Google Docs 中出现了一项新功能,可以将任何文档转换为音频轨道。现在,您可以直接听取文本,而不是在屏幕上重新阅读,感谢 Google 的 Gemini AI 模型直接集成到文字处理器中。
在 Docs 的网页版中,“工具”菜单下出现了一个新的“音频”选项。激活它会弹出一个紧凑的音频播放器,您可以在工作区内拖动它而不打断播放。
这不仅仅是一个机器人声音在朗读您的文本。该功能提供了几种声音风格以匹配您的材料。您可以选择“解释性”语调用于复杂主题,选择“激励”声音用于鼓舞人心的文本,或选择“叙述者”风格用于教育内容,使得听取信息变得更加容易。
还有第二个巧妙的协作功能:作者可以直接在文档文本中插入特殊的音频按钮。这非常适合突出需要同事注意的特定段落。这类工具对多任务处理、听觉学习者以及捕捉那些在阅读时容易忽略的错别字非常有帮助。
目前,这项新功能仅适用于英文文本,并且仅在网络上可用。接下来几周内,Google 的 AI Pro 和 Ultra 计划的付费订阅用户,以及符合条件的企业和教育客户将逐步获得访问权限。暂时其他用户将无法使用。
在相关消息中,AI Pro 和 Ultra 订阅用户还获得了另一个工具的访问权限:在 Android 上使用 Google Docs 应用直接生成 AI 图像的能力。
Google 继续积极发展 AI 领域,将其引入越来越多的自有产品中。因此,早些时候 该 功能已被添加到 NotebookLM,它将用户上传的文档转换为带有语音伴奏的视觉幻灯片。此外,语音助手 Gemini 已学会拨打电话,而 Google Meet 可以自动记录会议笔记。
帖子已翻译 显示原文 (EN)