谷歌将两项关键技术——深度研究和音频概述——合并,创造出动态音频播客。现在,用户可以将复杂的分析报告转化为虚拟主持人之间的引人入胜的对话,为学习和处理信息开辟了新的可能性。
之前推出的深度研究功能允许Gemini分析来自互联网的大量数据,并生成关于特定主题的详细报告。从今天开始,该工具现在包括生成音频概述选项,将枯燥的事实转化为互动播客。一旦研究完成,用户选择适当的按钮,Gemini就会生成两个AI“主持人”之间的对话,以生动的对话格式讨论关键发现。
语音摘要技术首次在2023年9月的NotebookLM应用中亮相,旨在进行文档分析。在过去的一年半中,谷歌显著改进了该功能:用户现在可以影响对话的脚本,向虚拟发言者提问,甚至改变内容传递的风格。在2025年3月,该服务对所有人开放——包括免费用户和订阅者。
虽然该系统之前仅能处理短文本和演示文稿,但与深度研究的整合现在使其能够处理全面的研究——从气候报告到市场分析。专家指出,从单调的文本摘要到互动播客的过渡解决了“信息疲劳”的问题。这两个AI对话者模拟讨论,突出矛盾,用例子支持论点,甚至添加故事元素。根据谷歌代表的说法,这种格式相比传统方法提高了40%的数据保留率。
到2025年底,谷歌计划增加选择主持人声音、调整剧集长度和实时插入用户生成问题的功能。个性化音频内容的新纪元已经开始,在这里,每个请求都变成一个独特的节目。