YouTube推出了一项重大平台更新,自动 为视频创建配音音轨。这项新技术由其Gemini AI驱动,能够处理多达30种语言。在视频上传后,系统会分析原始语音并生成翻译,算法努力保持创作者的原始语调和情感节奏。
创作者可以在YouTube Studio中查看、编辑或禁用自动生成的翻译。观众则可以直接从视频设置中选择他们喜欢的语言轨道。对于创作者来说,这是一种低成本的方式来接触国际观众,因为他们之前必须使用专业的配音服务或雇佣配音演员。
根据YouTube的数据,使用多语言音频的频道,其总观看时间中有多达25%来自观看非母语内容的观众。
目前,该系统并不完美,但正在积极改进。YouTube承认,算法仍然可能错误翻译习语或专有名词,并可能在背景噪音较大的情况下表现不佳。口型同步仍然在不断完善中。该功能将在未来几周内向全球数百万创作者开放。同时,YouTube还在测试多语言缩略图,以显示观众语言的文本。
展望未来,开发者计划在五年内使AI配音可用于平台上的每个视频,持续提高创作者的声音和情感表达的质量。自动配音的广泛采用标志着平台演变的重要一步,使YouTube有望成为全球首个真正多语言和多文化的视频平台。