作为YouTube新任领导者的首次重要演讲,Neal Mohan不仅仅暗示了渐进式更新;他公布了一项全面的生成式AI愿景,有望重新定义平台上的内容创作。这一公告标志着战略转向,旨在让数百万用户都能使用先进的AI工具,将YouTube从一个被动的托管服务转变为一个积极的创意合作伙伴。暗示很明确:YouTube正大力投资AI,以降低创作者的入门门槛,培育一个创新新时代,任何人都能以最小的努力制作出专业品质的视频。
其影响是深远的,因为这些工具旨在无缝集成到现有的创作者工作流程中,从构思到发布。通过利用与Google DeepMind和其他内部团队的合作关系,YouTube准备推出不仅能增强创造力,还能简化制作流程的功能。此举顺应了更广泛的行业趋势,但由于YouTube庞大的用户群以及直接集成到全球最大视频平台中而显得尤为突出。
YouTube AI推进的前沿是Veo 3 Fast,这是一个与Google DeepMind合作开发的自定义视频生成模型。该工具专门针对YouTube Shorts进行了优化,提供免费的、低延迟的480p带声音生成——全部在移动设备上完成。创作者可以点击创建按钮并访问一个火花图标,通过简单的文本提示生成视频片段,在几秒钟内将抽象想法转化为视觉内容。该功能已在美国和英国等关键市场开始推出,并计划进行全球扩展。
与独立的AI视频应用不同,Veo 3直接内置于YouTube的生态系统中,允许实时实验而无需切换平台。它从一开始就支持声音生成,这是此类工具的首创,使创作者能够制作出音频线索与视觉叙事相匹配的完整Shorts。早期测试显示制作时间显著减少,因为用户可以快速迭代概念,从喜剧小品到教育片段,无需具备广泛的编辑技能。
对许多创作者来说,空白的时间线是视频制作中最令人生畏的部分。YouTube的“AI编辑”功能通过智能地将原始相机胶卷素材转化为引人入胜的初稿来解决这个问题。它使用先进的算法,识别最佳时刻,连贯地排列它们,并添加音乐、转场,甚至英语或印地语等语言的俏皮旁白。这为创作者提供了一个坚实的起点,使他们能够专注于个性化,而不是繁琐的初步编辑。
目前正在Shorts和YouTube Create应用中进行实验,“AI编辑”功能即将扩展到部分市场。通过处理片段选择和基础编辑的重任,该工具使视频制作民主化,让初学者也能上手,同时为经验丰富的专业人士节省时间。这是迈向AI作为创意过程中协作伙伴的明确一步。
想象一下,听到视频中一句朗朗上口的对话,并立即将其重新混音为你下一个Shorts的配乐。YouTube的“语音转歌曲”工具利用Lyria 2(Google DeepMind的高级AI音乐模型)使之成为可能。它允许创作者提取视频中符合条件的对话,并将其转化为具有可定制氛围(如轻松、适合舞蹈或有趣)的歌曲,同时注明原始创作者。这一功能不仅激发了音频创意的新形式,还通过混音文化鼓励社区参与。
“语音转歌曲”使用SynthID水印和内容标签来标识AI生成的内容,确保透明度。通过直接集成到YouTube中,它简化了混音过程,消除了对外部软件的需求。创作者可以以以前仅限于音乐家的方式进行声音实验,为病毒式传播趋势和独特的融合叙述与旋律的内容形式开辟了途径。
除了创作工具,YouTube还部署AI来丰富观看体验。对话式AI工具适用于部分英语视频,面向18岁以上的用户,允许观众在不离开视频的情况下询问有关内容的问题或请求相关推荐。该功能由大型语言模型(LLMs)驱动,提供了互动学习机会,尤其是在学术视频上,它可以测验用户并解释关键概念。
该工具与Gemini等独立应用不同之处在于,它特定于YouTube内容。它帮助观众更深入地探讨主题,从教程到纪录片,培养更具参与感和见识的受众。随着它的推出,预计随着用户实时与视频互动,留存率和满意度将得到提高。
YouTube的AI举措超越了已宣布的功能。来自第三方教程的见解强调了诸如直播的AI亮点、自动播客转Shorts转换以及用于多语言覆盖的配音等工具。这些通常隐藏在平台更新中的集成,展示了YouTube将其生态系统转变为AI原生环境的承诺。创作者可以利用这些功能在YouTube仪表板内与Gemini进行头脑风暴、生成缩略图或优化SEO。
能力越大,责任越大。YouTube正在通过使用SynthID水印来标记AI生成的内容,以解决伦理问题,促进真实性和信任。随着这些工具的发展,重点将放在全球扩展访问、提高准确性以及探索3D动画或实时协作等新功能上。Neal Mohan的愿景暗示了一个未来,AI不仅协助创作者,还能激发全新的内容类型,巩固YouTube作为终极创意游乐场的角色。