Trong bài phát biểu quan trọng đầu tiên với tư cách lãnh đạo mới của YouTube, Neal Mohan không chỉ ám chỉ những bản cập nhật nhỏ; ông đã công bố một tầm nhìn toàn diện về AI tạo sinh hứa hẹn định nghĩa lại việc sáng tạo nội dung trên nền tảng. Thông báo này báo hiệu một sự chuyển hướng chiến lược hướng tới việc đưa các công cụ AI tiên tiến đến với hàng triệu người, biến YouTube từ một dịch vụ lưu trữ thụ động thành một đối tác sáng tạo chủ động. Lời gợi ý rất rõ ràng: YouTube đang đầu tư mạnh vào AI để hạ thấp rào cản cho người sáng tạo, thúc đẩy một kỷ nguyên đổi mới nơi bất kỳ ai cũng có thể sản xuất video chất lượng chuyên nghiệp với nỗ lực tối thiểu.
Hàm ý của điều này rất sâu sắc, vì những công cụ này được thiết kế để tích hợp liền mạch vào quy trình làm việc hiện có của người sáng tạo, từ ý tưởng đến xuất bản. Bằng cách tận dụng các quan hệ đối tác với Google DeepMind và các nhóm nội bộ khác, YouTube sẵn sàng tung ra các tính năng không chỉ nâng cao khả năng sáng tạo mà còn hợp lý hóa quy trình sản xuất. Bước đi này phù hợp với xu hướng rộng hơn của ngành nhưng nổi bật nhờ cơ sở người dùng khổng lồ của YouTube và sự tích hợp trực tiếp vào nền tảng video lớn nhất thế giới.
Ở tuyến đầu của làn sóng AI của YouTube là Veo 3 Fast, một mô hình tạo video tùy chỉnh được phát triển hợp tác với Google DeepMind. Công cụ này được tối ưu hóa đặc biệt cho YouTube Shorts, cung cấp khả năng tạo miễn phí, độ trễ thấp ở độ phân giải 480p với âm thanh—tất cả từ thiết bị di động. Người sáng tạo có thể nhấn nút tạo và truy cập biểu tượng lấp lánh để tạo clip video từ các lời nhắc văn bản đơn giản, biến ý tưởng trừu tượng thành nội dung trực quan trong vài giây. Việc triển khai đã bắt đầu tại các thị trường chính như Hoa Kỳ và Vương quốc Anh, với kế hoạch mở rộng toàn cầu.
Khác với các ứng dụng AI video độc lập, Veo 3 được xây dựng trực tiếp vào hệ sinh thái của YouTube, cho phép thử nghiệm thời gian thực mà không cần chuyển đổi nền tảng. Nó hỗ trợ tạo âm thanh ngay từ đầu, một tính năng đầu tiên cho các công cụ như vậy, cho phép người sáng tạo sản xuất Shorts hoàn chỉnh với tín hiệu âm thanh phù hợp với câu chuyện hình ảnh. Các thử nghiệm ban đầu cho thấy giảm đáng kể thời gian sản xuất, vì người dùng có thể lặp lại nhanh chóng các ý tưởng, từ các phân cảnh hài đến các đoạn giáo dục, mà không cần kỹ năng chỉnh sửa chuyên sâu.
Đối với nhiều người sáng tạo, dòng thời gian trống là phần đáng sợ nhất của việc làm video. Tính năng Chỉnh sửa với AI của YouTube giải quyết điều này bằng cách thông minh biến đổi cảnh quay thô từ camera thành một bản nháp đầu tiên hấp dẫn. Sử dụng các thuật toán tiên tiến, nó xác định những khoảnh khắc tốt nhất, sắp xếp chúng một cách mạch lạc và thêm nhạc, chuyển cảnh, thậm chí cả lời thoại vui nhộn bằng các ngôn ngữ như tiếng Anh hoặc tiếng Hindi. Điều này mang lại cho người sáng tạo một điểm khởi đầu vững chắc, cho phép họ tập trung vào cá nhân hóa thay vì chỉnh sửa ban đầu tẻ nhạt.
Hiện đang trong giai đoạn thử nghiệm trên Shorts và ứng dụng YouTube Create, Chỉnh sửa với AI sẽ sớm được mở rộng sang một số thị trường được chọn. Bằng cách xử lý phần việc nặng nhọc của việc chọn clip và chỉnh sửa cơ bản, công cụ này dân chủ hóa việc sản xuất video, làm cho nó dễ tiếp cận với người mới bắt đầu đồng thời tiết kiệm thời gian cho các chuyên gia dày dạn kinh nghiệm. Đây là một bước đi rõ ràng hướng tới AI như một đối tác hợp tác trong quá trình sáng tạo.
Hãy tưởng tượng nghe một câu thoại hấp dẫn trong video và ngay lập tức phối lại nó thành nhạc nền cho Short tiếp theo của bạn. Công cụ Lời nói thành Bài hát của YouTube thực hiện điều này bằng cách tận dụng Lyria 2, mô hình AI âm nhạc tiên tiến của Google DeepMind. Nó cho phép người sáng tạo lấy lời thoại đủ điều kiện từ video và biến đổi chúng thành các bài hát với các tâm trạng có thể tùy chỉnh—chẳng hạn như thư giãn, có thể nhảy hoặc vui nhộn—tất cả trong khi ghi công cho người sáng tạo gốc. Tính năng này không chỉ khơi nguồn cho các hình thức sáng tạo âm thanh mới mà còn khuyến khích sự tương tác cộng đồng thông qua văn hóa phối lại.
Lời nói thành Bài hát sử dụng hình mờ SynthID và nhãn nội dung để chỉ ra nội dung được tạo bởi AI, đảm bảo tính minh bạch. Bằng cách tích hợp trực tiếp vào YouTube, nó đơn giản hóa quy trình phối lại, loại bỏ nhu cầu về phần mềm bên ngoài. Người sáng tạo có thể thử nghiệm với âm thanh theo những cách trước đây chỉ dành cho nhạc sĩ, mở ra các hướng đi cho các xu hướng viral và định dạng nội dung độc đáo pha trộn giữa tường thuật và giai điệu.
Vượt ra ngoài các công cụ sáng tạo, YouTube đang triển khai AI để làm phong phú trải nghiệm người xem. Công cụ AI hội thoại, có sẵn trên một số video tiếng Anh cho người dùng trên 18 tuổi, cho phép người xem đặt câu hỏi về nội dung hoặc yêu cầu đề xuất liên quan mà không cần rời khỏi video. Được hỗ trợ bởi các mô hình ngôn ngữ lớn (LLM), tính năng này cung cấp cơ hội học tập tương tác, đặc biệt trên các video học thuật nơi nó có thể kiểm tra người dùng và giải thích các khái niệm chính.
Công cụ này khác với các ứng dụng độc lập như Gemini ở chỗ nó dành riêng cho ngữ cảnh nội dung YouTube. Nó giúp người xem đi sâu hơn vào các chủ đề, từ hướng dẫn đến phim tài liệu, nuôi dưỡng một đối tượng tham gia và được thông tin hơn. Khi nó được triển khai, hãy mong đợi thấy sự cải thiện về tỷ lệ giữ chân và sự hài lòng khi người dùng tương tác với video trong thời gian thực.
Các sáng kiến AI của YouTube mở rộng ra ngoài các tính năng đã công bố. Thông tin chi tiết từ các hướng dẫn của bên thứ ba làm nổi bật các công cụ như điểm nổi bật được hỗ trợ bởi AI cho phát trực tiếp, chuyển đổi podcast sang Shorts tự động và lồng tiếng để tiếp cận đa ngôn ngữ. Những tích hợp này, thường ẩn trong các bản cập nhật nền tảng, chứng minh cam kết của YouTube trong việc biến hệ sinh thái của mình thành một môi trường gốc AI. Người sáng tạo có thể tận dụng những điều này để động não với Gemini, tạo hình thu nhỏ hoặc tối ưu hóa SEO, tất cả đều trong bảng điều khiển YouTube.
Với sức mạnh lớn đi kèm trách nhiệm lớn. YouTube đang giải quyết các mối lo ngại về đạo đức bằng cách sử dụng hình mờ SynthID để gắn nhãn nội dung được tạo bởi AI, thúc đẩy tính xác thực và niềm tin. Khi những công cụ này phát triển, trọng tâm sẽ là mở rộng quyền truy cập toàn cầu, tinh chỉnh độ chính xác và khám phá các khả năng mới như hoạt hình 3D hoặc hợp tác thời gian thực. Tầm nhìn của Neal Mohan ám chỉ một tương lai nơi AI không chỉ hỗ trợ người sáng tạo mà còn truyền cảm hứng cho hoàn toàn các thể loại nội dung mới, củng cố vai trò của YouTube với tư cách là sân chơi sáng tạo tối thượng.