نیل موهان، در اولین سخنرانی مهم خود به عنوان رهبر جدید یوتیوب، تنها به بهروزرسانیهای جزئی اشاره نکرد؛ او چشماندازی گسترده برای هوش مصنوعی مولد ارائه داد که قول میدهد تولید محتوا در این پلتفرم را بازتعریف کند. این اعلام نشاندهنده یک تغییر استراتژیک به سمت در دسترس قرار دادن ابزارهای پیشرفته هوش مصنوعی برای میلیونها نفر است و یوتیوب را از یک سرویس میزبانی منفعل به یک شریک خلاقانه فعال تبدیل میکند. اشاره واضح بود: یوتیوب به شدت روی هوش مصنوعی سرمایهگذاری میکند تا موانع را برای سازندگان محتوا کاهش دهد و عصر جدیدی از نوآوری را پرورش دهد که در آن هر کسی میتواند با حداقل تلاش ویدیوهایی با کیفیت حرفهای تولید کند.
پیامدهای این امر عمیق است، زیرا این ابزارها طوری طراحی شدهاند که بهطور یکپارچه در گردش کار موجود سازنده، از ایدهپردازی تا انتشار، ادغام شوند. یوتیوب با بهرهگیری از مشارکت با گوگل دیپمایند و سایر تیمهای داخلی، آماده است تا ویژگیهایی را راهاندازی کند که نه تنها خلاقیت را افزایش میدهند، بلکه فرآیند تولید را نیز سادهسازی میکنند. این حرکت با روندهای گستردهتر صنعت همسو است، اما به دلیل پایگاه کاربری عظیم یوتیوب و ادغام مستقیم آن در بزرگترین پلتفرم ویدیویی جهان، برجسته میشود.
در خط مقدم تلاش هوش مصنوعی یوتیوب، ویو ۳ فست قرار دارد، یک مدل تولید ویدیوی سفارشی که با همکاری گوگل دیپمایند توسعه یافته است. این ابزار به طور خاص برای یوتیوب شورتها بهینهسازی شده و تولید رایگان با تأخیر کم در کیفیت ۴۸۰p همراه با صدا را ارائه میدهد – و همه اینها از یک دستگاه موبایل. سازندگان محتوا میتوانند دکمه ایجاد را لمس کنند و به یک آیکون درخشش دسترسی پیدا کنند تا کلیپهای ویدیویی را از متن ساده تولید کنند و ایدههای انتزاعی را در چند ثانیه به محتوای بصری تبدیل کنند. راهاندازی این ابزار از قبل در بازارهای کلیدی مانند ایالات متحده و بریتانیا آغاز شده و برنامههایی برای گسترش جهانی آن وجود دارد.
برخلاف برنامههای مستقل ویدیوی هوش مصنوعی، ویو ۳ مستقیماً در اکوسیستم یوتیوب ساخته شده است و امکان آزمایش در زمان واقعی بدون تغییر پلتفرم را فراهم میکند. این ابزار از همان ابتدا از تولید صدا پشتیبانی میکند – که اولین بار برای چنین ابزارهایی است – و به سازندگان امکان میدهد شورتهای کاملی با نشانههای صوتی که با روایت بصری مطابقت دارند، تولید کنند. آزمایشهای اولیه کاهش قابل توجهی در زمان تولید را نشان میدهند، زیرا کاربران میتوانند به سرعت بر روی مفاهیم، از اسکیتهای کمدی تا قطعات آموزشی، تکرار کنند بدون اینکه به مهارتهای ویرایش گسترده نیاز داشته باشند.
برای بسیاری از سازندگان، جدول زمانی خالی ترسناکترین بخش ساخت ویدیو است. ویژگی ویرایش با هوش مصنوعی یوتیوب با تبدیل هوشمندانه فیلمهای خام دوربین به یک پیشنویس اولیه جذاب، این مشکل را برطرف میکند. این ابزار با استفاده از الگوریتمهای پیشرفته، بهترین لحظات را شناسایی میکند، آنها را به صورت منسجم مرتب میکند و موسیقی، انتقالها و حتی روایتهای صوتی بازیگوشانه را به زبانهایی مانند انگلیسی یا هندی اضافه میکند. این امر به سازندگان یک نقطه شروع محکم میدهد و به آنها اجازه میدهد به جای ویرایش اولیه خستهکننده، بر شخصیسازی تمرکز کنند.
ویرایش با هوش مصنوعی که در حال حاضر در شورتها و برنامه یوتیوب کریت در حال آزمایش است، به زودی در بازارهای منتخب گسترش خواهد یافت. این ابزار با انجام کار سنگین انتخاب کلیپ و ویرایش اولیه، تولید ویدیو را دموکراتیک میکند و آن را برای مبتدیان قابل دسترس میسازد و در عین حال برای حرفهایهای باتجربه زمان صرفهجویی میکند. این یک گام واضح به سمت هوش مصنوعی به عنوان یک شریک مشارکتی در فرآیند خلاق است.
تصور کنید یک خط گفتگوی جذاب در یک ویدیو را میشنوید و بلافاصله آن را برای شورت بعدی خود به یک موسیقی متن تبدیل میکنید. ابزار گفتار به آهنگ یوتیوب با بهرهگیری از لیریا ۲، مدل پیشرفته موسیقی هوش مصنوعی گوگل دیپمایند، این امر را ممکن میسازد. این ابزار به سازندگان امکان میدهد گفتگوی واجد شرایط را از ویدیوها بگیرند و آن را به آهنگهایی با حالوهوهای قابل تنظیم – مانند آرام، قابل رقص یا سرگرمکننده – تبدیل کنند، در حالی که سازنده اصلی نیز معرفی میشود. این ویژگی نه تنها اشکال جدیدی از خلاقیت صوتی را برمیانگیزد، بلکه از طریق فرهنگ بازآفرینی، تعامل جامعه را نیز تشویق میکند.
گفتار به آهنگ از واترمارکهای SynthID و برچسبهای محتوا برای نشان دادن محتوای تولید شده توسط هوش مصنوعی استفاده میکند و شفافیت را تضمین میکند. این ابزار با ادغام مستقیم در یوتیوب، فرآیند بازآفرینی را ساده میکند و نیاز به نرمافزارهای خارجی را از بین میبرد. سازندگان میتوانند به روشهایی که قبلاً مختص موسیقیدانان بود، با صدا آزمایش کنند و راههایی برای روندهای ویروسی و قالبهای محتوای منحصر به فرد که روایت را با ملودی ترکیب میکنند، باز کنند.
فراتر از ابزارهای تولید، یوتیوب در حال استقرار هوش مصنوعی برای غنیسازی تجربه بیننده است. ابزار هوش مصنوعی گفتگو محور، که برای کاربران بالای ۱۸ سال در ویدیوهای منتخب انگلیسی در دسترس است، به بینندگان اجازه میدهد بدون ترک ویدیو، در مورد محتوا سؤال بپرسند یا درخواست توصیههای مرتبط کنند. این ویژگی که توسط مدلهای زبانی بزرگ (LLM) قدرت میگیرد، فرصتهای یادگیری تعاملی را فراهم میکند، به ویژه در ویدیوهای آکادمیک که میتواند کاربران را امتحان کند و مفاهیم کلیدی را توضیح دهد.
این ابزار با برنامههای مستقل مانند جمینی متفاوت است زیرا مختص محتوای یوتیوب است. این ابزار به بینندگان کمک میکند تا عمیقتر در موضوعات، از آموزشها تا مستندها، غوطهور شوند و مخاطبی مشارکتجوتر و آگاهتر پرورش دهند. با گسترش آن، انتظار میرود حفظ مخاطب و رضایت بهبود یابد زیرا کاربران در زمان واقعی با ویدیوها تعامل میکنند.
ابتکارات هوش مصنوعی یوتیوب فراتر از ویژگیهای اعلام شده گسترش مییابد. بینشهای حاصل از آموزشهای شخص ثالث، ابزارهایی مانند هایلایتهای پشتیبانی شده از هوش مصنوعی برای پخش زنده، تبدیل خودکار پادکست به شورت و دوبله برای دسترسی چندزبانه را برجسته میکنند. این ادغامها، که اغلب در بهروزرسانیهای پلتفرم پنهان هستند، تعهد یوتیوب را برای تبدیل اکوسیستم خود به یک محیط بومی هوش مصنوعی نشان میدهند. سازندگان میتوانند از این ابزارها برای طوفان فکری با جمینی، تولید تصاویر کوچک یا بهینهسازی سئو، همه درون داشبورد یوتیوب، استفاده کنند.
با قدرت بزرگ، مسئولیت نیز همراه است. یوتیوب با استفاده از واترمارکهای SynthID برای برچسبگذاری محتوای تولید شده توسط هوش مصنوعی، در حال رسیدگی به نگرانیهای اخلاقی است و اصالت و اعتماد را ترویج میدهد. با تکامل این ابزارها، تمرکز بر گسترش دسترسی جهانی، بهبود دقت و کشف قابلیتهای جدید مانند انیمیشن سهبعدی یا همکاری در زمان واقعی خواهد بود. چشمانداز نیل موهان به آیندهای اشاره دارد که در آن هوش مصنوعی نه تنها به سازندگان کمک میکند، بلکه ژانرهای محتوای کاملاً جدیدی را نیز الهام میبخشد و نقش یوتیوب را به عنوان نهاییترین زمین بازی خلاق تثبیت میکند.