تا به حال، احتمالاً در مورد نتایج شگفتانگیز عملکرد هوش مصنوعی متن به تصویر مانند Dall-E، Stable Diffusion و Midjourney شنیدهاید. همانطور که انتظار می رفت، انقلاب هوش مصنوعی در حال انجام است و هدف بعدی این فناوری تبدیل متن به ویدئو است.
گوگل و متا در حال حاضر قابلیت های خود را در قالب سیستم های مبتنی بر هوش مصنوعی برای تبدیل متن به ویدئو به نمایش گذاشته اند، اما این فناوری پیشرفته هنوز در دسترس عموم قرار نگرفته است. علاوه بر این، قبلاً نمونههای دیگری را دیدهایم که فرآیند ویرایش ویدیو را نیز انجام میدهند. اگر مشتاقانه منتظر ساختن ویدیو با دادن چند دستور ساده به هوش مصنوعی بودید، اکنون به لطف QuickVid می توانید.
البته قبل از اینکه خیلی هیجان زده شوید و انتظارات خود را بالا ببرید، باید توجه داشته باشید که عملکرد QuickVid معادل تولید هزاران عکس مانند سیستم Stable Diffusion و مونتاژ آنها برای ایجاد یک ویدیو نیست. تکنیک هوش مصنوعی QuickVid در واقع راه حلی برای ورود به رقابت سیستم های هوش مصنوعی برای تبدیل متن به ویدئو است.
به گفته DigitalTrends، اولین گام در فرآیند هوش مصنوعی، تولید یک اسکریپت بر اساس درخواست شما است. برای مثال، ویدیوی زیر با هوش مصنوعی QuickVid با موضوع یادگیری ماشینی تولید شده است.
هوش مصنوعی یک روایت کامل از دستور فوق (Machine Learning) ایجاد می کند و سپس گفتار را با انتخاب صدای مرد یا زن ترکیب می کند. فیلم پس زمینه کلیپ نیز از نمونه های موجود انتخاب شده است.
به عنوان آخرین دستکاری مشکوک، QuickVid اسکریپت را به عنوان عنوان روی ویدیو قرار می دهد و تصاویر کوچک تولید شده با Dall-e AI API را اضافه می کند. نتیجه یک ویدیو کوتاه است که می توانید در بالا تماشا کنید.
توسعهدهنده QuickVid در مصاحبهای اخیر اعلام کرد که بهبودهایی در این سیستم هوش مصنوعی انجام خواهد شد و در ژانویه گزینههای بیشتری برای شخصیسازی ویدیوها در دسترس خواهد بود. این ابزار در نهایت از توضیحات و آواتارها پشتیبانی می کند.
سال آینده احتمالا شاهد راه حل های جدیدی مبتنی بر هوش مصنوعی برای تبدیل متن به ویدیو خواهیم بود. این فناوری در کنار عینک های واقعیت افزوده و هدست های واقعیت مجازی حتی می تواند مرزهای پیشرفت را فراتر از تصورات کنونی ما ببرد و مطمئنا برای علاقه مندان به فناوری بسیار جذاب و غافلگیرکننده خواهد بود.