استارتاپ هوش مصنوعی Runway جدیدترین مدل ویدیویی خود، Gen-4، را معرفی کرد. این مدل میتواند صحنهها و کاراکترها را در چندین نما بهطور یکپارچه حفظ کند، مشکلی که در بسیاری از ویدیوهای تولیدشده با هوش مصنوعی دیده میشود. Runway ادعا میکند که Gen-4 کنترل بیشتری به کاربران میدهد تا داستانهای بصری پیوستهتری ایجاد کنند.
طبق گزارش «TheVerge»، مدل Gen-4 که اکنون برای کاربران پولی و سازمانی در دسترس است، به کاربران اجازه میدهد تنها با ارائه یک تصویر مرجع، شخصیتها و اشیا را در نماهای مختلف ثابت نگه دارند. سپس، کاربران میتوانند توصیف موردنظر خود را وارد کنند و مدل با حفظ انسجام، خروجیهایی از زوایای مختلف تولید خواهد کرد.
بهعنوان نمونه، این شرکت ویدیویی منتشر کرده است که در آن تصویر یک زن در صحنههای متفاوت و شرایط نوری گوناگون بدون تغییر باقی میماند. این ویژگی میتواند برای فیلمسازان، تولیدکنندگان محتوا و بازاریابان دیجیتال کاربردهای فراوانی داشته باشد.
این رونمایی کمتر از یک سال پس از معرفی Gen-3 Alpha انجام شده است. مدل قبلی امکان تولید ویدیوهای طولانیتر را فراهم کرد اما با جنجالهایی همراه شد، زیرا گفته میشد برای آموزش آن از ویدیوهای یوتوب و فیلمهای دارای کپیرایت استفاده شده است. مدل جدید هوش مصنوعی Gen-4 با تمرکز بر رفع مشکل تغییرات ناگهانی در تصاویر تولیدشده، به کاربران امکان میدهد صحنههای ثابت و کاراکترهای بدون تغییر داشته باشند.
Gen-4 از تکنیکهای پیشرفته یادگیری عمیق برای بهبود انسجام بصری و کنترل بیشتر کاربران بر فرآیند تولید ویدیوها استفاده میکند. این مدل فعلاً در اختیار کاربران پولی Runway قرار گرفته است.