به گزارش خبرخوان
استارتاپ Runway با تیمی متشکل از تنها ۱۰۰ نفر، از مدل ویدیویی تازه خود به نام Gen-4.5 رونمایی کرد که در بنچمارکهای گوناگون مدلهای غولهای فناوری همانند گوگل و OpenAI را پشت سر گذاشته است. این مدل تازه با فهمیدن عمیق از فیزیک و جزئیات بصری خیرهکننده ادعا میکند که مرز بین حقیقت و ویدیوهای ساختگی را کمرنگتر از همیشه کرده است.
تمرکز مهم Runway در مدل Gen-4.5، نه فقط کیفیت عکس، بلکه دقت فیزیکی بوده است. برخلاف مدلهای قبلی که اشیا در آنها شناور بودند یا حرکات غیرطبیعی داشتند، Gen-4.5 وزن، تکانه و نیرو را فهمیدن میکند.
مایعات در این مدل با فیزیک واقعی جریان مییابند و حرکت طبیعی دارند. این چنین این مدل پرامپتهای پیچیده متنی را با دقتی بیسابقه اجرا میکند و جزئیات صحنه را نادیده نمیگیرد. خروجیها نیز به قدری به حقیقت نزدیک می باشند که تشخیص آنها از فیلمبرداری واقعی دشوار است.
معارفه مدل تازه Runway Gen-4.5
نتایج بنچمارک جدا گانه Video Arena (که بر پایه رأی کاربران تنظیم میشود) شوکهکننده است. در این رتبهبندی، مدل Gen-4.5 در جایگاه اول قرار گرفته است. این درحالی است که مدل Veo 3 گوگل در رتبه دوم و مدل مشهور Sora 2 Pro از OpenAI در رتبه هفتم جای گرفتهاند.
مدیرعامل Runway میگوید: «ما با یک تیم ۱۰۰ نفره توانستیم بر شرکتهای تریلیون دلاری تسلط کنیم. این مدل که با نام رمز دیوید [اشاره به داستان داوود و جالوت] ساخته شده، مشخص می کند که تمرکز و پشتکار میتواند بر بودجههای نامحدود پیروز شود.»
با وجود پیشرفتهای عظیم، این مدل تا این مدت کامل نیست. Runway اظهار کرده که Gen-4.5 امکان پذیر در استدلال علیتها دچار اشتباه شود. برای مثال، امکان پذیر در ویدیو ببینید که یک در قبل از این که دستگیره آن چرخانده شود، باز میشود. این چنین مشکل پایداری شیء (ناپدیدشدن یا تحول شکل اشیا در طول ویدیو) تا این مدت بهطور کامل از بین بردن نشده، هرچند زیاد کمتر از قبل شده است.
اراعه این مدل به طور تدریجی اغاز شده و مطابق اظهار شرکت، تا چند روز آینده در دسترس همه کاربران (از طریق پلتفرم وب و API) قرار خواهد گرفت.
دسته بندی مطالب
اخبار کسب وکار
