OpenAI представила Sora 2 – нову версію ІІ для генерації відео та аудіо

Модель справляється з фізикою рухів набагато краще за попередницю.

OpenAI разом із соцмережею у стилі TikTok показала Sora 2 – оновлену модель для генерації відео та аудіо, яка вміє створювати фотореалістичні сцени та синтезувати мову. Головна новинка – функція Cameo, що дозволяє додавати у ролики самого себе чи інших людей. Для цього потрібно один раз записати відео та аудіо, щоб підтвердити особу.

За словами розробників, Sora 2 працює з фізикою рухів краще за попередницю. Якщо перша версія плуталася у простих речах на кшталт удару баскетбольного м'яча об щит, то нова модель це дається без проблем. У прикладах OpenAI показала гімнастичні та скейтбордистські трюки, а також бойові мистецтва – хоча місцями алгоритм все ще помиляється, зокрема, зі складними предметами. Також модель навчилася генерувати мову — у тому числі російською.

За словами перших користувачів, Sora 2 відмінно справляється з анімацією мемів, перетворенням будь-яких роликів на стильні аніме-сцени, таймлапсами та вставкою персонажів мультфільмів у фільми. Для роликів можна вибирати горизонтальний або вертикальний формат, а їхня тривалість обмежена 10 секундами.

Деякі запити система блокує: так, не можна згенерувати відео зі Шреком або штурмовиком із «Зоряних воєн». При цьому нейромережа без проблем дає використовувати образ Пікачу.

Sora 2 вже доступна в програмі Sora на iOS, але поки що тільки на запрошення.

No votes yet.

Please wait...