Компанијата „Опен АИ“ претстави нов модел наречен „Сора“ кој може да ги претвори текстуалните инструкции во видео. Моделот „текст во видео“ им овозможува на корисниците да креираат фотореалистични клипови во должина до една минута врз основа на напишаното“, пренесува Guardian.

„Сора“, наречена според јапонскиот збор за – небо, може да создаде комплексни сцени со повеќе ликови, специфични видови движења и прецизни детали за темата и заднината, велат од компанијата. Исто така, се наведува дека моделот може да разбере како предметите постојат во физичкиот свет и прецизно да ги толкува реквизитите и да создава убедливи ликови кои изразуваат живи емоции.

Моделот може да креира видео засновано на неподвижна слика и да ги пополни кадрите што недостигаат на постојното видео, или да го прошири. Демонстративните видеа вклучуваат поглед кон Калифорнија од воздух, за време на „златната треска“, видео што изгледа како да е снимено од внатрешноста на воз во Токио. Сепак, многу од нив содржат одредени знаци кои покажуваат дека се работи за технологија со вештачка интелигенција, како што е „сомнителното“ движење на подот на музејската снимка. Компанијата вели дека моделот може да се мачи прецизно да симулира физика на сложена сцена, но резултатите се генерално доста импресивни.