Технології, давайте повільніше: з’явилися перші відео, які ШІ створив з текстових описів
Ці відео трохи тривожать не лише своїм контентом, але й самим фактом того, що вони створені штучним інтелектом з самого лише тексту

Штучний інтелект навчився створювати відео з текстових описів/Фото: Lintao Zhang/Getty Images
Нова креативна система штучного інтелекту під назвою ModelScope навчилася створювати короткі відео з текстових описів. Перші результати надзвичайно химерні й ще далекі від прогнозованих можливостей нейромереж, але вони уже вражають й після успіхів таких текстових ШІ, як ChatGPT, хочеться попросити технології трошки сповільнитися, щоб встигнути за прогресом й осмислити зміни, не говорячи вже й про те, щоб звикнути до них.
Деталі
Modelscope, розроблений спільною командою Huggingface, є "багатоступінчастою моделлю трансформування тексту у відео", яка приймає текстові підказки англійською мовою, намагається зрозуміти, що ви сподіваєтеся побачити, а потім генерує та усуває шуми короткого відео для вас. Ви можете грати з ним онлайн через дуже простий інтерфейс. Технологія поки на ранній стадії, тому дозволяє дивуватися не тільки її здібностям, але й кожному химерному витвору "уяви" штучного інтелекту.
Здається, найпопулярнішим використанням цієї технології зараз є те, що ШІ змушують зобразити, як зірки щось їдять.
Цей генеративний штучний інтелект був навчений на великому наборі даних існуючого відео, створеного людиною, що піднімає кілька цікавих юридичних питань, коли йдеться про інтелектуальну власність, що належить великим власникам авторських прав. Засновник і генеральний директор Hyperreal Ремінгтон Скотт зазначає:
Фундаментальна проблема генеративного штучного інтелекту та діпфейків у всіх цих нових системах штучного інтелекту полягає в тому, що навчальні дані, які використовуються, не належать діпфейкам. І власники авторських прав не отримують грошей. Це фундаментальна проблема, яка стане справді великою в інтелектуальній власності. Невдовзі люди будуть навчати штучний інтелект для всіх фільмів "Аватар", а потім створюватимуть нові історії за допомогою штучного інтелекту. Так не вийде. Ми побачили, наскільки поганим був Napster для музичної індустрії; це Napster 2.0 для всієї індустрії IP.
Скотт далі прогнозує:
Ми зараз на Дикому Заході, але дивіться, як це буде відбуватися. Одна студія збирається подати на когось до суду і сказати: "Відкрийте дані навчання, подивімось, на чому ви це тренували. І якщо вони не використали матеріал цієї студії, будь-яка інша студія буде дивитися, щоб сказати: "Ага, але ви використали мій".
Бачимо, що можливості штучного інтелекту прогресують уже не роками і, здається, навіть не місяцями, а тижнями й перепоною у розвитку цих технологій, вочевидь, стануть не технічні, а юридичні обмеження.
Раніше ми повідомляли, що вперше в японському парламенті на засіданні був задіяний чатбот від OpenAI ChatGPT, який допоміг лідеру опозиції Кенту Ідзумі сформулювати запитання до прем'єр-міністра Фуміо Кісіди.
Не пропустіть цікавинки!
Підписуйтесь на наші канали та читайте новини у зручному форматі!