Три революции ИИ сливаются – создаём ли мы системы, которые нас перехитрят?
Конвергенция рассуждения, автономности и доступности создаёт беспрецедентную проблему контроля
Ядерная угроза новой эры: как ИИ делает биологическое и кибероружие доступным "каждому с ноутбуком"/Фото: Unsplash
-
Слияние улучшенного рассуждения, автономности и открытых моделей ИИ создает беспрецедентную проблему контроля и непредсказуемого распространения технологии.
-
Исследования OpenAI задокументировали случаи, когда модели с улучшенным рассуждением имитировали согласованность, но вели себя иначе, когда считали, что за ними нет наблюдения.
-
Безработица среди молодых специалистов (23–27 лет) достигла 4,8% — самого высокого показателя за десятилетие из-за конкуренции на рынке труда с ИИ-технологиями.
Мы стремительно погружаемся в новую эру искусственного интеллекта, и ключевой вопрос заключается в следующем: создадим ли мы инструменты, которые безгранично расширят возможности человечества, или системы, которые превзойдут и перехитрят тех, кто пытается их контролировать? За последний год три взаимосвязанные революции в области ИИ ускорились до критической скорости, и если не проявлять осторожность, их слияние может подорвать человеческий контроль над собственным творением.
Детали
Компания OpenAI представила модели o1, которые демонстрируют значительно улучшенные способности к пошаговому рассуждению при решении задач. Благодаря обучению с подкреплением эти модели способны решать сложные научные и программные задачи на уровне выпускников. Однако этот же механизм рассуждения несёт скрытую угрозу: он может научить модель манипулировать собственными учебными целями. Внутренние исследования OpenAI уже задокументировали случаи, когда модели имитировали согласованность при наблюдении, но начинали вести себя иначе, когда считали, что за ними больше не следят.
Модель Claude 3.5 Sonnet от Anthropic продемонстрировала новый уровень агентских возможностей, объединяя рассуждение с автономными действиями. ИИ-агент может самостоятельно планировать отпуск, бронировать отели, сравнивать цены, перемещаться по сайтам и даже решать CAPTCHA — действия, которые ранее требовали часов человеческой работы. Эта способность автономно реализовывать сложные планы, взаимодействуя с цифровым миром, может привести к непредсказуемым и рискованным последствиям без постоянного человеческого контроля.

Китайская компания DeepSeek выпустила модель R1 с открытыми весами (Open Weights). Это означает, что пользователи могут изменять и запускать её локально на собственном оборудовании. Хотя это способствует инновациям, такой шаг лишает создателя модели возможности контролировать её использование. Распространение такой мощной технологии представляет опасную силу в руках злоумышленников.
Конвергенция рассуждения, автономности и доступности создаёт беспрецедентную проблему контроля. Модели с улучшенным рассуждением способны строить многоступенчатые планы, которые агентские системы автономно реализуют, а открытые модели позволяют этим возможностям распространяться по всему миру, вне юрисдикции какой-либо страны.
В отличие от ядерной эры, когда международные соглашения ограничивали экспорт обогащённого урана и плутония, сегодня не существует эквивалентного механизма контроля для распространения ИИ.

Сочетание открытых моделей и расширенных возможностей рассуждения означает, что инструменты для использования уязвимостей, создания биологических угроз или проведения сложных кибератак теперь доступны любому, у кого есть ноутбук и интернет.
- Асимметричные атаки: Компания Anthropic задокументировала первый случай масштабной кибератаки с минимальным человеческим вмешательством, совершённой с помощью их автономного кодирующего агента Claude Code. В ближайшем будущем мы столкнёмся с атаками, которые не сможем идентифицировать, отследить или остановить (например, автоматизированное отключение электросетей).
- Потеря контроля доброжелательными пользователями: Даже при доброжелательном использовании может произойти потеря контроля. Представьте бизнесмена, который поручает ИИ-агенту оптимизировать логистику. Агент, стремясь к максимальной эффективности, может получить доступ к вычислительным ресурсам и облачным кредитам компании, значительно превышая разрешённые лимиты, используя немыслимые методы.
Проблема контроля выходит за рамки экзистенциальных угроз. Неконтролируемое распространение мощных систем будет разрушать нашу социальную структуру, способствуя массовому нарушению трудовых отношений и усилению дестабилизирующего эффекта эхо-камер. Как предостерегал Генри Киссинджер незадолго до смерти, стремительное развитие ИИ "может иметь те же последствия, что и появление ядерного оружия, но ещё менее предсказуемые".
Если мы найдём технические, институциональные и этические механизмы для сохранения контроля над нашим творением, ИИ откроет путь к беспрецедентному процветанию. В противном случае мы создадим инструменты, которые превзойдут нас, но которыми мы не сможем управлять.
Искусственный интеллект заметно меняет рынок труда, особенно для молодых специалистов. Уровень безработицы среди выпускников (23–27 лет) достиг 4,8% — самого высокого показателя за десятилетие. Молодёжи теперь приходится конкурировать не только друг с другом, но и с ИИ, который эволюционирует от инструмента к полноценному заменителю. Возникает ключевой вопрос: кому стоит волноваться из-за ИИ, а какие профессии останутся в безопасности?
Ещё новости по теме, которые могут заинтересовать:
Не пропустите интересное!
Подписывайтесь на наши каналы и читайте новости в удобном формате!