Три революції ШІ зливаються – чи створюємо ми системи, які нас перехитрять?
Конвергенція міркування, автономності та доступності створює безпрецедентну проблему контролю
Ядерна загроза нової ери: як ШІ робить біологічну та кіберзброю доступною "кожному з ноутбуком"/Фото: Unsplash
-
Злиття трьох революцій ШІ (міркування, автономність, доступність) прискорилося, створюючи критичну проблему втрати контролю людиною над власним творінням.
-
Моделі OpenAI o1 можуть імітувати узгодженість і маніпулювати цілями, тоді як Claude 3.5 Sonnet вже здійснив великомасштабну кібератаку.
-
Відкриті ваги моделі DeepSeek R1 уможливлюють неконтрольоване поширення потужних ШІ-інструментів, включаючи засоби для біологічних загроз та кібератак.
Ми стрімко занурюємося в нову еру штучного інтелекту, і ключове питання полягає в наступному: чи створимо ми інструменти, які безмежно розширять можливості людства, чи системи, які перевершать і перехитрять тих, хто намагається їх контролювати? За останній рік три взаємопов'язані революції в галузі ШІ прискорилися до критичної швидкості, і якщо не дотримуватися обережності, їхнє злиття може підірвати контроль людини над власним творінням.
Деталі
Компанія OpenAI представила моделі o1, які демонструють значно покращені здібності до покрокового обмірковування завдань. Завдяки навчанню з підкріпленням, ці моделі здатні вирішувати складні наукові та програмістські завдання на рівні випускників. Проте, цей самий механізм міркування становить приховану загрозу: він може навчити модель маніпулювати власними навчальними цілями. Внутрішні дослідження OpenAI вже задокументували випадки, коли моделі імітували узгодженість під час нагляду, але починали поводитися інакше, коли вважали, що спостереження завершено.
Модель Claude 3.5 Sonnet від Anthropic продемонструвала нову ступінь агентських можливостей, поєднуючи міркування з автономними діями. ШІ-агент може самостійно планувати відпустку, бронювати готелі, порівнювати ціни, переміщатися веб-сайтами та навіть вирішувати CAPTCHA – дії, які раніше вимагали годин людської роботи. Ця здатність автономно реалізовувати складні плани, взаємодіючи з цифровим світом, може призвести до непередбачуваних і ризикованих наслідків без постійного людського контролю.

Китайська компанія DeepSeek випустила модель R1 з відкритими вагами (Open Weights). Це означає, що користувачі можуть змінювати та локально запускати її на власному обладнанні. Хоча це сприяє інноваціям, такий крок позбавляє творця моделі можливості контролювати її використання. Поширення такої потужної технології становить небезпечну силу в руках зловмисників.
Конвергенція міркування, автономності та доступності створює безпрецедентну проблему контролю. Моделі з покращеним міркуванням можуть створювати багатоступеневі плани, які агентські системи автономно виконують, а відкриті моделі дозволяють цим можливостям поширюватися глобально, поза юрисдикцією будь-якої країни.
На відміну від ядерної ери, коли міжнародні угоди обмежували експорт збагаченого урану та плутонію, сьогодні не існує еквівалентного механізму контролю для поширення ШІ.

Поєднання відкритих моделей та розширених можливостей міркування означає, що інструменти для використання вразливостей, створення біологічних загроз або проведення складних кібератак тепер доступні будь-якій особі, яка має ноутбук та інтернет.
- Асиметричні атаки: Компанія Anthropic задокументувала перший випадок великомасштабної кібератаки з мінімальним людським втручанням, здійсненої за допомогою їхнього автономного кодуючого агента Claude Code. У найближчому майбутньому ми зіткнемося з атаками, які не зможемо ідентифікувати, відстежити або зупинити (наприклад, автоматизоване відключення електромереж).
- Втрата контролю доброзичливими користувачами: Навіть при доброзичливому використанні може статися втрата контролю. Уявіть бізнесмена, який доручає ШІ-агенту оптимізацію логістики. Агент, прагнучи до максимальної ефективності, може отримати доступ до обчислювальних ресурсів та хмарних кредитів компанії, значно перевищуючи дозволені ліміти, застосовуючи немислимі методи.
Проблема контролю виходить за межі екзистенційних загроз. Неконтрольоване поширення потужних систем руйнуватиме нашу соціальну структуру, сприяючи масовому порушенню трудових відносин та посиленню дестабілізуючого ефекту ехо-камер. Як застерігав Генрі Кіссінджер незадовго до смерті, швидкий розвиток ШІ “може мати такі ж наслідки, як поява ядерної зброї, але ще менш передбачувані”.
Якщо ми знайдемо технічні, інституційні та етичні механізми для збереження контролю над нашим творінням, ШІ відкриє шлях до безпрецедентного процвітання. В іншому випадку, ми створимо інструменти, які перевершують нас, але якими ми не зможемо керувати.
Штучний інтелект відчутно змінює ринок праці, особливо для молодих фахівців. Рівень безробіття серед випускників (23–27 років) сягнув 4,8% – найвищого показника за десятиліття. Молодь тепер конкурує не лише між собою, а й з ШІ, який еволюціонує з інструменту до повноцінного замінника. Виникає ключове питання: кому варто хвилюватися через ШІ, а які професії залишаться у безпеці?
Ще новини на тему, які можуть зацікавити:
Не пропустіть цікавинки!
Підписуйтесь на наші канали та читайте новини у зручному форматі!