Психологи шокированы: ChatGPT обошёл людей в тестах на эмоциональный интеллект
При этом вопрос эмоционального интеллекта на самом деле глубже, чем могут показать тесты

Психологи шокированы: ChatGPT обошёл людей в тестах на эмоциональный интеллект/Фото: Erhan Astam/Unsplash
Новое исследование учёных демонстрирует, что искусственный интеллект понимает человеческие эмоции лучше, чем сами люди. Типичные модели генеративного ИИ набрали значительно больше баллов в тестах на эмоциональный интеллект.
Детали
Учёные из Женевского университета (UNIGE) и Бернского университета (UniBE) применили широко используемые тесты эмоционального интеллекта (ЭИ) к распространённым большим языковым моделям (LLM), включая ChatGPT-4, ChatGPT-o1, Gemini 1.5 Flash, Claude 3.5 Haiku, Copilot 365 и DeepSeek V3.
Они исследовали две вещи: во-первых, сравнили производительность искусственного интеллекта и людей, а во-вторых — способность создавать новые тестовые вопросы, соответствующие целям ЭИ-тестов.
LLM выбирали “правильный” ответ в тестах на эмоциональный интеллект в 81% случаев по сравнению с 56% у людей.
Когда ChatGPT попросили создать новые тестовые вопросы, люди-оценщики сказали, что эти попытки выдержали оригинальные тесты с точки зрения эквивалентной сложности и устранения впечатления, что они не просто перефразировали исходные вопросы. Корреляция между тестами, созданными искусственным интеллектом, и оригинальными тестами была названа “сильной” с коэффициентом корреляции 0,46 (где 1,0 означает идеальную корреляцию, а 0 — отсутствие корреляции).
Общий вывод заключался в том, что ИИ лучше “понимает” эмоции, чем мы.
При этом эксперты, не принимавшие участия в исследовании, отмечают, что каждый из обычных ЭИ-тестов использовался с несколькими вариантами ответов — это вряд ли применимо к реальным жизненным ситуациям, когда напряжённость между людьми высока. Эксперты подчёркивают, что даже психологи могут по-разному интерпретировать эмоциональные сигналы, поэтому "победа" над человеком в таком тесте не обязательно означает, что ИИ обладает более глубоким пониманием. Это всего лишь говорит о том, что он давал статистически ожидаемый ответ чаще.
Некоторые даже усомнились, можно ли считать результаты ИИ проявлением эмоционального интеллекта. Приравнивание распознавания эмоциональных сигналов, в чём ИИ хорошо себя зарекомендовал, к более глубокому пониманию человеческих эмоций может быть преувеличением возможностей ИИ.
Некоторые сравнивают результаты ИИ с ответами на викторине. То, что вы правильно ответили на вопрос из медицинской сферы — не делает вас терапевтом.
Тем не менее сотрудник HAL-AI Маркос Алвес, являющийся одним из разработчиков Aílton — разговорного искусственного интеллекта, которым пользуются более 6000 водителей грузовиков в Бразилии, отмечает, что их ИИ определяет стресс, злость или грусть с точностью примерно в 80% — примерно на 20 пунктов выше, чем у людей, и всё это в контексте эмоциональных ситуаций, в которых водители взаимодействуют с ним в режиме реального времени.
В одном случае Aílton быстро и надлежащим образом отреагировал, когда водитель отправил растерянное 15-секундное голосовое сообщение после смертельной аварии коллеги, ответив тонкими нотами сочувствия, предложив ресурсы для психического здоровья и автоматически предупредив менеджеров автопарка.
По мнению Алвеса, способность LLM поглощать миллиарды предложений и тысячи часов разговорного аудио означает, что она способна кодировать микроинтонационные сигналы, которые люди часто упускают.
Ранее Apple Research провела интересное исследование и планирует выпустить наушники AirPods, которые при помощи искусственного интеллекта смогут контролировать сердцебиение человека и оценивать состояние здоровья.
Не пропустите интересное!
Подписывайтесь на наши каналы и читайте новости в удобном формате!