ua ru
Будь ласка, заповніть це поле
1

Психологи шоковані: ChatGPT обійшов людей у тестах на емоційний інтелект

Наука 17:28 - 23 червня 2025

При цьому питання емоційного інтелекту насправді глибше, ніж можуть показати тести

Психологи шоковані: ChatGPT обійшов людей у тестах на емоційний інтелект

Психологи шоковані: ChatGPT обійшов людей у тестах на емоційний інтелект/Фото: Erhan Astam/Unsplash

Нове дослідження вчених демонструє, що штучний інтелект розуміє людські емоції краще, ніж самі люди. Типові моделі генеративних ШІ набрали значно більше балів у тестах на емоційний інтелект.

Деталі

Вчені з Університету Женеви (UNIGE) і Університету Берна (UniBE) застосували широко використовувані тести емоційного інтелекту (EI) до загальних великих мовних моделей (LLM), включаючи ChatGPT-4, ChatGPT-o1, Gemini 1.5 Flash, Claude 3.5 Haiku, Copilot 365 і DeepSeek V3.

Вони досліджували дві речі: по-перше, порівняли продуктивність штучного інтелекту та людей, а по-друге, здатність створювати нові тестові запитання, які відповідають цілям тестів EI.

LLMs вибирали “правильну” відповідь у тестах емоційного інтелекту в 81% випадків у порівнянні з 56% для людей.

Коли ChatGPT попросили створити нові тестові запитання, люди-оцінювачі сказали, що ці зусилля витримали оригінальні тести з погляду еквівалентної складності та усунення сприйняття, що вони не перефразували оригінальні запитання. Кореляція між тестами, створеними штучним інтелектом, і оригінальними тестами була описана як “сильна” з коефіцієнтом кореляції 0,46 (де 1,0 означає ідеальну кореляцію, а 0 — відсутність кореляції).

Загальний висновок полягав у тому, що ШІ краще “розуміє” емоції, ніж ми.

При цьому експерти, які не брали участі у дослідженні, зазначають, що кожен зі звичайних тестів EI використовувався з декількома варіантами — це навряд чи можна застосувати до сценаріїв реального світу, коли напруга між людьми висока. Експерти підкреслюють, що навіть психологи можуть по-різному інтерпретувати емоційні сигнали, тому "перемога" над людиною в такому тесті не обов'язково означає, що ШІ має глибше розуміння. Це означає, що він давав статистично очікувану відповідь частіше.

Дехто навіть засумнівався, чи можна вважати результати ШІ емоційним інтелектом. Прирівнювання розпізнавання емоційних сигналів, у чому ШІ себе добре зарекомендував, до глибшого розуміння людських емоцій може бути перебільшенням здібностей ШІ.

Дехто порівнює результати ШІ з відповідями на вікторині. Те, що ви відповіли правильно на запитання з медичної сфери — не робить вас терапевтом.

Але при цьому співробітник HAL-AI Маркос Алвес, який є одним з розробників Aílton — розмовного штучного інтелекту, яким користуються понад 6000 водіїв вантажівок в Бразилії, зазначає, що їх ШІ визначає стрес, гнів або смуток з точністю приблизно на 80% – приблизно на 20 пунктів вище, ніж у людей, і все в контексті емоційних ситуацій, як водії взаємодіють з ним у режимі реального часу.

В одному випадку Aílton швидко й належним чином відреагував, коли водій надіслав збентежену 15-секундну голосову замітку після смертельної аварії колеги, відповівши тонкими співчуттями, запропонувавши ресурси для психічного здоров’я та автоматично попередивши менеджерів автопарку.

На думку Алвеса, здатність LLM поглинати мільярди речень і тисячі годин розмовного аудіо означає, що він може кодувати мікроінтонаційні сигнали, які люди часто пропускають.

Раніше Apple Research провів цікаве дослідження і планує випустити навушники AirPods, які за допомогою штучного інтелекту зможуть контролювати серцебиття людини та оцінювати стан здоров'я.

Джерело: LiveScience

Не пропустіть цікавинки!

Підписуйтесь на наші канали та читайте новини у зручному форматі!

Головне за сьогодні
Більше новин