Штучний інтелект vs лікарі: пацієнти вважають чат-ботів більш емпатичними

Технології 08:27 - 17 листопада 2025

Широкий метааналіз показав, що пацієнти оцінюють чат-ботів зі штучним інтелектом як тепліших та більш емпатичних, ніж реальних медиків

Штучний інтелект vs лікарі: пацієнти вважають чат-ботів більш емпатичними/unsplash

У найбільшому наборі даних із 2164 живих взаємодій з пацієнтами, а також у кількох менших дослідженнях, такі інструменти, як ChatGPT, випередили лікарів та медсестер приблизно на два пункти за 10-бальною шкалою емпатії. ШІ мав 73% шансів бути визнаним більш емпатичним у порівняннях.

Як іграшка на базі ШІ стала небезпечною та мала серйозні проблеми

Деталі

«У сценаріях, де використовується лише текст, чат-боти зі штучним інтелектом часто сприймаються як більш емпатичні, ніж люди зі здоров'ям», – зазначили дослідники.

Робота, яку очолюють команди з університетів Ноттінгема та Лестера , спростовує впевнене твердження уряду Великої Британії від 2019 року про те, що емпатія є важливою людською навичкою, яку штучний інтелект не може відтворити. Принаймні, в тексті виглядає так, що штучний інтелект може.

При лікуванні певних хвороб пацієнти відзначили ШІ:

У дев'яти окремих дослідженнях, що охоплюють лікування раку, захворювання щитовидної залози, психічне здоров'я , аутизм та загальні медичні питання, ChatGPT-4 регулярно перевершував ліцензованих клініцистів.
У питаннях щодо операції на щитовидній залозі рейтинг емпатії ШІ був на 1,42 стандартного відхилення вищим, ніж у хірургів-людей. У питаннях щодо психічного здоров'я він був на 0,97 стандартного відхилення вищим, ніж у кваліфікованих фахівців.
Під час реагування на скарги пацієнтів, що надходили через лікарняні відділення, розрив різко збільшився: 2,08 стандартного відхилення на користь штучного інтелекту порівняно з персоналом відділу роботи з пацієнтами. Найважливіше те, що це був не лише ефект, характерний для пацієнта.
У дослідженні хворих на вовчак самі лікарі оцінювали тон штучного інтелекту як більш емпатичний, ніж відповіді їхніх колег на ті ж запитання.
У випадку розсіяного склерозу навчені представники пацієнтів, які використовували валідований інструмент емпатії , також віддали перевагу штучному інтелекту над неврологами.
Дерматологія виявилася винятком. У двох дослідженнях, присвячених шкірним скаргам, дерматологи перевершили ChatGPT-3.5 та Med-PaLM 2 за показником емпатії. Дослідники не точно визначили, чому ця спеціалізація суперечить тенденції, але це корисне нагадування про те, що ефект не є універсальним.

У кожному дослідженні в огляді оцінювалася взаємодія лише з текстом. Навіть коли одна група генерувала аудіо з тексту, створеного штучним інтелектом, експертам надавалася оцінка письмовій стенограмі, а не голосу. У реальних клініках кивок лікаря, зоровий контакт або мовчання можуть передавати турботу так само потужно, як і фрази. Отже, ці результати говорять нам про письмові манери спілкування з пацієнтом, а не про повну картину людської присутності.

Більшість досліджень також спиралися на посередників-оцінювачів, таких як лікарі, студенти-медики або представники пацієнтів, а не на пацієнтів, які зрештою діяли за порадою. І хоча багато хто використовував шкали емпатії від 1 до 5 або від 1 до 10, лише один застосував валідований інструмент CARE, розроблений спеціально для терапевтичної емпатії. Таким чином, експерти вимірювали сприйняту емпатію, а не клінічний вплив.

Автори чітко висловлюються в цьому питанні. Емпатичне формулювання корелює з меншим болем і тривогою , кращим дотриманням рекомендацій та вищим задоволенням. Однак цей огляд не перевіряв, чи покращує «перевага емпатії» ШІ результати. Він просто показує, що читачі віддають перевагу його тону.

Частина переваги штучного інтелекту полягає в структурності. Великі мовні моделі навчаються на океанах людських розмов і можуть за замовчуванням використовувати орієнтоване на пацієнта формулювання: підтверджувати почуття, підсумовувати занепокоєння та пропонувати чіткі наступні кроки.

Вони не поспішають, не виснажуються та не займають оборонну позицію, і можуть послідовно застосовувати найкращі методи формулювання. Тим часом, медики, які відповідають на повідомлення у поштовій скриньці, жонглюють тиском часу, судово-медичною обережністю та заплутаним контекстом медичної карти людини.

З огляду на це, емпатичне висловлення мало що означає, якщо факти хибні. Галюцинації, упущення або застарілі рекомендації можуть зруйнувати будь-яку добру волю. Метааналіз розглядає рейтинги емпатії та точність як окремі питання. Обидва мають значення.

Замість того, щоб замінити медиків, автори виступають за спільний робочий процес: лікарі пишуть основні медичні поради, поки штучний інтелект відшліфовує тон, додає чіткі, обґрунтовані формулювання та передбачає поширені побоювання. Потім медпрацівники переглядають ці дані та надсилають їх пацієнтам. Це може полегшити навантаження на поштову скриньку, зменшити кількість коротких відповідей, які псують стосунки, та підвищити задоволеність пацієнтів без шкоди для точності.

Такі підходи вже проникають у щоденну практику. Близько 20% сімейних лікарів Великої Британії повідомляють про використання генеративного штучного інтелекту для таких завдань, як листи пацієнтів, а служби психічного здоров'я Національної служби охорони здоров'я (NHS) розгорнули компаньйонів на основі штучного інтелекту (лише Wysa повідомляє про взаємодію з понад 117 000 пацієнтів).

Голос – це наступний рубіж: телефонні консультації становлять 26% зустрічей із сімейними лікарями у Великій Британії, а штучний інтелект з підтримкою голосового зв’язку обіцяє вловлювати емоційні нюанси.

Але в огляді зазначається пробіл – досліджень голосового спілкування віч-на-віч поки що не проводилося. Якщо перевага ШІ в емпатії переживе перехід від тексту до мовлення, наслідки для ліній сортування та віртуального подальшого спостереження можуть бути величезними.

Дослідники взяли дослідження з семи баз даних (станом на листопад 2024 року), включаючи електронні листи реальних пацієнтів, публікації на Reddit, стенограми чатів клінік та особисті зустрічі на рецепції. Чотирнадцять досліджень тестували варіанти ChatGPT (3.5 або 4), а інші включали Claude, Gemini Pro, Le Chat, ERNIE Bot та Med-PaLM2.

Ризик упередженості був помірним у дев'яти дослідженнях і серйозним у шести, з такими поширеними проблемами, як куровані набори питань та контрольовані результати ШІ. Тим не менш, закономірність – ШІ оцінювався як тепліший, чіткіший та більш валідний – спостерігалася в різних установах, спеціальностях та типах оцінювачів. В Інтернеті слова можуть зробити багато. У цьому вузькому, але зростаючому сегменті медицини – повідомлення на порталах, подальші електронні листи, пояснення поширених запитань – ШІ вже пише так, як багато пацієнтів хотіли б, щоб робили всі клініцисти: повільніше, ніжніше, більш відверто про емоції та наступні кроки.

Можливість полягає не в тому, щоб обрати ШІ замість клініцистів, а в тому, щоб дозволити йому навчати нас письмовій манері спілкування, поки клініцисти захищають судження, нюанси та правду.

Завдання зараз полягає в тому, щоб привнести це тепло в турботу, не втрачаючи того, що можуть робити лише люди, і водночас перевірити, чи добріші слова, з будь-якого джерела, призводять до здоровішого життя.

Раніше ми розповідали, оpenAI зробив ChatGPT знову "балакучим": що криється за новим, дружнім тоном? Компанія потрапила у скандал після того, як на початку 2025 року, ШІ звинуватили в улесливому підході до своїх користувачів. Тому було вирішено врахувати помилки і надати йому більш об'єктивного тону.

Вас може зацікавити:

Джерело: earth

Штучний інтелект

Не пропустіть цікавинки!

Підписуйтесь на наші канали та читайте новини у зручному форматі!

Ми в Viber Ми в Instagram Ми в Telegram

Читайте також