ua ru
Пожалуйста, заполните это поле
1

Искусственный интеллект против врачей: пациенты считают чат-ботов более эмпатичными

Технологии

Широкий метаанализ показал, что пациенты оценивают чат-ботов с искусственным интеллектом как более тёплых и эмпатичных, чем реальных медиков

Искусственный интеллект против врачей: пациенты считают чат-ботов более эмпатичными

Искусственный интеллект против врачей: пациенты считают чат-ботов более эмпатичными/unsplash

В крупнейшем массиве данных из 2164 реальных взаимодействий с пациентами, а также в нескольких меньших исследованиях такие инструменты, как ChatGPT, опередили врачей и медсестёр примерно на два балла по 10-балльной шкале эмпатии. ИИ имел 73% шанс быть признанным более эмпатичным в сравнении.

Детали

«В сценариях, где используется только текст, чат-боты с искусственным интеллектом часто воспринимаются как более эмпатичные, чем люди, связанные со здравоохранением», – отметили исследователи.

Работа, которую возглавляют команды из университетов Ноттингема и Лестера, опровергает уверенное утверждение правительства Великобритании 2019 года о том, что эмпатия — это важный человеческий навык, который искусственный интеллект не может воспроизвести. По крайней мере, в тексте ИИ это, кажется, может.

При лечении определённых заболеваний пациенты отметили ИИ:

  • В девяти отдельных исследованиях, охватывающих лечение рака, заболевания щитовидной железы, психическое здоровье, аутизм и общие медицинские вопросы, ChatGPT-4 регулярно превосходил лицензированных клиницистов.
  • В вопросах, касающихся операций на щитовидной железе, рейтинг эмпатии ИИ был на 1,42 стандартного отклонения выше, чем у хирургов-людей. В вопросах психического здоровья — на 0,97 стандартного отклонения выше, чем у квалифицированных специалистов.
  • Во время реагирования на жалобы пациентов, поступающие через больничные отделения, разрыв резко увеличивался: 2,08 стандартного отклонения в пользу искусственного интеллекта по сравнению с персоналом отделов по работе с пациентами. Наиболее важно, что это был не только эффект, свойственный пациенту.
  • В исследовании больных волчанкой сами врачи оценивали тон искусственного интеллекта как более эмпатичный, чем ответы их коллег на те же вопросы.
  • В случае рассеянного склероза подготовленные представители пациентов, использовавшие валидированный инструмент эмпатии, также отдавали предпочтение искусственному интеллекту по сравнению с неврологами.
  • Дерматология оказалась исключением. В двух исследованиях, посвящённых кожным жалобам, дерматологи превзошли ChatGPT-3.5 и Med-PaLM 2 по показателю эмпатии. Исследователи не смогли точно определить, почему именно эта специализация противоречит общей тенденции, однако это полезное напоминание о том, что эффект не является универсальным.

В каждом исследовании в обзоре оценивалось исключительно текстовое взаимодействие. Даже когда одна из групп генерировала аудио на основе текста, созданного искусственным интеллектом, экспертам предоставляли для оценки письменную расшифровку, а не голос. В реальных клиниках кивок врача, зрительный контакт или пауза могут передавать заботу не менее мощно, чем слова. Следовательно, эти результаты говорят скорее о письменных манерах общения с пациентом, а не о полной картине человеческого присутствия.

Большинство исследований также опирались на посредников-экспертов — врачей, студентов-медиков или представителей пациентов, а не на самих пациентов, которые в итоге следовали совету. И хотя многие использовали шкалы эмпатии от 1 до 5 или от 1 до 10, только одно из исследований применяло валидированный инструмент CARE, разработанный специально для оценки терапевтической эмпатии. Таким образом, эксперты измеряли воспринятую эмпатию, а не клинический эффект.

Авторы чётко высказываются по этому вопросу. Эмпатичное формулирование коррелирует с меньшей болью и тревогой, лучшим соблюдением рекомендаций и большей удовлетворённостью. Однако данный обзор не проверял, улучшает ли «преимущество эмпатии» ИИ конечные результаты. Он лишь показывает, что читатели предпочитают его тональность.

Часть преимущества искусственного интеллекта заключается в структурности. Большие языковые модели обучаются на огромном массиве человеческих диалогов и могут по умолчанию использовать ориентированные на пациента формулировки: подтверждать чувства, подытоживать опасения и предлагать чёткие дальнейшие шаги.

Они не спешат, не испытывают усталости и не занимают оборонительную позицию, а могут последовательно применять лучшие методы формулировки. Между тем медики, отвечающие на сообщения в электронной почте, сталкиваются с давлением времени, судебно-медицинской осторожностью и запутанным контекстом истории болезни.

Учитывая это, эмпатичное высказывание мало что значит, если факты ошибочны. Галлюцинации, упущения или устаревшие рекомендации могут разрушить любое доверие. Метаанализ рассматривает рейтинги эмпатии и точность как отдельные вопросы. Оба имеют значение.

Вместо замены медиков авторы выступают за совместный рабочий процесс: врачи пишут основные медицинские рекомендации, а искусственный интеллект уточняет тон, добавляет чёткие и обоснованные формулировки и предвосхищает распространённые опасения. Затем медицинские работники просматривают эти материалы и отправляют их пациенту. Это может снизить нагрузку на электронную почту, уменьшить число коротких, портящих отношения ответов и повысить удовлетворённость пациентов без ущерба для точности.

Такие подходы уже входят в ежедневную практику. Около 20% семейных врачей Великобритании сообщают об использовании генеративного искусственного интеллекта для таких задач, как письма пациентам, а службы психического здоровья Национальной службы здравоохранения (NHS) внедрили компаньонов на базе искусственного интеллекта (только Wysa сообщает о взаимодействии с более чем 117 000 пациентов).

Голос — следующий рубеж: телефонные консультации составляют 26% встреч с семейными врачами в Великобритании, а искусственный интеллект с голосовой поддержкой обещает фиксировать эмоциональные нюансы.

Однако обзор отмечает пробел — исследований голосового общения лицом к лицу пока не проводилось. Если преимущество ИИ в эмпатии сохранится при переходе от текста к речи, последствия для линий сортировки и виртуального наблюдения могут быть огромными.

Исследователи взяли работы из семи баз данных (по состоянию на ноябрь 2024 года), включая электронные письма реальных пациентов, публикации на Reddit, расшифровки чатов клиник и личные контакты на ресепшне. Четырнадцать исследований тестировали варианты ChatGPT (3.5 или 4), другие включали Claude, Gemini Pro, Le Chat, ERNIE Bot и Med-PaLM2.

Риск предвзятости был умеренным в девяти исследованиях и серьёзным — в шести, с такими распространёнными проблемами, как отобранные наборы вопросов и контролируемые ответы ИИ. Тем не менее, закономерность — ИИ оценивался как более тёплый, понятный и валидный — наблюдалась в разных учреждениях, специальностях и типах экспертов. В интернете слова могут многое. В этом узком, но растущем сегменте медицины — сообщения в порталах, последующие письма, разъяснения распространённых вопросов — ИИ уже пишет так, как хотели бы многие пациенты от всех клиницистов: медленнее, мягче, более открыто к эмоциям и дальнейшим шагам.

Возможность заключается не в том, чтобы выбрать ИИ вместо клиницистов, а в том, чтобы позволить ему учить нас письменному стилю общения, пока клиницисты сохраняют право на суждение, нюансы и истину.

Задача сейчас — привнести это тепло в заботу, не потеряв того, что могут делать только люди, и одновременно выяснить, приводят ли добрые слова — независимо от источника — к более здоровой жизни.

Ранее мы рассказывали, OpenAI сделал ChatGPT снова "разговорчивым": что за новым, дружелюбным тоном? Компания оказалась в центре скандала после того, как в начале 2025 года ИИ обвинили в льстивом подходе к пользователям. Поэтому было решено учесть ошибки и сделать его тон более объективным.

Вас может заинтересовать:

Источник: earth

Не пропустите интересное!

Подписывайтесь на наши каналы и читайте новости в удобном формате!

Главное за сегодня
Больше новостей