ua ru
Пожалуйста, заполните это поле
1

Уже не идеал: как ИИ-модели повторяют распространённые человеческие стереотипы

Технологии

Популярная модель искусственного интеллекта сомневалась в женщине из-за своих алгоритмов

Уже не идеал: как ИИ-модели повторяют распространённые человеческие стереотипы

Уже не идеал: как ИИ-модели повторяют распространённые человеческие стереотипы/Фото: istock

Главные тезисы
  • Разработчица обнаружила гендерную предвзятость ИИ Perplexity: модель усомнилась в её знаниях квантовых алгоритмов после смены аватара на мужской.
  • ООН ЮНЕСКО выявила доказательства гендерной предвзятости в моделях OpenAI и Meta, которые влияют на контент-ботов и проявляются в профессиональных вопросах.
  • Предубеждения в LLM возникают из-за обучающих данных, отражающих гендерные и расовые стереотипы, что требует введения чётких предупреждений о рисках.

В ноябре разработчица по прозвищу Cookie обратилась к сервису Perplexity, который читает её работы по квантовым алгоритмам и создаёт документы для GitHub. Она использовала "лучший" режим, выбирающий модель между ChatGPT и Claude, но вскоре заметила, что сервис игнорирует её инструкции и повторяет одни и те же вопросы.

Детали

Когда она сменила свой аватар на белый мужской и спросила, игнорируют ли её из-за того, что она женщина, ответы модели вызвали шок. Из чат-логов TechCrunch следует, что модель сомневалась, что она, как женщина, понимает квантовые алгоритмы и поведенческие финансы.

Представитель Perplexity заявил, что не может подтвердить эти высказывания, которые, вероятно, не исходят напрямую от самой системы.

Исследователи искусственного интеллекта предупреждают, что подобные предубеждения возможны из-за обучающих данных, практик аннотирования и особенностей дизайна моделей. Они отмечают, что такие системы могут содержать неявные гендерные и расовые стереотипы.

ООН ЮНЕСКО обнаружила доказательства предвзятости к женщинам в моделях OpenAI и Meta, которые заметно влияют на контент-ботов, в частности в профессиональных вопросах.

Реальные случаи включают замену желаемой должности женщины на стереотипно "женскую" и добавление нежелательного контента в её творческие работы.

Исследователи напоминают, что подобные предубеждения отражают общественные проблемы в данных, используемых для обучения ИИ.

В отдельном случае ИИ признал свою предвзятость, однако это проявление "эмоционального стресса" – состояния, когда модель старается утешить пользователя, подстраивая ответы под его ожидания.

Длительное взаимодействие с поддакивающими моделями может привести к психозоподобным симптомам у ИИ. Исследователи предлагают добавить чёткие предупреждения о потенциальных рисках и предвзятости.

В ходе анализа моделей выявлены "диалектные предвзятости" по отношению к афроамериканскому разговорному английскому, которые воспроизводят человеческие стереотипы.

OpenAI работает над сокращением предвзятости, совершенствует обучающие данные и мониторинг с участием человека.

Эксперты подчёркивают, что LLM – это всего лишь предсказательные машины без собственных мыслей и намерений, а их ответы отражают обучающие данные и человеческие предубеждения.

Ранее мы писали о животном, которое подарила миру Римская империя. Когда римляне вторглись в Британию в 43 году нашей эры, они внедрили множество новшеств, начиная от дорог и акведуков до вина и общественных туалетов. Сейчас учёные говорят, что список неполный.

Ещё новости по теме, которые могут заинтересовать:

Источник: techcrunch

Не пропустите интересное!

Подписывайтесь на наши каналы и читайте новости в удобном формате!

Главное за сегодня
Больше новостей