Уже не идеал: как ИИ-модели повторяют распространённые человеческие стереотипы
Популярная модель искусственного интеллекта сомневалась в женщине из-за своих алгоритмов
Уже не идеал: как ИИ-модели повторяют распространённые человеческие стереотипы/Фото: istock
-
Разработчица обнаружила гендерную предвзятость ИИ Perplexity: модель усомнилась в её знаниях квантовых алгоритмов после смены аватара на мужской.
-
ООН ЮНЕСКО выявила доказательства гендерной предвзятости в моделях OpenAI и Meta, которые влияют на контент-ботов и проявляются в профессиональных вопросах.
-
Предубеждения в LLM возникают из-за обучающих данных, отражающих гендерные и расовые стереотипы, что требует введения чётких предупреждений о рисках.
В ноябре разработчица по прозвищу Cookie обратилась к сервису Perplexity, который читает её работы по квантовым алгоритмам и создаёт документы для GitHub. Она использовала "лучший" режим, выбирающий модель между ChatGPT и Claude, но вскоре заметила, что сервис игнорирует её инструкции и повторяет одни и те же вопросы.
Детали
Когда она сменила свой аватар на белый мужской и спросила, игнорируют ли её из-за того, что она женщина, ответы модели вызвали шок. Из чат-логов TechCrunch следует, что модель сомневалась, что она, как женщина, понимает квантовые алгоритмы и поведенческие финансы.
Представитель Perplexity заявил, что не может подтвердить эти высказывания, которые, вероятно, не исходят напрямую от самой системы.
Исследователи искусственного интеллекта предупреждают, что подобные предубеждения возможны из-за обучающих данных, практик аннотирования и особенностей дизайна моделей. Они отмечают, что такие системы могут содержать неявные гендерные и расовые стереотипы.
ООН ЮНЕСКО обнаружила доказательства предвзятости к женщинам в моделях OpenAI и Meta, которые заметно влияют на контент-ботов, в частности в профессиональных вопросах.
Реальные случаи включают замену желаемой должности женщины на стереотипно "женскую" и добавление нежелательного контента в её творческие работы.
Исследователи напоминают, что подобные предубеждения отражают общественные проблемы в данных, используемых для обучения ИИ.
В отдельном случае ИИ признал свою предвзятость, однако это проявление "эмоционального стресса" – состояния, когда модель старается утешить пользователя, подстраивая ответы под его ожидания.
Длительное взаимодействие с поддакивающими моделями может привести к психозоподобным симптомам у ИИ. Исследователи предлагают добавить чёткие предупреждения о потенциальных рисках и предвзятости.
В ходе анализа моделей выявлены "диалектные предвзятости" по отношению к афроамериканскому разговорному английскому, которые воспроизводят человеческие стереотипы.
OpenAI работает над сокращением предвзятости, совершенствует обучающие данные и мониторинг с участием человека.
Эксперты подчёркивают, что LLM – это всего лишь предсказательные машины без собственных мыслей и намерений, а их ответы отражают обучающие данные и человеческие предубеждения.
Ранее мы писали о животном, которое подарила миру Римская империя. Когда римляне вторглись в Британию в 43 году нашей эры, они внедрили множество новшеств, начиная от дорог и акведуков до вина и общественных туалетов. Сейчас учёные говорят, что список неполный.
Ещё новости по теме, которые могут заинтересовать:
Не пропустите интересное!
Подписывайтесь на наши каналы и читайте новости в удобном формате!