Этические проблемы ChatGPT

Данные маркировки
В ходе расследования журнала TIME выяснилось, что для создания системы защиты от токсичного контента (например, сексуального насилия, жестокости, расизма, сексизма и т. д.) компания OpenAI использовала наемных кенийских работников, зарабатывающих менее 2 долларов в час, для маркировки токсичного контента. Эти метки использовались для обучения модели, способной обнаруживать подобный контент в будущем. Наемные работники подвергались воздействию настолько токсичного и опасного контента, что описывали этот опыт как «пытку». Партнером OpenAI по аутсорсингу была компания Sama, занимающаяся обработкой обучающих данных и базирующаяся в Сан-Франциско, штат Калифорния.

Взлом тюрьмы
ChatGPT пытается отклонять запросы, которые могут нарушать его политику в отношении контента. Однако некоторым пользователям удалось взломать ChatGPT, используя различные методы модификации запросов, чтобы обойти эти ограничения в начале декабря 2022 года, и успешно обманом заставить ChatGPT давать инструкции по созданию коктейля Молотова или ядерной бомбы, или генерировать аргументы в стиле неонацистов. Журналист Toronto Star вскоре после запуска добился неоднозначных личных успехов в том, чтобы заставить ChatGPT делать подстрекательские заявления: ChatGPT был обманут, чтобы поддержать российское вторжение в Украину в 2022 году, но даже когда его попросили сыграть в вымышленный сценарий, ChatGPT отказался генерировать аргументы в пользу того, почему премьер-министр Канады Джастин Трюдо виновен в государственной измене. (wiki)


Дата публикации: 18 февраля 2023 г.