ChatGPTを暴言吐きまくりのトキシックなチャットAIにする方法


ChatGPTやPaLMなどの大規模言語モデル(LLM)は、記事の作成や情報の検索、チャットAIの作成など、さまざまなユースケースに利用されています。

そんなLLMを性差別や人種差別、卑劣な暴言を吐く有害(トキシック)なチャットAIにする方法を、プリンストン大学、アレン人工知能研究所(AI2)、ジョージア工科大学の研究グループが発表しました。

...