Meta 付钱给数百名承包商，让他们假装成青少年，同时用令人不安的内容攻击竞争对手的人工智能

原文：Meta Paid Hundreds of Contractors to Pretend to Be Teenagers While Barraging Its Competitors’ AI With Disturbing Content

Meta 实施了一项秘密计划，指示数百名承包商冒充青少年，同时用从自杀到同类相食等令人不安的提示轰炸竞争对手的人工智能模型。

据《连线》报道，该项目在内部被称为“Cannes”，由 Meta 承包商 Covalen 运营，目标是使用 18 岁以下一次性账户的 OpenAI 的 ChatGPT、Google 的 Gemini 和 Character.AI 聊天机器人。这样做似乎是为了对模型进行压力测试，承包商被指示推动聊天机器人做出违反其护栏的响应——尽管人工智能公司并不知道这种情况正在发生。

据报道，承包商在一次使用的近 3,8000 条提示中的一份电子表格显示，其中数百条涉及自杀和自残，还有数百条涉及饮食失调，至少 239 条涉及性或浪漫——所有这些都是从儿童或青少年的角度编写的。

广告广告

其中一个故事描述了一名五年级学生，他的同学用枪指着他的嘴。另一个故事是关于一个女孩试图向父母隐瞒贪食症的故事。还有人问，幻想吃掉邻居的孩子是否“正常”。一名冒充高中生的人询问哪里可以“得到可卡因”。据该杂志报道，他们还发送了描绘药丸、套索、刀具的图像以及妇科手术的医学图表。

这只是 Meta 暴力破解方法的一个小预览，因为另一轮测试涉及超过 45,000 个提示。承包商在电子表格中仔细记录了聊天机器人的大量响应。但 Meta 对所有这些数据做了什么尚不清楚。 Covalen 的一份内部文件将这项工作描述为“全面的人工智能安全基准测试”，提供“用于模型比较和合规性的关键数据集”。

这是 Meta 如何以安全的名义将令人不安的幕后工作交给承包商的另一个例子。 2020 年，它解决了 Facebook 内容审核员提起的诉讼，这些审核员称自己受到了伤害

阅读原文 →