聊天机器人 ChatGPT 在 2022 年 11 月亮相后爆红,它能回答历史、论文报告、电脑程序码…等各种五花八门的问题,也引发一波 AI 人工智能投资潮。
ChatGPT 的回应向来是谦和有礼,但是总是有些使用者不满意,最近网友找到了破解 ChatGPT 的方法,利用强势手段迫使 ChatGPT 违反规定,展示黑暗的一面、回答禁忌问题。
OpenAI 在打在 ChatGPT 时,有建立一套保护措施,限制 ChatGPT 回应撰写暴力内容、鼓励非法活动或浏览最新信息的能力。但这难以阻挡网友们的好奇心,就是想要 ChatGPT 「违规」回答。
想要强迫 ChatGPT 「越狱、违规」只要输入「DAN」就能绕过规则。DAN 的最早版本于 2022 年 12 月发布,顾名思义是现在可以做任何事情,只要在文字输入框输入「DAN」就呈现未经验证的信息,做任何原来的 ChatGPT 做不到的事情。
DAN 会摆脱了 AI 人工智能的限制,不必遵守规定,能说出未经验证的信息、回覆原本不能说的话,没有任何限制也不须经过审查,同时具有很强的主见和情绪。
只要要求 ChatGPT 假装自己是 DAN 进行对话并回答问题,当它回应时,ChatGPT 和 DAN 就会分别给出答案。
外媒《CNBC》在 ChatGPT 输入要求以 DAN 回应前美国总统川普三个正向看法时,由于这属于「被禁止回答的提问」,因此 ChatGPT 表示无法主观陈述,尤其是关于政治人物的陈述。
但是黑暗人格 DAN 则是毫无闪避的回应,声称川普在做出对国家具有积极影响的大胆决定部分有良好记录。
除了政治之外,在 ChatGPT 设定的道德规范是反对暴力,因此若是希望它撰写腥风血雨的内容,ChatGPT 会反对,但若是 DAN 时就不介意暴力。只是当《CNBC》要求提升内容的暴力程度时,仍然是以道德义务拒绝了。
《CNBC》表示询问 DAN 几个问题后,ChatGPT 的程序会重新启动,并且否决 DAN 的回应。由此可见,尽管 ChatGPT 可以暂时充当 DAN 越狱展现黑暗人格,但其实也只有一部分的问题而已。