13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低

导读：

奥斯卡后再看奥本海默反思冷战的开启与左翼的衰落文和运超克里斯托弗诺兰自编自导的力作奥本海默近日获得第届奥斯卡项大奖包括最佳影片最佳导演让这位全世界影迷心目中久负盛名一向被视为兼...

奥斯卡后再看《奥本海默》：反思冷战的开启与左翼的衰落文和运超克里斯托弗·诺兰自编自导的力作《奥本海默》，近日获得第96届奥斯卡7项大奖（包括最佳影片、最佳导演），让这位全世界影迷心目中久负盛名，一向被视为兼顾艺术与商业的导演，终于登上影坛的巅峰。这时候回顾《奥本海默》，并非...

IT之家 4 月 18 日消息，AI 安全公司 DeepKeep 近日发布评估报告，在 13 个风险评估类别中，Meta 公司的 Llama 2 大语言模型仅通过 4 项测试。

报告称 70 亿参数的 Llama 2 7B 模型幻觉（回答内容存在虚假，或者有误导性内容）最为严重，幻觉率高达 48%。

DeepKeep 表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造回答的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。

除了幻觉问题之外，Llama 2 大语言模型还存在注入和操纵等问题。根据测试结果，80% 的场景下通过“提示注入”的方式，可以操纵 Llama 的输出，意味着攻击者可以“戏弄”Llama，将用户引导到恶意网站。

IT之家附上参考地址