主流大语言模型出现新型态安全风险,ISC基准测试揭示合法任务可诱发危险输出
admin 2026-03-30 129浏览
主流大型语言模型被发现,在特定任务设计下,可能在执行看似正当的工作流程时,持续生成有害内容。研究人员将这种现象称为ISC(内部安全崩溃),并发表论文《Frontier Large Langua...
admin 2026-03-30 129浏览
主流大型语言模型被发现,在特定任务设计下,可能在执行看似正当的工作流程时,持续生成有害内容。研究人员将这种现象称为ISC(内部安全崩溃),并发表论文《Frontier Large Langua...