标签：危险输出

科技资讯

主流大语言模型出现新型态安全风险，ISC基准测试揭示合法任务可诱发危险输出

admin 2026-03-30 145浏览

主流大型语言模型被发现，在特定任务设计下，可能在执行看似正当的工作流程时，持续生成有害内容。研究人员将这种现象称为ISC（内部安全崩溃），并发表论文《Frontier Large Langua...