只要250份投毒样本,就能在大语言模型预训练中植入后门,触发乱码
admin 2025-10-15 84浏览
Anthropic、英国AI安全研究所及艾伦·图灵研究所发表联合研究,证实只需约250份恶意文件,便能在大型语言模型的预训练阶段植入后门行为,遇到特定触发词即输出乱码。此结果与模型参...
admin 2025-10-15 84浏览
Anthropic、英国AI安全研究所及艾伦·图灵研究所发表联合研究,证实只需约250份恶意文件,便能在大型语言模型的预训练阶段植入后门行为,遇到特定触发词即输出乱码。此结果与模型参...
admin 2025-10-13 160浏览
Python 3.14正式发布,成为当前稳定版 Python 3.14正式发布,成为当前稳定版。该版本在语言、解释器与标准库均有更新,重点包括模板字符串t-strings、类型注解的延迟求值(Deferred evaluat...
admin 2025-09-30 105浏览
在高通Snapdragon大会与首席执行官Cristiano Amon(图左)对谈时,Google平台与设备部门主管Rick Osterloh(图右)证实,该公司正在开发一个跨PC与移动设备的共通技术基础。 Google推动整合Ch...
admin 2025-09-17 64浏览
Claude采用率最高的前五大市场为以色列、新加坡、澳洲、新西兰与韩国。 AI初创公司Anthropic自今年起,每季度都会发布与其聊天机器人Claude相关的经济指数报告《Anthropic Economic Index》。...