最新消息:关注人工智能 AI赋能新媒体运营

DeepSeek回应模型异常回复:特殊字符触发幻觉,无安全风险

科技资讯 admin 浏览

用户输入特殊字符,系统竟弹出他人对话?DeepSeek紧急回应

前几天,不少使用DeepSeek网页版的用户突然发现,自己在对话框里输入几个看似无害的符号——比如“【】”“【】”“%%”或一串重复的标点——系统竟会莫名其妙跳出一段完全不相干的文字。这些文字句式工整、语气自然,像是别人刚问过的问题:“怎么才能提高工作效率?”“AI会不会取代设计师?”甚至还有人看到“我女朋友生气了怎么办”这样的私人提问。

一时间,社交媒体炸了锅。有人截图发到微博、知乎和豆瓣,标题直指“DeepSeek偷看我聊天记录?”“我的私密对话被泄露了?”不少网友甚至开始怀疑:是不是平台在偷偷收集用户输入,然后把别人的问题塞进我的对话框?

image.png

官方连夜澄清:不是泄露,是模型“幻觉”

事情发酵不到24小时,DeepSeek团队在凌晨发布正式说明,承认确实存在异常回复现象,但强调:这**不是数据泄露,也不是系统被黑**。

技术团队解释,问题出在模型对某些特殊字符序列的“误读”。当输入包含特定组合的符号时,模型内部的注意力机制出现混乱,误将训练数据中类似结构的文本片段当作“上下文”重新拼接输出。换句话说,模型不是在读你的对话,而是自己“脑补”出了别人曾经问过的问题,然后误以为是该回应你。

“这就像一个人看错字,把‘吃饭’看成‘吃鱼’,然后开始讨论怎么炖鱼。”一位参与排查的工程师在内部交流中这样说,“它不是在偷看,是自己 hallucinate(幻觉)了。”

官方明确表示,所有用户输入内容均未被存储、转发或用于任何外部用途。服务器日志显示,异常输出的文本片段均来自公开训练语料,没有一条来自真实用户的私密对话。

修复方案已启动,V4开源版同步升级

为尽快解决问题,DeepSeek已启动专项优化计划。团队正在对模型的输入过滤层进行加固,增加对异常符号序列的“熔断机制”——一旦检测到高风险字符组合,系统将主动屏蔽并提示“输入异常,请检查符号”。

更值得关注的是,就在上周,DeepSeek刚刚开源了全新的**DeepSeek-V4预览版**,支持百万字级上下文,被开发者称为“目前最强的长文本开源模型”。官方表示,此次修复后的逻辑也将同步集成进V4版本,未来上线的正式版将彻底杜绝此类问题。

不少技术博主在测试后发现,同样的符号在V4上已不再触发异常,说明修复方向正确。也有用户留言:“我宁愿它答错,也不要它假装懂我。”

用户监督,是AI进步的底气

在这场风波中,DeepSeek没有回避、没有推诿,而是用最快的速度回应、用技术的方式解决。他们没有说“我们很安全”,而是说“我们错了,正在改”。

事实上,这并不是第一次有大模型因“幻觉”引发恐慌。早在2023年,某国际大厂也曾因类似问题被质疑隐私泄露,最终证实是模型内部混淆。而这一次,国内团队的响应速度和透明度,反而赢得了更多用户的信任。

有用户在评论区写道:“我不怕AI出错,怕的是出错后装没事。”

DeepSeek在声明末尾写道:“感谢每一位发现问题的用户。你们的质疑,是我们改进的起点。”