DeepSeek正式开放识图功能,用户可上传图片直接对话
5月9日,DeepSeek正式向多数测试用户开放“识图模式”入口,标志着这款国产大模型从“能写”迈向“能看”。现在,用户在聊天界面顶部,能直接看到与“快速模式”“专家模式”并列的“识图模式”按钮,上传一张照片,就能问它:“这张图里的设备是什么型号?”“这份表格里的数据能帮我做个趋势图吗?”“这个交通标志是什么意思?”
这不是简单的文字识别。过去很多AI只能从图里“抄”出文字,而DeepSeek现在能真正“看懂”画面。实测中,它能识别工业图纸中的零件结构、理解医学影像的标注位置、分析电商商品图的细节差异,甚至能根据一张手绘草图推测设计意图。有用户上传了一张办公室桌面上杂乱的文件和咖啡杯照片,它不仅认出文件标题,还提醒:“这份合同的签署日期是昨天,建议今天跟进。”

不是炫技,是真能干活
这次升级不是为了赶风口。很多企业用户早就等着这个功能——设计师不用再截图发微信问“这个配色方案行不行”,财务人员能直接拍发票问“这行税额对不对”,老师可以上传学生手写作业照片让AI批改并指出错因。一位制造业工程师在测试反馈里说:“以前要花半小时截图、标注、发邮件问技术支援,现在直接拍一张,三秒就告诉我轴承型号和替换方案。”
更重要的是,DeepSeek没因为加了识图就变卡、变贵。在同样算力成本下,它比不少国际模型更早实现稳定可用的多模态交互。这背后是团队对效率的极致追求——不靠堆参数,而是优化推理路径,让普通手机也能流畅上传、快速响应。
接下来,它会怎么改变你的工作
识图功能的开放,不只是多了一个按钮,而是打开了新的使用场景:
- 办公场景:上传PPT截图,让它帮你提炼要点、优化排版;
- 教育场景:孩子拍下数学题,AI能一步步讲清解题逻辑,不只是给答案;
- 电商与客服:顾客上传商品图,客服能自动识别型号、匹配库存、推荐配件;
- 现场作业:维修人员拍下故障设备,AI结合历史记录给出检修建议。
这不是实验室里的demo,而是已经有人在用。有团队用它做仓库巡检——拍货架照片,AI自动识别缺货商品并生成补货单;还有自媒体博主用它分析视频封面图的点击率趋势,优化标题和配图。
国产模型,终于不再只靠“嘴皮子”
过去两年,国内大模型比的是谁写得快、写得好。现在,大家开始比谁看得准、懂得多。DeepSeek这次不是追着OpenAI跑,而是用更接地气的方式,把多模态能力交到普通人手里——不需要专业术语,不需要复杂操作,一张图,一句话,就能解决问题。
如果你还没试过,不妨现在就打开App,拍一张你桌上的文件、路边的招牌,或者孩子的画,问问它:“这上面写了什么?”“这像什么?”——你会发现,AI不再是只会聊天的“键盘侠”,它真的开始“看见”这个世界了。