DeepSeek开源V4预览版,支持100万token的上下文长度
admin 2026-04-27 138浏览
中国AI初创公司DeepSeek上周发布并开源了DeepSeek-V4预览版,宣称新版本支持高达100万个Token的上下文长度,显著提升了智能体(Agent)能力,性能可媲美顶级闭源模型。据路透社报道,De...
admin 2026-04-27 138浏览
中国AI初创公司DeepSeek上周发布并开源了DeepSeek-V4预览版,宣称新版本支持高达100万个Token的上下文长度,显著提升了智能体(Agent)能力,性能可媲美顶级闭源模型。据路透社报道,De...
admin 2026-03-18 79浏览
大模型的下半场,拼的不是参数,是效率 过去几年,大模型的竞争像一场军备竞赛——谁的参数多、算力强,谁就站在风口。但到了2025年,这场游戏的规则变了。真正能跑赢的,不再...
admin 2025-11-25 179浏览
Kimi 新模型登顶长上下文评测,颠覆传统认知 近日,知名长上下文评测平台 Context Arena 更新榜单,两款来自月之暗面(Kimi)的模型—— kimi-linear-48b-a3b-instruct (简称 kimi-linear-48b)与...
admin 2025-11-25 99浏览
美国非营利研究机构AI2发布了新一代语言模型家族Olmo3,主打真正开源的思维模型。与多数仅发布最终权重的模型不同,Olmo3公开了训练数据、代码、评估流程,以及各阶段的检查点和用...
admin 2025-11-22 138浏览
Grok 4.1 Fast 重磅上线:长上下文+工具调用,智能代理真正“能干活” 今天,xAI 正式发布 Grok 4.1 Fast —— 一款专为生产环境打造的高性能大模型,搭配全新 Agent Tools API,让开发者不再只...