
Cohere
加拿大AI新创Cohere周四(3/13)发表了新一代AI模型Command A,只需要两个A100或H100的Nvidia GPU就可部署,宣称该模型在代理企业任务上的表现与GPT-4o及DeepSeek-V3相当,能够以最少的硬件提供最大的性能。
Cohere是在2019年由Aidan Gomez、Ivan Zhang及Nick Frosst共同创办,其中,Gomez曾在2017年于Google实习,也是该年出炉的《Attention Is All You Need》论文的8位共同作者之一,该论文被视为是机器学习领域的里程碑,它介绍了新一代的机器学习架构Transformer,也预见了Transformer被应用在问答及多模态生成AI的潜力,之后Transformer亦成为基于GPT等大型语言模型的主要架构。
Cohere表示,Command A是专为要求严格的企业环境所设计,它支援256k的脉络长度与23种语言,且只需要两个GPU即可部署,其它竞争模型最多需要32个GPU。
另一方面,在效能测试中,Command A最快每秒可输出156个Token,比GPT-4o快1.75倍,比DeepSeek-V3快2.4倍,除了硬件优势及输出速度外,Command A在指令追蹤、SQL、代理程序及工具任务的基準测试中也有出色的表现。
图片来源_Cohere
Cohere指出,不切实际的大型模型可能导致严重的延迟,若是只想快速获得正确答案,Command A将是最佳选择,而且相较于基于API的存取服务,Command A的私有部署最多可节省50%的成本。
目前Cohere平台已释出Command A,也透过Hugging Face开放给学术使用,亦即将登上其它云端供应商,有意私有部署的企业则可直接联繫其销售团队。
在Hugging Face于2024年6月公布的开源大型语言模型(LLM)排行榜上,当时Cohere所开发的Command R+还占据排行榜第5名,但最新的资料显示,它已掉到700名外,彰显出AI模型市场的激烈竞争态势。