最新消息:关注人工智能 AI赋能新媒体运营

向量数据库Pinecone推出AI代理知识引擎Nexus,主打通过预编译知识改善RAG检索问题

科技资讯 admin 浏览

向量数据库厂商Pinecone近日发布新产品Nexus,定位为专供AI代理(AI agents)使用的知识引擎(knowledge engine),并提出“知识编译(knowledge compilation)”概念,主张通过预先整理与结构化企业知识的方式,改善当前RAG(Retrieval-Augmented Generation)架构在代理式AI场景中的性能与可靠性问题。

Pinecone表示,目前代理式AI约85%的计算工作与知识检索相关,但任务完成率仍仅约50%至60%。这不仅增加了Token成本,也容易因反复检索与上下文不足而产生幻觉(hallucination)或遗漏重要信息。

该公司认为,当前RAG流程本质上仍是将大量原始文档片段交由模型实时处理,因此推理延迟、成本和输出结果的稳定性都会受到影响。Nexus则试图将部分知识整理工作提前至数据处理阶段完成。

根据Pinecone说明,Nexus主要由Context Compiler与Composable Retriever两大组件构成。Context Compiler可根据企业数据与代理任务需求,建立适配特定工作流程的结构化知识内容;Composable Retriever则负责根据不同代理需求,以合适格式提供相关知识数据。

Pinecone举例,中型SaaS企业的数据通常分散在数据仓库、Slack、Salesforce等不同系统中。当前AI代理工具大多直接扫描所有数据源,再自行整理上下文,不仅容易出错,也可能被大量无关信息干扰。Nexus则改为预先构建特定任务所需的知识内容,让代理直接访问经过整理的知识成果,而非反复查询原始文档。

Pinecone也同步推出KnowQL查询语言,让AI代理可通过统一格式描述查询意图、数据来源、输出格式、可信度与延迟需求等条件,以获取结构化且附带引用来源的响应内容。

《The New Stack》分析指出,Pinecone过去是推广RAG架构与向量数据库的重要厂商之一,如今却主张传统RAG模式开始面临代理式AI工作负载带来的性能挑战,也反映出AI基础架构正从单纯的向量搜索,转向更重视上下文工程(context engineering)与知识预处理的新方向。