
Databricks推新技術Mooncake,代理型AI效能提升百倍
Databricks上周公布了数据整合技术Mooncake,号称可让代理型AI运行效能提升100倍。
这是Databricks 9月底收购一家AI初创公司Mooncake Labs的结果。Mooncake Labs是以Apache Iceberg开发解决方案的团队。
Databricks说明,Mooncake技术能大幅提升AI运算的效能。OLTP(在线事务处理)主要用于获取订单、支付和登录等“写入”应用,强调快速插入和更新,但并不适合分析。OLAP(在线分析处理)则用于报表、仪表盘和模型的“读取”应用。在这些场景中,数据被汇总、查询和摘要,但通常是事后进行,无法实时执行。
过去,OLTP和OLAP任务需依赖ETL管道(pipeline)将历史数据从交易型系统中提取出来,经过转换后再导入分析型数据仓库。这种技术在一些非实时作业中,如季报甚至每日作业都可行。但在代理型AI中,自主系统被训练成在几秒内完成接收数据、决策和行动,任何时间延迟都无法接受。
而Mooncake Labs的技术正是为了缩小这一时间差。该方案基于Apache Iceberg的开放表格式,紧密整合存储、索引与计算,使运算不再依赖管道和时间差来区分交易与分析。结果是,代理型AI作业速度提高100倍,形成一种反馈循环,支持自主型应用,包括欺诈检测、供应链协同到生成式AI代理。
Databricks表示,公司一直致力于将湖仓一体(lakehouse)构建为数据与AI的统一基础架构,其收购策略也遵循这一蓝图。MosaicML是为了生成式AI训练而收购,Arcion是为了实时数据管道,都是为了打破数据壁垒。MosaicML增强了Databricks训练和部署基础模型的能力,Mooncake则赋予它“心跳”:即时的交易数据状态,同时可立即分析。今年5月,Databricks还收购了无服务器Postgres平台供应商Neon,帮助客户构建AI代理。