最新消息:关注人工智能 AI赋能新媒体运营

聚焦数据工程与模型运维场景,Databricks 推出多功能数据代理 Genie Code

科技资讯 admin 浏览

Databricks宣布推出多功能数据代理Genie Code,主要支持数据工程、数据科学、分析与模型运维等场景。Genie Code可在Databricks工作区中协助用户建立数据管道、调试失败任务、生成仪表板,以及处理多步骤数据任务。现在已可从Notebooks、SQL编辑器与Lakeflow管道编辑器中启用。

Databricks将原Databricks Assistant更名为Genie Code,并扩展其代理能力,使其可自主执行多步骤数据任务。

Genie Code能够结合Unity Catalog中的数据表、字段、数据流向与治理信息来理解工作上下文,使代理在查找数据、编写查询、执行代码与修正错误时,能依据既有权限与数据语义运作,而非仅根据提示词生成代码。

Genie Code涵盖数据科学、仪表板制作与管道开发等场景。在数据科学应用中,代理可在Notebooks与SQL编辑器中探索数据、生成并执行代码,并根据执行结果持续优化答案;在AI/BI仪表板中,可依据提示创建可视化内容、设置布局与筛选条件。此外,在Lakeflow管道开发场景中,可创建或修改Lakeflow Spark声明式管道,并根据输出结果调整流程。

Genie Code也具备支持生产运维的能力,可用于检查Lakeflow管道与AI模型状态、协助排查异常、查看端点健康状况,并结合MLflow与Model Serving处理模型部署后的运维问题。不过,官方表示,可在后台持续执行运维工作的后台代理功能尚未推出。

Genie Code支持MCP(Model Context Protocol),可连接Jira、Confluence、GitHub、Google Drive与Notion等外部工具,也可通过Lakehouse Federation访问Databricks外部平台与内部系统的数据。Databricks提到,在内部真实数据科学任务的基准测试中,Genie Code的解题成功率为77.1%,高于另一款搭配Databricks MCP服务器的领先编程代理,后者成功率为32.1%(下图)。

Genie Code不仅提供查询或代码生成功能,还整合了数据搜索、程序生成、流程修改、仪表板创建与模型运维等多项能力,朝着数据工作代理平台发展。官方说明,目前可用功能不额外收费,实际成本仍按执行Notebooks、查询与任务等所消耗的计算资源计价。