最新消息:关注人工智能 AI赋能新媒体运营

Databricks买下Tabular,企图改善资料相容性

微信运营 admin 浏览 评论
图片来源:

Tabular

资料与AI业者Databricks周二(6/4)宣布,已同意买下资料管理业者Tabular,準备改善资料湖仓(Lakehouse)格式的相容性。双方并未揭露交易细节,但《华尔街日报》(Wall Street Journal)报导,此一交易规模介于10亿~20亿美元之间,预计于今年7月完成交易。

Databricks与Tabular的创办人都来自开源社群。其中,Databricks在2013年由Apache Spark的原始创办者所设立,Apache Spark为一锁定大规模资料处理的开源统一分析工具,之后Databricks也打造了开源的Delta Lake资料湖专案;至于Tabular则是在2021年由Ryan Blue、Daniel Weeks和Jason Reid所创立,Blue与Weeks在任职于Netflix时开发了「冰山」(Iceberg)专案,这是个用于大型分析表格的格式,之后把它捐给了Apache软件基金会。

迄今全球已有超过500名工程师贡献Delta Lake专案,并有逾1万家企业使用Delta Lake,平均每天处理4 EB以上的资料量。

Databricks表示,Delta Lake与Iceberg专案在差不多的时间问世,皆为资料湖仓格式主要的开源标準,可惜的是,虽然它们都是基于Apache Parquet并有类似的目标与设计,却因彼此独立开发而互不相容。在收购Tabular之后,Databricks打算与Delta Lake及Iceberg密切合作,推动彼此格式的互动。

至于Tabular也说,资料生态体系充斥着开放表格格式的讨论,大家都希望能够有一个安全且集中的资料架构,可连结到各种专业的运算框架或引擎,从而解锁新的资料管理及分析能力,与Databricks携手建置一个共同的资料标準将可实现此一愿景。

与本文相关的文章

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论