最新消息:关注人工智能 AI赋能新媒体运营

【AWS GAI战略4】瞄準GAI庞大资料处理需求,分散式资料库产品大升级

科技智能 admin 浏览 评论

为解决传统分散式资料库面临的一致性和按时序写入的2大挑战,AWS发展出时间同步服务,在世界各地的每个云端服务器EC2执行个体中,部署硬件参考时钟、与卫星原子钟同步,解决了时序写入问题,成为年会亮相的资料库服务新功能亮点。

如何让资料库主力产品符合生成式AI(GAI)掀起的快速、高可用需求,是AWS今年度re:Invent大会想展示给业界的内容。

自AWS推出资料库服务以来,历经了第一代的云端资料库服务Amazon RDS,后来也发展出2款主要服务Amazon DynamoDB和Amazon Aurora,前者是全託管、无服务器、键值NoSQL资料库,使用者可用来任意扩展、执行高效能应用程序,还能持续备份、自动多区域複写。后者则是专为云端建置的关联式资料库管理系统,与MySQL和PostgreSQL完全相容,一样具有高扩展和99.99%的可用性。

在这个基础上,AWS看準生成式AI资料处理需求,近期在该服务中新添了不少功能,能自动扩展、支援向量资料,来协助使用者发展生成式AI应用。

如何兼顾99.999%多区域可用性和强大一致性

AWS资料库团队在思考产品策略下一步时,提问了「完美的资料库服务应该长怎样?」AWS执行长Matt Garman在大会中指出,他们于是找来不少企业客户讨论,最终总结出几个特点:高可用性、多地区、低延迟、无需额外操作、储存一致、懂SQL语意等。

AWS希望资料库服务能兼顾所有优点,于是针对这些项目一一研究、改进。尤其针对一致性,AWS开发一种方法,来将资料库交易处理和储存进行解耦,只在交易提交时进行一次性检查,并平行处理所有区域的写入工作,减少了不同区域间,资料库引擎同步所需的繁琐资料交易量,进而提高一致性和快速写入多区域资料库服务。

但如何让这些资料交易,都按照时序写入,又是另一个难题。于是,AWS自己开发了Amazon Time Sync时间同步服务,来在世界各地的每个云端服务器EC2执行个体中,部署硬件参考时钟,并与卫星原子时钟同步。

这么做,让世界各地的执行个体时间同步精确度到微秒等级,等于资料库的交易资料也能精準地按时序写入多区域资料库,使用者更能大规模建置全球性的分散式应用程序。AWS这两招,解决了分散式资料库领域长期存在的两大挑战。

2款资料库服务新功能登场

因为这些技术突破,AWS将兼顾分散式资料库一致性与时序的技术,进一步用来打造2款新功能,专门为全球性应用程序设计,更能满足AI分析应用的快速需求。

这就是Amazon Aurora DSQL和Amazon DynamoDB Global Tables。Matt Garman自信地说,Amazon Aurora DSQL具备是最快的无服务器分散式SQL资料库,使用者可建立99.999%多区域可用、高度一致且PostgreSQL相容的应用程序,而且不必管理基础设施。

这个新功能採AA架构,具自动故障恢复功能,确保应用程序能在Amazon Aurora DSQL任一端点进行读写,运作不中断。也由于多区域可用,在一个区域写入的交易,都能即时同步到其他区域,达到高一致性。尤其,Aurora DSQL的读写速度比市面资料库服务快上4倍,适合打造全球性的分散式应用程序。

有了Aurora DSQL的技术突破成功经验,AWS也用来打造Amazon DynamoDB Global Tables新功能,在多区域高可用、低延迟的基础上,进一步强化一致性,能确保用户在多区域部署的应用程序,一直读取最新资料,不必更改任何应用程序码,更利于跨国应用程序执行。这两款新功能是AWS为AI庞大资料处理需求,给出的新解方。

?相关报导?

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论