云时代,我们需要怎样的数据库?

发表于 3年以前  | 总阅读数:505 次

零、引言

数据库技术发展已达半个世纪之久,数据库图灵奖得主Michael Stonebraker曾在Readings in Database Systems中将数据库模型技术分为9个不同的时代与类型,而云时代开始以后,我们可以从全新的视角审视数据库等基础技术的过去和未来。

基于云计算,包括数据库在内的IT基础技术发生从技术形态到线上线下整个市场结合的大幅变化,数据库技术呈现从传统集中式到云时代分布式迁移替换的趋势,这也给国产数据库赋予机遇与挑战。

在2020年11月,Gartner发布了2020年度的数据库厂商评估报告,国数据库厂商占据三席,标志着国内数据库进入全新发展阶段。

同时,Gartner预测,到2022年,世界上3/4的数据库都会跑在云上,而我们认为,云数据库的发展,目前正在经历从第一阶段“数据库上云,即从数据库到云数据库”,到第二阶段“从云数据库到云原生数据库”的变革。

归根结底,云数据库做了什么得到了业内的认可?未来数据库发展趋势是什么?我们可以如何在新机遇下的云融合时代把握技术创新的脉搏?在当前国产数据库也成为一个热门话题之际,我们谈一谈我们的理解和思考,与大家共勉。

一、云时代的IT基础技术形态演变

随着云计算的发展,整个IT基础技术翻天覆地的变化体现在几个方面:

IT设施部署,从过去的零散化走向今天的集中化、规模化。过去,每一个企业自建各自的数据中心等IT基础设施,包括服务器、网络到操作系统、数据库等,形成企业市场上零散化的IT设施模式。而今天基于云计算服务,企业IT设施呈现集中化、规模化效应,对效率、性能、成本的要求提升。

IT服务交付,从过去的软件交付模式走向服务交付模式。过去购买商业化软件,或者是使用开源软件产品,基本是通过商业化或开源的方式进行分发,而现在完全变成一个个服务的形式进行交付。这带来的变化是,用户不需要再盘算该购买几台服务器,而是在具有数据库使用需求时,直接云上使用即可。

开发方式,将呈现从过去业务进行非常底层的开发以及调用底层API等操作的模式,转向SaaS化、Severless模式的服务。在云上,开发者可以使用各种各样的SaaS服务。无论从效率、基础技术能力等方面来说,这都是一个巨大的变化。

而数据形式及应用场景领域而言,事实上过去的数据形式或应用场景相对单一,以传统数据库为例,场景主要集中在了比如金融、运营商、政务等传统行业领域。随着互联网、移动互联网、产业互联网的发展,各个行业也正逐步加速其电子化、信息化发展趋势,应用服务形式呈多样化发展,使得当前行业的数据形式及应用场景也越来越多样化,并对底层数据库能力提出更多的要求和挑战。过去,行业场景中更多以结构化的数据为主,关系型数据库可以支撑极大部分场景需求,现在我们可以看到涌现出了许多如NoSQL、Graph图数据库等各种类型的数据库,NoSQL下属同时还可以细分KV型、文档型等多种类别,而且整体数据库类型还有持续增加的趋势。这是非常合理的现象。也就是说,对于未来数据库来说,其自身发展也会呈现多样化的、而且是融合、创新的趋势。我们知道,按照传统经验来说,如果一个技术产品是单一的形态,那么追求的是尽量做到通用化,然而,在当前多样化需求的趋势下,技术应用层面需要进行各种权衡和取舍。

因此可以说,这是云时代的发展变化,对数据库带来的新的挑战和要求。在当前云数据库成为大势所趋的同时,我们认为,国产云数据库要发展好,需要持续在基础能力、成本效率、产品化、未来技术融合等各个层面进行探索突破。

二、云数据库技术演进的挑战

结合云计算的特点,国产云数据库发展面临着需要持续探索可用性与一致性、高并发性能、弹性可扩展等基础能力突破,同时面向云时代的多样化趋势打造新一代分布式数据库产品的挑战和要求。

第一,可用性与一致性。

作为数据库,高可用性、数据一致性是最基础的挑战。高可用性,要求达到99.999%以上;数据强一致性,意味着数据不出错,数据库高度可靠。云计算时代,技术设施的升级换代对技术实现方式带来变革。过去,比如金融行业,系统基于稳定性较高的传统集中式大型机或小型机来保障系统的可用性与一致性。然而,传统集中式结构存在明显的技术边界,包括性能和吞吐量的边界,今天它们已然面临较大的吞吐和性能瓶颈,无法满足云时代的产业需求。自然地,当前产业趋势是向分布式架构转型升级,转向基于x86等的分布式、开放式平台。传统架构系统依赖于大型机或小型机在硬件层面进行的大量的冗余设计,在硬件层面实现可用性与一致性保障。而相对来说,基于x86机器部署的新一代分布式架构系统,则在如何实现性能、无限水平扩展的基础上保证数据一致以及系统高可用提出新的挑战要求。

第二,性能成本。

云计算时代,如果实现了规模化以后,还不能实现成本降低的话,是不可接受的。云计算要帮助提升整个社会资源利用率,性能成本需要控制到最低。

对于腾讯云的服务来说,我们需要考虑的是如何能够保证客户以最便宜的价格买到最高级的服务——比如花最少的钱买到最大的磁盘空间、以及最好的TPS等产品表现。而在这个过程中,最核心的就是资源利用率。举个例子,云计算服务商如果把资源利用率提升20%,对客户、服务商本身而言将能极大地降低一部分成本。

第三,云原生意味着一定是弹性伸缩的。

弹性伸缩,也就是可以根据用户的实际需求进行资源分配与使用,而不再是过去通过预采购或预分配的方式。过去,客户大部分都是先预估,然后采购,所以资源利用率一直被诟病;现在则不需要用户再预估自己未来可能会用到多少资源,而是可以根据实时的使用需求实现弹性伸缩。也因为这样,通过提高资源利用率,云数据库才可以实现成本上的优势。但是,极致弹性伸缩对数据库在更高程度的SQL支持、分布式事务能力方面,提出了更高的要求。

第四,云数据库产品化服务化程度。

国内数据库发展历程也经历多个阶段,但正是云计算、互联网的时代兴起,国内诸多腾讯这类云厂商得以抓住机会,基于自身业务场景特点和需求,发展新一代数据库等基础软件技术。在过去很多年的时间当中,腾讯非常重看重的一点就是,如何打磨提升整个数据库的产品化程度,提升用户体验,包括技术产品化、服务完善等方面。互联网厂商基于内部业务场景发展自己的技术体系,这是优势的一面,而在to B开放的过程中,同时也面临产品标准化、通用性、使用体验等挑战。面向行业客户提供技术产品,其要求比支撑内部使用高得多。对于传统企业客户而言,腾讯云希望提供给到客户的是一个完整的产品,而不是一个半成品。因此,产品化程度,是腾讯一直持续强调的能力。

第五,海量场景验证。

最后关键的一点是,对于云数据库而言,包括稳定性、特性需求等基础能力的发展,核心条件是需要有足够的应用场景进行打磨。数据库系统的研发、完善是一个非常复杂的过程,如何让数据库得到实践、得到应用?走到今天,我们认为,持续的、海量的场景打磨,是产品发展的关键条件。得益于腾讯自身以及云上各行各业的应用,超过百万开发者的使用,腾讯云数据库能够有足够的空间打磨产品。这是我们的挑战,也是推动我们发展的土壤。

这些挑战是云数据库发展过程中的必经之路,也是我们在云计算时代创造出新一代分布式数据库产品的机遇。

三、云数据库未来关键趋势

基于这些挑战以及云计算时代赋予的机会,我们认为未来云数据库发展将包括几大趋势要求:

弹性伸缩:解决成本核心问题——资源利用率 前面提到,成本与性能是核心的要素。这里引申出来一个云计算时代的差异,那就是我们需要实现对CPU、内存和磁盘等基础设施资源的灵活调度。

云数据库时代我们将通过对极致的弹性伸缩架构探索,来综合解决性能、效率和成本问题。针对不同的场景侧重,云原生分布式数据库可分为两种架构:一种是Shared Nothing,一种是Shared Storage,两者都可以通过实现计算与存储分离架构来整体获得更优秀的弹性伸缩能力,克服传统架构下的存储量受限、扩展难、主从延迟高等缺点,同时也能够帮助我们将成本控制得更低,充分释放领先技术的成本效益。

而计算与存储全Serverless架构的数据库服务也是未来可重点关注的方向,它在可自动无感扩缩容的基础上,同时实现可按实际使用计费,不用不付费,提升云数据库效用。

多模多引擎趋势下的数据库底层与服务超融合 新基建、产业互联网快速发展,各行各业数字化进程加速,数据形式越来越多样化,越来越海量,如何能最高效地解决数据库在性能、成本、服务等方面问题,超融合是必然趋势。

当下我们处于各行各业都在推进电子化、信息化建设和数字化转型的趋势浪潮之下,行业不断涌现出大量的新兴场景。数据库作为支撑各类IT系统架构的基础软件技术,其整个技术形态也随之出现各类新的应用实现,包括大量的NoSQL实践,以及存储领域有传统的B+ Tree、现在的LSM Tree,和行存、列存等架构形态产品;而根据workload类型区分的话,则涌现出包括OLTP、OLAP,或者两者混合形成的HTAP型数据库等。

而多种多样的引擎产品,在大多数情况下不会独立存在来服务于一个企业或系统。One size fits none。从技术角度看,极致的性能成本与通用性有着天然的矛盾,因此,在多样化场景下,一定会是多引擎共存,充分发挥各种引擎的特点与优势,才能实现极致与通用的兼得。 但是不是作为云数据库服务厂商,我们把这些各类引擎产品都暴露给客户、开发者自行选择呢?从产品服务体验的角度看,必然不是。多模态技术引擎的现状必然对开发者选型带来选型、开发应用上的困难——即如何能够在保证适应不同的场景下,同时获得足够高的性能表现,这也是当前数据库发展面临的一个困境。为了解决这个问题,未来我们希望是不需要用户来进行这些复杂的选择,而是系统基于AI智能调度、serverless等解决方案,来彻底实现多引擎的统一标准化服务。从底层的角度看,未来开发者无需感知具体的产品选型,而比如在做数据分析的时候,系统能够自动帮助调度性能最好、事务交易一致性得到保障的方案。

在此基础上,未来云数据库服务的趋势还是交付方式的融合,包括软硬件一体化、私有云与公有云平台融合等多种产品和服务交付方案,能够让客户在敏感业务和运营成本之间实现更加精细化管理。

智能化:AI+DB 智能化技术等底层技术生态融合变革,实现数据库自治与智能管理也是未来数据库趋势之一。过去,对于一个企业,也许几个DBA来管理几十套实例就足够了,但比如对腾讯来说,数十万的数据库实例,难以通过配置人力来维持运营,因此倒逼我们必须要通过工具或平台来解决运营效率的问题。此外,当前分布式微服务改造的趋势下,未来企业IT运营也将具有越来越强烈的自治需求。智能化技术与数据库底层的融合,能实现对数据库进行全生命周期智能管理。

加速释放新硬件红利 过去一个新硬件的推广周期很长,很多传统企业在采购新硬件方面相对非常保守。而对于云厂商来说,相对有条件逐步率先探索新硬件的应用,比如先在非关键性应用,同时也具备海量的场景验证,来实现稳步规模化的推广。这个角度来说,基于云计算服务,云原生数据库相对更加容易探索、释放到新硬件带来的红利。

当前我们也处于新硬件创新层出不穷的时代,包括SSD、NVM、RDMA+SPDK、千核服务器、异构处理器等,基于云数据库服务,广大的客户、普通开发者也能够更快速地享受到新硬件带来的加持。因此,融合、自治、效用是未来企业级分布式数据库基本特点。腾讯云数据库将从实践层面对以上趋势进行落地推进,来满足各行各业客户未来对数据库的多样性需求。

本文由哈喽比特于3年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/2uG1WjCjqOJWJceCTj5zSA

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:1年以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:1年以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:1年以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:1年以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:1年以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:1年以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:1年以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:1年以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:1年以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:1年以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:1年以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:1年以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:1年以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:1年以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:1年以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:1年以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:1年以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:1年以前  |  398次阅读  |  详细内容 »
 目录