数据库云原生(云原生数据库系统特点)
本文目录一览:
- 1、创原会:保险行业精英齐聚,共论云原生创新之道
- 2、从云原生数据库服务到新型“数联网”基础设施
- 3、NewSQL分布式数据库发展策略讨论
- 4、云原生应用是什么?它的特点有哪些?
- 5、如何来提高云原生数据的安全性?
- 6、对话阿里云李飞飞:关于云原生数据库的五大预判
创原会:保险行业精英齐聚,共论云原生创新之道
1月15日,由创原会发起的“云原生技术精英沙龙(保险行业专场)”成功举办,来自中国信通院、华为云以及保险行业的技术精英,就“云原生提速保险行业数字化转型”以及“保险行业云原生典型应用场景”进行了深入探讨。
创原会是华为云联合CNCF、中国信通院及业界云原生技术精英们,构建的全球化云原生交流平台,旨在通过 探索 前沿云原生技术、共享产业落地实践,共创云原生与业务融合的无限可能。
云原生:保险行业数字化升级的必由之路
随着百姓保险意识的增强、“互联网+保险”对传统业务的颠覆创新,保险行业正经历一场产品、运营、业务模式全面升级的变革。
合众人寿信息技术总监顼颂表示:“我们希望扩大外部交流,引入新的技术,并通过平台化战略实现开放生态、跨界融合,进而与上下游渠宏歼道对接,建立一个整合了保险业务、数据、产品的体系,提高业务系统的灵活性和创新的敏捷性,实现以客户为中心,数字化驱动、智慧经营的 科技 发展目标。”
中国信通院云大所云计算部副主任陈屹力,在会上分享了云原生技术与保险业务融合的趋势洞察。他认为:“ 云原生是保险行业新一轮数字化升级的必由之路, 其开放、敏捷、标准的特点,能快速帮助企业构建开放的平台,更好地支撑业务的快速发展和创新,实现降本增效。未来的1至3年,保险行业将迎来全面云原生化的时代。”
云原生基础设施:为保险业务构建高效的云原生底座
互联网加持下的保险业务,呈现出交易频次高、流量大等特点。同时,保险业务与不同行业的融合,也对业务敏捷创新提出了更高的要求。
华为云云原生解决方案资深架构师吉硕在会上介绍:“华为作为全球领先的ICT基础设施和智能终端提供商,在自有业务升级、服务全球客户的过程中,已实现超大规模企业云原生实践。我们将这些经验与华为云服务相结合,打造了更适合传统行业客户大规模落地云原生的解决方案。”
华为云基于擎天架构打造 “以应用为中心”的云原生基础设施,为客户构建全栈云原生业务,提供了高效、敏捷的云原生基础设施平台。
通过提供x86、GPU、鲲鹏、升腾拆迟等多样性算力,华为云满足保险行业核心交易、互联网业务、AI及大数据业务对算力的差异化诉求,并基于擎天架构的软硬协同能力,充分发挥出云原生基础设施性能,满足业务大规模部署、大业务量并发的需求;同时,云原生多云平台帮助客户快速构建多地多中心业务治理能力,实现跨地域的资源调度、业务扩容、流量治理;此外,标准、开放的应用管理平台,实现各类云原生应用共平台部署,提旅绝李升了业务的开发、运行、运维效率。
云原生数据库:保障保险业务数据的高效与安全
保险业务的快速发展,各企业数据库数据量可高达几十、数百TB,数据库如何扩展、如何最大限度的发挥这些数据的业务价值,是困扰保险行业的难题。
华为云数据库聚焦全场景云服务,推出了云原生数据库GaussDB,其基于统一的存算分离架构,兼容openGauss及主流开源数据库生态,支持关系型与非关系型数据库,并构建了多生态兼容、层次解耦、多副本强一致、数据融合、算子下推等云原生能力。GaussDB的极致性能解决了企业海量数据读写带来的压力。同时,数据跨AZ高可用、RPO=0、RTO秒级,满足了保险行业监管的要求,且完整的工具链,可帮助企业快速完成数据的平滑迁移,确保业务数据0丢失。
目前,华为云云原生解决方案已广泛应用在永安保险、众惠保险等多家保险行业的标杆企业,帮助企业重塑云原生业务架构,加速企业数字化升级。
聚八方领航者,论云原生之道。未来,创原会成员将继续与各行业的云原生技术精英一起,持续赋能“新云原生企业”,加速云原生技术落地与产业繁荣。
视频加载中...
从云原生数据库服务到新型“数联网”基础设施
作者 石默研
新型“数联网”基础设施
2020年4月,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(下称《2020数据要素意见》)发布以来,数据要素的市场价值日益受到扒禅重视。同时,长期的实践证明,数据要素的威力,大多数情况下源于对多源数据的融合分析,单一组织靠自身积累往往难以聚集足够价值的数据,因此,只有通过数据跨域流通与共享开放才能真正发挥大数据的应用价值。如银行、保险、政府、电商等等行行业业,已经有了强烈、广泛的数据跨域集成与融合的市场需求。另一方面,随着数字化的深入发展,信息技术已经开始从助力经济发展的辅助工具向引领经济发展的核心引擎转变,大数据资源应该向资产升级,对“数字经济”新范式产生更加直接的驱动作用。而大数据资源向资产升级的关键则是高效、安全的互联互通、精确的计量计价及数据所有权、使用权的市场化清晰界定。
于是,“数据要素互联互通网络”数联网成为国家乃至国际一项重要的新型互联网基础设施与创新业态诉求,有着重大的 社会 价值与广阔的市场空间。
2. 云原生数据库服务
云原生数据库,是支撑现代数据服务的主体设施,它生于云上,长于云上,对外形成按需获取的DBCloud形态,使用者无需关心数据计算与存储的具体细节,无需为部署、运维、扩缩等工作付出精力,无需对数据计算的模态(AP,TP,流,图等)做出额外的规划与设计,无需区分所选择云计算基础设施IaaS的特性与区别,只需要向云原生数据库DBCloud的运营者申请使用相应的服务即可,这是现代数据库技术与服务发展的必然方向。毫无疑问,在不久的将来,全球越来越多的数据服务将在云上,包括多云、跨云的环境中以平台化的方式实现。由于云计算环境所带来的强大算力与各项能力,数据服务平台化必将极大地推动与加速各行业业务数字化转型升级的进程,而云原生数据库也必将成为新数字化时代一项关键的公共IT基础设施。
3. 从数据库平台服务到新一代互联网基础设施“数联网”
关于数据流通互联基础设施“数联网”,相当长一段时间以来,国内外已经有很多建设与运营的尝试,在我国主要就是各级政府主导的“大数据交易中心”,从2014年起就开始启动,经历了2014-2016年“第一次浪潮”后,于2017-2019年处于“停滞期”,运营实践看,整体成交量远低于预期。原因主要在于数据所有权与使用权属难以界定,隐私、安全与共享之间的矛盾越来越明显。一方面跨域数据共创需求越来越迫切,另一方面,数据的无序流通,又可能导致隐私保护与数据安全的重大风险,必须加以规范与限制。无论是国际还是国内,日趋严格的“数据安全法”“信息保护法案”不断出台,在客观上增加了数据流通的成本,降低了数据综合利用的效率;而大数据价值的精确计量计价也难以实现,不能有效体现数据弊李的资产属性。如何兼顾发展与安全,平衡效率与风险,准确衡量价值,是全世界在大数据治理中一直面临的共同课题,也导致规范高效的数据流通市场始终未能形成。
而中央的《2020数据要素意见》,首次明确了培育数据要素市场的目标和定位,随之有关数据安全、信息保护的法案以及技术系列标准等相继发布,为促进数据流通规范化运作提供了政策制度基础;同时,“数据可用不可见、用途可控可计量”的隐私安全计算技术与创新模式也蓬勃发展并成熟起来,为解决隐私安全问题及数据资产化提供了坚实的技术基础。因此,自2020年至今,以租此迟新兴技术驱动“数据使用价值流通”新模式的数据要素流通市场迎来“第二次浪潮”,新一轮建设再次启动,全国一年来共有6家新型数据资产交易中心开始筹备建设,其中北数所等2家新型示范已正式投入运营。隐私安全计算技术采用数据不动、算法流动的策略,在数据不出域的情况下,安全地达到数据跨域联合计算的目的。虽然目前该组技术的成熟度与标准化程度还有待提高,在相当范围内也有炒作的成份,但在强烈需求与趋势的驱动下,发展很快,前景极为可期。
应该可以看到:采用“数据使用权”而不是“所有权”交易实现跨域流通,对数据访问按量计价的新模式同时也给云原生数据库服务带来新的商业发展契机,原因很简单:数据库本身就是以提供数据使用服务为天职的!
仔细调研与分析还会发现,当前政府主导的新型数据资产交易所对“数据使用权”流通模式的尝试,基本还在“雷声大,雨点小”的阶段,至今实效依然甚微!这除了可能还需要一定的市场培育周期以外,本文认为一个最重要的原因是:凭空而生的数据交易所,并没有直接沉淀客户数据的条件,运营只能靠“借鸡生蛋”,而正在发生的事实也正是如此:大都以授权政府数据公开运营为起点,然后大力“邀请”各种数据资源拥有者上平台,培育数据流通生态圈。然而,多数情况下,一是静态政务数据的实用价值很有限(例如对金融风控),二是真正有价值的产业活数据与公民行为数据拥有者(在其自有数据库中)上交易平台的程序非常繁杂,意愿较低......。同时,现阶段在技术体系上,新型交易所主要依赖隐私计算,对数据库总体采用松散繁杂的集成方案对接,就是说,目前还没有系统重视数据库的技术定位。
本文认为,首先,从技术上讲,云原生数据库融入隐私安全计算甚至更广泛的跨域安全计算手段,并没有太大的瓶颈,还可以方便地承担可信安全中介的角色,却会赋予数据资源拥有者最便利的“数据使用权”共享能力。更重要的是,当云计算环境下的数据服务平台化成为全球化趋势后,全 社会 范围内大多数的数据库服务都将由云原生数据库平台运营者所承担,它就自然建立了最广泛丰富的“数据流通生态圈”,天然拥有提供“数据跨域流通互联”服务的各种有利条件。而云原生数据流通显然是目前数据要素市场化领域需求与商业前景最为强烈的可运营业务之一,如果云原生数据库服务运营者借其固有优势,同时运营数据要素流通业务,必将在技术效能与商业模式上超越现存的各种模式,对政府主导、靠“借鸡生蛋”现有市场带来巨大的挑战,甚至是终结。
进一步讲,这种能力的提供,不仅可以最大限度地挖掘与发挥数据要素的价值与红利,还可以极大地加速各行业、各组织对云原生数据库平台服务的消费需求,两种因素又会相互促进,从而使云原生数据库服务成为将来数据要素市场化的新标准,自然进化为新一代互联网基础设施“数联网”本身。
NewSQL分布式数据库发展策略讨论
作者 石默研
本文对新一代NewSQL分布式数据库发展策略中的普遍困扰进行讨论,包括云原生(Cloud Native)与本地部署(On Premise)、HTAP进展方向、分布式与单机需求等分布式数据库商业与技术发展中难以决策的问题。
1. 困扰
分布式NewSQL数据库近年来蓬勃兴起,其原因显而易见:切中了业务与数据量不断增长的用户对关系型数据库RDBMS需求,这在传统RDBMS到大数据的发展阶段中,有相当一段时间是空白。同时,随着互联网技术的不断发展与普及,用云计算模式满足IT需求似乎已经成为未来 社会 产业互联网发展的明确趋势,也就是说,有一种共识:不久的将来,绝大多数产业的IT服务是从公共的、行业的或者私有的、混合的云计算中心提供的。这一共识又带来了云原生(Cloud Native)概念与技术的兴起,而分布式NewSQL数据库自然也应该是云原生的,这决定了其相当多的产品设计决策应以符合这一趋势为原则。然而,在当今的现实中,满足业务与数据量不断增长的RDBMS需求的用户,与云原生的用户,除了互联网企业外,大多数情况下,并不重合,需要On-Premise部署的用户仍然占有很大比重,这就带来了第一个困扰:云原生(Cloud Native)与本地部署(On Premise)对产品发展要求的矛盾。
另一个困扰,是关于HTAP,即交易与分析混合负载。HTAP是当今非常火的一个概念与技术,在交易库上直接进行分析,而不再是将“数据从交易库搬下来,挪到另一个数据库中去”这样的繁琐过程。可以毫不夸张的说: 历史 上规模性企业IT复杂度的相当一部分,都来自于“搬数据”,这导致了数据采集、实时采集、全增量合并、数据传输、数据加载、数据建模、数据质量、数据标准、企业级元数据管理等繁杂多样的技术环节的产生,导致了企业数据分布、数据流向、数据模型、主数据、基础数据平台、ODS/数据仓库/数据集市、数据治理等复杂的数据架构设计优化领域,导致了由于多系统大规模数据搬迁而带来的如数据交换平台之类的复杂调度工程......。咋眼一看,感觉该企业的数据技术好厉害,相关各领域的技术产品好丰富,技术人员的相关技能也好受欢迎。但如果在交易迟核宏库就能直接满足分析需求而不影响生产效能的话,这些复杂高级的技术环节不都成了“自己给自己造了一座山,还说自己爬的好辛苦”?然而,现实却是,问题并不这么简单,除了在交易库中进行分析会影响业务效能外,还有很多原因导致这一现象产生:交易库并不需要存储那么长的 历史 数据,而分析往往是需要建立在大量 历史 数据之上的;交易库的模型往往并不适合分析需求,多码册数情况下需要重要建模,如非常流行且价值不菲的各行业数仓主题模型;用于交易的OLTP数据库与用于分析的OLAP数据库,其技术体系完全不同;以及大型企业已固化的内部业务结构并没有留给交易/分析整合可实施的可行空间......等等。由于, 历史 积累的企业级数据体系相当复杂,HTAP的发明者迄今为止都没有系统表达完全替代数据分析需求、自顶而下重构企业数据体系的架构级策略,而是将产品重点定位在技术优化层面:在交易库上直接完成实时统计分析,满足高并发需求且不影响业务效能;或者是为实时分析统计/查询而建设的数据服务中间平台。然而,即使是暂时没有这种策略性的意向,在面向AP的产品具体研发中,又会发现明确的界限确实不好把握,随着一个个具体功能的不断完善,似乎假以时日,技术上也不是没有完全替代纯OLAP平台的可能性。那么,HTAP究竟如何定位呢?
再者就是规模化的分布式需求,与小规模的单机数据库需求(这里指逻辑上的单机)之间的矛盾:分布式数据库,自然而然是要应对规模化的数据管理需求的,长尾的小规模需求当然不应在产品设计考虑之列,同时,大炮轰苍蝇经常还打不好;然而,分布式NewSQL数据库又应该是云原生的,如果把云原生的业务含义理解为“全自助”,它应该以支持什么样的需求为主呢?现实看来,小规模长尾业务对云氏并原生数据库的需求最起码应该是占据相当大的比重的。显而易见,如果是大规模的数据管理需求,即使是部署在云上,DBPaaS的“全自助”是其核心需求吗?这种规模化的业务,如果是云上的On-Premise又需要做出哪些方面的改变?从互联网与云计算发展的 历史 来看,“云自助”,其最核心的商业动机当然包括给用户侧的运维带来了方便,但更重要的可能是给云服务运营商应对海量长尾客户的安装与运维带来了极大的成本优势。这正如银行的小微及个人消费贷款都要走互联网线上模式,而重客、大客甚至中小企业信贷仍然是以线下为主的策略一样,本质是成本问题,而不是客户方便性问题。于是,矛盾显而易见:分布式是面向规模客户的,起码是中、大型客户,而云原生却有可能、最起码相当一段时间内是要以长尾客户为主要服务对象的。
以上困扰实质上,都涉及到了NewSQL分布式数据库的产品发展策略问题。
2. 讨论
问题是客观而又普遍的,但分析与应对策略往往包含主观因素:人们的一个决定与决策,很多情况下并不由严格推理而来,而是心中已经有一个答案,再来找理由支持它。这里的讨论或许也并不能例外。
首先,来看看Cloud Native与On Premise。云原生本应是数据库即服务,然而目前真正有规模化数据增长需求的NewSQL应用相当多的情况下却是付费On Premise与免费On Premise区别,很多互联网企业的应用也可能只是部署在云基础设施上而已,真正的云原生更多是一些实验性、尝试性的需求。但云原生数据库在公有云、行业云以及大型私有云上已经逐渐在形成一种意识上的共识,其商业前景不可限量。也就是说,未来的数字化转型进程中,产业互联网的数据库部署,会逐渐向云基础设施迁移,长在云上。它可能是公有云,也可能是行业云,也可能是私有云,它们都是被定义为云原生NewSQL数据库的市场范围。当然,肯定还会有相当一部分数据库长在云下,这也不用纠结,将其排除在云原生市场战略目标之外即可,就是说,不需要考虑这部分客户需求对产品规划的影响,因为前一部分的份额已经足够大了。这样看来,以云原生为目标进行产品规划的逻辑没有问题,不过,还是要明确一点:长在云上的数据库是不是一定符合我们对“云原生”的既有理解?这里认为,即使未来,在云上形成了产业互联网数据库市场的主体,需要“全自助”的数据库即服务可能也是以面向长尾客户最为迫切、必不可少并且是核心本质,而对中大型以上的需求,“全自助”的意义相对有限,同时比较而言商业模式的转变或者更关键些。那么,如果是以“长在云上”为市场目标,似乎可以将其定义为“广义的云原生”,同时,只要是“长在云上”,那么“云原生”概念中高弹性、高可用、低成本、快速迭代、存算分离等技术优势也都能方便获得。而对“云原生”策略中“云原生”一词的理解不同,对产品规划决策的影响也应该有所不同:一是目前被认为是On Premise的客户需求,或许也就是未来“云原生”主体市场的需求;二是NewSQL数据库关于云原生服务的产品策划,对用户侧“自助”水平的决策或许可以更灵活实用。高水平自助确实可以减轻客户对IT的依赖程度,但这里认为,云原生与用户自行在云上购买资源进行On-Premise部署相比,最关键的价值在于商业模式的改变,能自助多少,不一定是最重要的,因为成为云服务商后,运营运维的工作只会更多,责任可能会更大,甚至有时连IaaS的运维也需要PaaS服务商兜底。但从一个个客户的本地服务,变成集中化云服务,就已经是本质性的模式转变了。总之,需要就事论事,回到原点,仔细分析后决策,而不是用概念教条的判断,因为概念本身的定义并不见得准确对应实际的业务需求。
再来看看HTAP,对这个问题,正如在其它文章中表达过的一样,本文的观点较为明确。一是随着计算能力与架构的升级,从技术上讲,AP与TP的界限会越来越模糊;另外特别是在云原生的新世界里,数据库的这一特性又犹为重要,因为云原生的重要作用之一就是要让客户尽量摆脱对IT运维的依赖,将越来越多的精力集中到自己的业务发展上来;同时端到端的能力提升对云原生商业模式的贯彻也至关重要(需要仔细分析下目前DBPaaS的技术要求是否完全符合这一原点的、本质性的动力),过去与纯OLAP数据库的优势比较纠结在这里也可以得到正面支持;再者,既然架构上已经走向了AP,就很难做到在产品规划上时刻厘清纯AP与混合负载的需求后,再将前者排除在外。于是,以“混合负载满足部分AP需求”应该是由于投入与阶段性市场策略导致的阶段性产品规划,而长远来讲,以一套技术架构满足大多数需求,应该是云原生NewSQL数据库的追求。
接下来,就是关于规模化分布式与小规模单机需求的矛盾了。现在看来,经过上面的讨论,这一点已经不是什么问题了:因为“长在云上”、从分散服务向集中服务的商业模式转变就是指广义的云原生,而不一定要以小微的、迫切需要全自助的长尾为主流,那么,云原生NewSQL数据库仍然应以规模化分布式为其主体的需求方向,而小规模单机则暂时可以不做为重点来考虑。
最后指出一点,希望也能引发进一步的思考:我们所批判的主机,也声称自己是分布式架构,暂且不论其是否客观,但在现实中主机需要被替代的核心问题并不是有没有分布式,而是:一、扩展不灵活带来成本问题:“我只需要扩展一个节点,你却让我再买一台主机”;二、不自主可控;三、往往是软硬件结合的设计策略,包括内存、网络、存储与IO上的软硬融合设计,而这一点,是否需要云原生数据库从广义的定义出发进行学习参考,也是需要进一步讨论的。
云原生应用是什么?它的特点有哪些?
云并非把原先在物理服务器上跑的东西放到虚拟机里跑,真正的云化不仅是基础设施和平台的事情,应用也要做出改变,改变传统的做法,实现云化的应用——应用的架构、应用的开发方式、应用部署和维护技术都要做出改变,真正的发挥云的弹性、动态调度、自动伸缩??一些传统IT所不具备的能力。这里说的“云化的应用”也就是“云原生应用”。云原生架构和云原生应用所涉及的技术很多,如容器技术、微服务等,
而云原生应用最大的特点就是可以迅速部署新业务。在企业里,提烂棚供新的应用程序环境及部署软件新版本通常所需时间以日、周甚至以月计算。这种速度严重限制了软件发布所能承受的风险,因为犯错及改错也需要花费同样的时间成本,竞争优势就会由此产生。
所以云原生不是一个产品,而是一套技术体系和一套方法论,而数字化转型是思想先行,从内到外的整体变革。云原生包括DevOps、持续交付、微服务、敏捷基础设施、康威定律等,以及根据商业能力对公司进行重组的能力,既包含碧孙技术、也包含管理,可以说是一系列云技术和企业管理方法的集合,通过实践及与其他工具相结合更好地帮助用户实现数字化转型。
CNCF(云原生计算基金会)认为云原生系统需包含的属性:
1、容器化封装:以容器为基础,提高整体开发水平,形悔历链成代码和组件重用,简化云原生应用程序的维护。在容器中运行应用程序和进程,并作为应用程序部署的独立单元,实现高水平资源隔离。
2、自动化管理:统一调度和管理中心,从根本上提高系统和资源利用率,同时降低运维成本。
3、面向微服务:通过松耦合方式,提升应用程序的整体敏捷性和可维护性。
如何来提高云原生数据的安全性?
限制访问
那些需要访问有价值数据的人员需要安置在更安全的环境下,并经过游告乎适当地培训,谨防留下错误的入口给系统的入侵者。这些工作人员需要接受专神悉业的训练一来确保这一事件发生的可能性降为最低,而且那些需要访问的数据要时刻进行监测。
高风险友脊数据
如果有些数据是高利的数据,如金融或会计数据,那么就要额外注意确保它有更高级别的保护措施。提升加密的水平以及增加数据监测量可以保护数据达到期望的水平。
注意设备的安全性
限制访问数据集的某些部分不应该是大范下的,而且还要检查用于访问数据的平台。有些移动应用可以很容易管理,这意味着仍然要隐藏某些高风险的数据,从而减少相关的风险。
满足用户需求
同样地,高风险数据可能已经被保护起来了,但它也可以限制可用的人员,以及可用的地方。这说明安全位置上的保护可以相对的少些,这样安全漏洞就会少。现在随着如金融方面的事情也在去中处理,安全事务变得越来越重要。完全保护系统不受所有攻击是不可能的,采取措施降低这一风险才是最先需要做的一步。
对话阿里云李飞飞:关于云原生数据库的五大预判
作者:王慧贤
数据存储、数据分析、数据安全......如今,围绕“数据”的话题越来越多,离人们的生活也越来越近。
从陌生到熟悉,数据不仅“出圈”,甚至已然站在了C位。去年,中央发布的《关于构建更加完善的要素市场化配置体制机制的意见》中明确表示,继土地、劳动力、资本、技术后,数据成为第五大生产要素。
步入信息化时代后,数据库、操作系统与中间件作为计算机最基础的三大软件,支撑着企业的正常运行。
当数据成为生产要素后,必然会迎来爆发式增长,企业的数据存储和处理需求将进一步释放。更重要的是,疫情加快了数字化转型的脚步,更加速了企业的上云速度。
从信息化到数字化,时代的变革,总会带来商业世界的变化。如何在云原生架构下使用数据库,成为企业的痛点和云厂商的机会,亚马逊AWS的CTO Werner Vogels曾多次强调:“数据库是云计算的终极之战。”
在数智化时代,云原生到底意味着什么?云原生数据库和传统数据库相比,核心优势是什么?是否把数据库搬上云就是云原生?基于这些问题,雷锋网与阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞展开一场对话。
国产云原生数据库,摆脱「切肤之痛」
如今,数据库的商业世界,因为云的出现与发展,分成了两大派系。
一派是以Oracle为代表的传统商用数据库,一派是以国外AWS、国内阿里云为代表的云原生数据库,去“IOE革命”下的产物。
其实,早期较为火热的数据库种类有三种,层次式数据库、网络式数据库和关系型数据库。
在《浪潮之巅》一书中,作者吴军写下了这样的观点:“Oracle 的兴起很大程度上靠的是它最早看到关系型数据库的市场前景,并且在商业模式上优于 IBM。”
因此,在云原生数据库“入世”之前,数据库的天下一直是Oracle的,国内大部分互联网公司都不得不采用Oracle+IBM小型机+EMC的模式来维持正常运营。
高昂的费用,使得对于数据库需求较大的互联网巨头“忍无可忍”。
2009年,阿里巴巴的Oracle RAC 集群节点数达到了创记录的20个。可由于Oracle并没有弹性扩展的功能,只能按照峰值流量购买小型机和数据库,导致阿里将业务上涨带来的大部分利伏局润,都支付给了Oracle。
第二年,阿里便开始走上了去“IOE”之路,根据开源MySQL搭建了AliSQL,缺扮让并顺利缺顷经过了淘宝双11的考验,国产云原生数据库算是正式摆脱了“切肤之痛”,逐渐受到市场的真正认可。
另一边,国外的AWS在2015年公布了基于云计算的自研数据库Amazon Aurora。Aurora是一个关系型数据库,可以跨3个可用区域复制6份数据,其最大的特性就是高性能和高可用性。
云计算巨头的入局,让云原生数据库在国内外一步步成为主流。据Gartner预测,到了2021年,云数据库在整个数据库市场中的占比将首次达到50%,到2023年,75%的数据库都要跑在云平台之上。
关于云原生数据库,随着逐步的出圈,也让人们关心的焦点从“是啥?”转变为“还能解决哪些问题?”
但云原生数据库存在着数据孤岛的问题,无法打通多个数据系统的情况下,企业在数据加工和数据管理上就会“压力较大”,甚至在数据安全方面还存在隐患。
传统数据仓库一般基于T+1数据集成构建离线数仓,以支撑企业各项分析与服务。传统方案不但会影响线上业务稳定性,且难以支持企业的实时需求。
因此,在李飞飞看来,云原生数据库已经走到2.0阶段。这个阶段要解决的问题,就是上述存在的痛点。
9月26日,在阿里云数据库创新上云峰会上,阿里云发布了首个一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB(简称:ADB),实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,使企业的在线数据可以释放出更大的价值。
相较于传统方案,阿里云一站式敏捷数据仓库解决方案有4大核心优势:
1、对业务侧影响小,不会因为数据汇聚集中和实时加工影响业务侧正常运行,CPU、内存占用低于5%;
2、事务顺序和数据准确性有保障,且处理链路短,支持在线数据实时处理落仓,效率更高。数据传输效率100m/s,数据延时在10秒内;
3、支持复杂实时数据加工、计算逻辑;
4、低代码操作,能够大大降低实时数仓的构建难度,提升构建效率的同时,支撑企业数字化转型过程中的各类实时场景。
除了实时统计分析场景外,企业为满足周期性数据分析需求,需建设周期性全量快照。
传统数仓的周期性全量集成方案会对生产业务造成稳定性影响、全量集成时效性差、且无法满足客户针对任意时间点进行数据回溯的业务诉求。
针对T+1周期性集成场景,一站式敏捷数据仓库解决方案支持基于拉链表的T+1全量数据快照,用户通过简单几个步骤,即可按需生成各种周期的全量或增量快照。
此外,业务还可按需进行任意时间点的数据回溯,以快速解决数据异常问题。
谈起未来数据库的发展趋势,李飞飞提到以下五点:
1、云原生+分布式一定是数据库的标配,分布式已经是必选项。分布式数据库由多个相互连接的数据库组合而成,面向用户则是以单个数据库的形态出现。云原生分布式数据库具备易用性、高扩展性、快速迭代、节约成本等特征,从资源池化到弹性扩展,再到智能运维,再到离在线一体化,解决企业用户的核心诉求。
2、AI for DB(database,指数据库)和 DB for AI 将是主流趋势。用AI将数据库运维管控智能化,尤其在云原生+分布式这个前提下更重要,因为数据库不仅是内核的能力弹性高可用、可拓展性,更重要的是部署后应用和运维的复杂度要大大降低。在数据库里,面对越来越多非结构化的数据,分析能力十分重要。
3、数据的安全可信,在今天这个大环境下变得愈发重要,如何确保整个数据库系统,在处理数据全链路过程中提供加密能力、多方安全计算能力、隐私保护的能力,也是很重要的趋势。
4、多模数据处理能力将越来越重要。比如,新型数据库多模态的处理能力,在新能源 汽车 企业打标签、智能电池化预测等应用场景中,将发挥越来越重要的作用。
5、一份数据,多个数据处理引擎:实现仓库一体、仓库联动、仓库打通,数据之间无缝流转。
以上判断,也从侧面反映出阿里云数据库的走向,这点毋庸置疑。但除此之外,业界最关心的,还有开源。
近半年,国内很多厂商相继提出开源战略,背后缘由显而易见,为了打造生态。就在今年的阿里云峰会上,阿里云智能总裁、达摩院院长张建锋(花名行癫)将2021年阿里云的发展关键词归纳为:做好服务、做深基础、做厚中台、做强生态。
做好服务与生态,成为如今厂商们不约而同的目标,而开源,就是最好的选择。
当雷锋网问到:“未来,阿里云数据库会不会把所有能力都开源?”这一问题时,李飞飞给到的回答是:“不会。”
之所以有这样的回答,是因为对于开源,他有着一些判断和看法。
李飞飞表示,这些部分,本就是阿里云数据库的商业化版本。
事实上,业界大多数的数据库厂商都不会针对自身的核心能力开源,如TiDB的核心管控组件、TiFlash。
与像MongoDB,、Cassandra、CouchDB这些以开源起家的数据库厂商不同,开源只是阿里云数据库的战略,不是阿里云数据库的命脉。
前几年,有业内人士表示,在面向开源时,国产数据库首先需要解决信任以及开源知识产权等问题。“开源会让厂商更加认真思考版权还有专利的问题,事实上,选择开源后,对于数据库厂商提出了更高的要求。”
李飞飞认为,开源只是一种选择,数据库开源成功并不代表着商业化就能够成功,不开源也不能代表厂商不先进。
更准确的说,开源只是一种有效手段。
最终,阿里云数据库希望客户能够通过开源版本把阿里云数据库产品技术快速用起来,并能够参与到技术产品的迭代过程中,在一些高阶能力上,借鉴团队专业能力和阿里云的服务能力,成为良好的商业合作伙伴,这是李飞飞以及阿里云数据库对于开源的一些基本思考。雷锋网雷锋网雷锋网
发表评论
暂时没有评论,来抢沙发吧~