NewSQL概念几乎是紧跟着NoSQL之后变得火热的。Google Bigtable与AWS Dynamo奠定了NoSQL技术的根基,而Google Spanner&F1则***了NewSQL技术的发展。本文首先探讨NoSQL与NewSQL的概念与范畴,随后结合一些业界观点以及两者之间的优缺点对比,来论述各自的适用场景以及未来的演变趋势。
成都创新互联公司是一家企业级云计算解决方案提供商,超15年IDC数据中心运营经验。主营GPU显卡服务器,站群服务器,雅安机房托管,海外高防服务器,大带宽服务器,动态拨号VPS,海外云手机,海外云服务器,海外服务器租用托管等。
NoSQL
众所周知,NoSQL已是一个很广泛的概念。现在被大家所广泛认知的NoSQL一词,源自2009年在San Francisco举办的一次Meetup,该Meetup的描述信息如此阐述:
This meetup is about “open source, distributed, non relational databases”. Have you run into limitations with traditional relational databases? Don’t mind trading a query language for scalability? Or perhaps you just like shiny new things to try out? Either way this meetup is for you.
传统的RDBMS在Scalability能力上的受限,是促使NoSQL技术出现的一个关键因素。在这次Meetup的主题中,涉及到了Cassandra、HBase、MongoDB、CouchDB、HyperTable等开源技术,而该Meetup描述信息中所提及的“open source, distributed, non relational databases”为NoSQL技术给出了精炼的描述。彼时,SQL几乎是RDBMS的代名词,自然而言的,Non-SQL也成了Non-Relational的代名词。
随着近些年的快速发展,SQL已经逐步被应用在了更广泛的领域,因此,SQL已不再是RDBMS的专属特征,NoSQL技术体系中也引入了SQL能力,因此而演变出来的Not-Only-SQL的概念,虽有自圆其说之嫌,但的确给出了更合理的解读。无论如何,“open source, distributed, non relational databases“关于大多数NoSQL技术边界的定义,也依然是合理的,只是,“open source”是一个可选特征,而“distributed”以及“non relational”却是典型NoSQL技术的基本特征。大多数NoSQL技术,弱化了对ACID语义以及复杂关联查询的支持,采用了更加简洁或更加专业的数据模型,优化了读写路径,从而能够换取更高的读写性能。
NewSQL
NewSQL可以说是传统的RDBMS与NoSQL技术结合之下的产物,如下是Wiki中为NewSQL给出的定义:
NewSQLis a class of modern relational database management systems that seek to provide the same scalable performance of NoSQL systems for online transaction processing (OLTP) read-write workloads while still maintaining the ACID guarantees of a traditional database system.
因此,可以将典型NewSQL技术理解成分布式关系型数据库,能够支持分布式事务是一个基本前提。NoSQL与NewSQL在技术栈上有很多重叠,但在是否支持关系型模型及对复杂事务的支持力度上是存在明显区别的。某些地方也将NewSQL划在Not-Only-SQL的范畴之内,即NewSQL技术也被纳入到NoSQL概念体系中,该说法虽也合理,但使得NoSQL一词过于泛化。
业界观点
近期,Timescale DB的联合创始人Ajay Kulkarni曾经发表过如下一篇文章:
“Why SQL is beating NoSQL, and what this means for the future of data”
文章标题话题感十足,主要观点总结如下:
关于这篇文章的这几个主要观点,笔者是完全认可的,但完全不认可标题中所给出的误导性内容,SQL的回归并不意味着NoSQL技术将会被完全取代,正如下面一篇文章中关于Ajay Kulkarni观点的评论:
“SQL is not beating NoSQL. NoSQL is evolving”
The analysis was mostly agreeable, except for one major flaw. It is not SQL which is making a comeback, its NoSQL which is morphing into providing a familiar interface.
SQL的回归,恰恰是NoSQL技术在不断演进的结果。
技术分类法
在探讨一个分布式存储技术时,简单的将其归类为NoSQL或者NewSQL是不合理的,像Bigtable/HBase/Dynamo是典型NoSQL技术,而Spanner/CockroachDB以及国内的TiDB,可以将其归类为典型NewSQL技术,但像Kudu,它本身的存储引擎层是典型NoSQL技术,而在此基础上提供了完善的SQL能力以及复杂的事务支持,因此,它兼顾了NoSQL与NewSQL的很多特征,更像是集两者于一身的技术。
因此,非NoSQL即NewSQL的简单二分法是不合理的,很多技术都在将两者进行不断的融合,至于这个合理的平衡点在哪里,要取决于这个分布式存储技术要解决的核心问题是什么。
当我们谈论NoSQL,更多的是在谈论一种分布式、非关系型数据存储技术,而谈起NewSQL,更多可能是在讨论一种分布式关系型数据库技术。当用NoSQL或者NewSQL来为一个技术进行归类时,更多考虑的可能是该技术更像什么,例如,如果提供了标准SQL接口以及复杂事务能力,优先使用NewSQL一词来描述是更加贴切的,但该技术幕后的存储引擎,也许是基于NoSQL技术实现的。
***的总结
在阐述了NoSQL与NewSQL的概念以及两者的范畴之后,再回到本文标题中所提出来的***,该***似乎成了一个伪***,因为两者也都在慢慢演进/融合。所以,对该***存在疑惑的人,更多是针对如下***:
分布式关系型数据库技术是否会取代分布式非关系型数据存储技术?
分布式关系型数据库技术在分布式事务以及关系型模型上的强化,导致在数据吞吐量/并发能力上的弱化。借助NuoDB官方提供的一个NuoDB与Spanner/Cockroach的benchmark对比结果(“Benchmarking Google Cloud Spanner, CockroachDB, and NuoDB”)来进一步说明该观点:
NewSQL Benchmark
上图中的Workload定义:
A – Heavy update (50% read, 50% update) B – Mostly read (95% read, 5% update) C – Read-only (100% read) D – Read the latest inserted (90% read, 10% insert) E – Scan the latest inserted (90% read, 10% insert) F – Read-modify-write (50% read, 50% update)
可以看出,无论哪种Workload下,Spaner与CockroachDB的Throughput都是很低的。尽管NuoDB也可以归类到 NewSQL的范畴中,但它也大量借鉴了NoSQL技术,将事务机制与持久化机制分层处理以及更好的利用缓存技术是性能取得质的提升的关键。上图中部分Workload中,NuoDB的Throughput几乎达到了主流 NoSQL技术的Throughtput水准,但还是可以看出,当读写比例相当或者写多读少的场景下,NuoDB的Throughput较之主流的NoSQL技术存在明显的差距。
因此,分布式关系型数据库技术与分布式非关系型数据存储技术依然是针对不同的应用场景的,前者主要还是针对传统RDBMS的部分应用场景,而分布式非关系型数据存储技术,则更适合高吞吐、高并发的新兴应用场景。随着物联网、车联网的不断普及,分布式非关系型数据存储(NoSQL)技术也会带来更大的价值。两者还会走向进一步的融合,也会看到更彻底的分离。
标题名称:NewSQL会是NoSQL的取代者吗?
网页网址:http://www.csdahua.cn/qtweb/news9/233009.html
网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网