热门关键词:

大数据NoSQL资料库Scylla Open Source 3.0释出比Cassandra大10倍

01-20
01-20,数码大数据NoSQL资料库Scylla Open Source 3.0释出比Cassandra大10倍最新消息报导,手机发烧友数码

终于迎来了Scylla Open Source 3.0的更新,更新的内容有很多,加入了能加速查询的物化检视与全域辅助索引功能,还支援新的储存格式提高储存空间使用效率。下面就一起来看一下吧。

开源NoSQL资料库Scylla Open Source释出第3个主要版本更新,这个版本提高了查询效率并减少储存的容量需求,尽可能降低维修时间,同时也还加强了整体资料库的执行效率,官方表示, Scylla是目前效能最高的NoSQL资料库,包括部署于生产环境的Apache Cassandra都不是对手。

 

2015年发展至今,以C++从头打造的开源NoSQL资料库Scylla,其基础设计与Apache Cassandra资料库相容,并提供相同的横向扩展和容错能力,但官方提到,其吞吐量可以是Apache Cassandra的10倍,并维持一致且个位数毫秒的延迟时间。

 

Scylla Open Source 3.0加入了物化检视(Materialized Views)功能,将不同磁区找寻资料的复杂性,从应用程式移到伺服器上,因此实作将会更快也更可靠,这个方法让应用程式更容易对资料进行多重检视。物化检视让应用程式只需要宣告额外的检视,Scylla会产生新的检视表格,并且在每一次更新基础表格(Base table)时,检视表格也会随之自动更新,写入动作仅直接发生在基础表格上,而读取动作则是对检视表格。官方提到,一如往常的Scylla与Apache Cassandra版本相容,包括这项功能更新与CQL语法。

 

另外,Scylla Open Source 3.0也新增了已可用于生产的全域辅助索引(Global Secondary Indexes)功能,能够扩展至任何大小的分散式丛集。全域辅助索引利用低阶的物化检视索引,以使索引不相依于丛集节点数。而辅助索引对大部分应用程式来说是可见的,因此查询能够存取表格中的所有栏位,使用者可以在不更改应用程式的情况下,新增或是删除索引。

 

官方提到,辅助索引或物化检视的使用时机,取决于应用程式的需求,当开发者要求高效能并且需要对特定栏位集进行查询,则需要使用物化检视。然而,如果应用程式需要查询不同的栏位集,辅助索引就会是更好的选择,因为可以根据应用程式的需求,以较少的储存成本移除和增加查询索引。

 

这个版本还支援了新的高效能储存格式SSTable,该格式与Apache Cassandra 3.x相容,同时也与先前Scylla版本向后相容,而且少掉了复制作业中不需要的重复资料,能最多减少3倍储存容量。官方提到,新部署的Scylla Open Source 3.0资料库将自动使用新格式,而既存档案不受影响。

 

另外,Hinted Handoff功能则可以帮助节点因大量写入负载、硬体故障或是任何因素造成暂时无法回应的情况,当发生短暂网路问题或是节点重启的时候,Hinted Handoff将能帮助减少系统修复的时间,进而提升分散式部署的整体效能。

 

官方解释,提示(Hint)代表着写入请求的纪录,这分纪录会由协调器留存,直到故障节点再次连上线。而且当写入成功但一个或多个副本皆无法确认的时候,Scylla会也会产生一个提示,在这些节点恢复时,重新写入资料。这个功能在Scylla Open Source 2.1中属实验性质,而在Scylla Open Source 3.0终于正式加入了。

 

在整体执行效能方面,Scylla Open Source 3.0也改进了多重磁区扫描,Scylla透过扩展有状态分页以支援范围扫描,在新版本中加入了新的控制演算法,加速从所有分片读取范围中的所有资料,这些分片快取了分片上的中介串流,并将分页查询引导到先前使用的配对快取结果上。简单来说,新演算法的本质是一个多工器,在分片上结合读取器输出到单一串流中。

  • 赞助商广告