由于之前YunTable开发日记已经接近一些不优雅的数字,所以2011年直接从15开始,呵呵。
0.9版RC的发布
今天将正式对外发布YunTable0.9版RC(Release Candidate,发布候选版),大家可以通过“svn checkout http://yuntable.googlecode.com/svn/tags/YunTable_Release_0.9 yuntable-read-only”来获取0.9版RC代码,而过去的主干分支(Trunk)则被用于最新1.0版代码的开发,比较不稳定。另外具体的使用教程将马上向大家公布,尽情期待。
具体的新功能
和将来1.0版会关注分布式架构不同的是,0.9版则主要关注单机实现,下面是具体的特性列表:
-
加入Hotness特性:通过这个特性能够通过设置Hotness值来决定之前为了完成查询而读取到内存中的数据块(Data Block)的生存时间,假设如果是低延迟的情况,那么将Hotness值设置长一点,如果是海量数据,则相反,这样能使YunTable同时适应OLTP和OLAP这两种场景。
-
移出Column Family(列组):由于Column Family这个特性可以完全视为搜索等应用“度身定做”,所以它的普适性并不是很高,为了简化YunTable的架构,并提升YunTable的普适性,所以在0.9版将这个特性从现有的代码库中移出。
-
加入了日志功能:对于一个成熟的系统而言,日志功能是不可或缺的,当然对YunTable而言,也同样如此,所以在0.9版YunTable引入了这个特性。
-
完善异常处理功能:除了上面提到日志功能之外,在0.9版还完善了异常处理相关的代码,以确保当遇到大多数异常情况,系统能完善地处理,但避免不必要的崩溃。
-
加入了删除功能:除了日志之外,删除也是非常重要的,在0.9版中,这个功能也被引入,主要的实现机制是将带有删除标记的Item插入Region节点,来表明之前那些的Item已经被删除了,在之后查询的时候,会将这些带有删除标记的Item也从Region节点取出,之后在Client端进行Merge(合并)处理,这样能将那些已经删除的数据从结果集中移去。
-
自动化测试:在代码库中已经加入名为“testcase.sh“的自动化测试脚本,通过这个脚本能快速地验证代码的正确性,这样能极大地加快开发的进度,而且将来会进一步完善这个自动化测试脚本,来提升整个项目的质量。
-
增强了管理功能:为了便于今后的开发和管理,在0.9版中加入”Show“系列管理命令,通过这个命令不仅能得到Master节点的主要信息,比如,有哪些下属的Region节点和Table,而且能获得某一个Table的核心信息,比如,这个Table存储在那些Region节点和在Memstore中存储了多少Item等。
-
重构了代码:为了保证YunTable长远的发展,在0.9版,对部分模块进行了重构,虽然并没有涉及到全部,但是我们会保持边写边重构的好习惯。
-
解决很多之前版本存在的Bug:当然这个也是少不了的。
-
加入Apache2许可证:为了保证代码受到法律的保护,在0.9版中每个C源代码文件中加入了Apache2许可证,这样既鼓励大家在实际场景中使用YunTable,又保护了我们几个核心人员的版权。
今后的方向
关于将来的发展,主要有两步:首先是坚持当初YunTable是云时代的BigTable的思路,通过不断地开发、测试和完善,使得YunTable在今年年中能在性能和使用这方面接近甚至超越HBase,并且在整个业界的知名度方面也得到极大地提升;其次是提供SQL接口,由于现有的企业级应用都基于SQL接口,同时我们团队在开发YunEngine的时候积累了大量SQL语言的解析经验,所以将在今年为YunTable提供一个SQL接口,这样能让海量企业级应用轻松地从现有IT设施中迁移到云端,而且通过YunTable的SQL接口,将在保证高性能的情况下,轻松地扩展,并易于管理和降低成本,而这些是传统的关系型数据库所无法提供的。前面这些是初步的规划,具体里程碑表将在年后由我们核心团队谈论来确定。
社区的支持
现在的YunTable的社区正在蓬勃地发展中,到现在为止已有近100人加盟,社区的口号是“相互帮助,相互学习,一起把YunTable做好”,如果有读者想加入YunTable社区或者提交的Patch的话,请写信给我们的社区管理员Brooks(brooks.xi@gmail.com) ,到时他会邀请你正式加入的。
最后,我想代表我自己对每位YunTable成员表示感谢,并期待各位新成员的加入:)
分享到:
相关推荐
《云计算机YunTable 0.9源代码详解》 云计算机YunTable 0.9是一款基于云计算技术的数据处理和存储系统,它的源代码为我们提供了深入理解这一系统的绝佳机会。通过对源代码的分析,我们可以了解到云计算机的核心设计...
- **事件概述**:2011年9月13日,微软在加利福尼亚阿纳海姆会议中心举办的BUILD大会上发布了全新的Windows 8开发者预览版。 - **重要意义**:这次发布标志着Windows操作系统的一次重大变革,对于整个Windows平台乃至...
- **创新不断涌现**:在大数据的支持下,诸如Google这样的科技巨头能够通过挖掘数据之间的关联关系,开发出一系列创新产品和服务。 #### 三、大数据的好处 - **更多的发现**:企业可以通过大数据技术获取更多有关...
第三部分为实践篇,将选择云的核心模块之一——分布式数据库作为实践的方向,并以YunTable这个云时代的BigTable为例,给大家演示如何手动编写和设计一个分布式数据库;最后一部分为展望篇,预测了云计算和整个科技...
接下来,吴朱华详细介绍了几种内存计算技术,首先是TimesTen,这是一个优化内存的关系数据库,由Oracle公司开发。TimesTen能够在内存中管理数据,并优化数据结构和访问算法,实现极短的响应时间和极高的吞吐量。...
2. 统计分析:此阶段的重点是将前端收集的大量数据快速导入大型分布式数据库或存储集群,例如InfoBright、Hadoop(包括Pig和Hive)、YunTable、SAP Hana和Oracle Exadata。这些系统利用分布式计算技术,处理大规模...