一.Strata+Hadoop World(SHW)大会
是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会,还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。
二.Hadoop
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
三.Spark
Spark是继Hadoop之后的新一代大数据分布式处理框架,由UC Berkeley的Matei Zaharia主导开发。
Spark和Hadoop有什么不同呢?
1.Spark的中间数据放到内存中,对于迭代运算效率比较高
2.Spark比Hadoop更通用
3.容错性
4.关于Spark和Hadoop的融合
不知道Apache基金会的人怎么想的,我看Spark还是应该融入到Hadoop生态系统中。从Hadoop 0.23把MapReduce做成了库,看出Hadoop的目标是要支持包括MapReduce在内的更多的并行计算模型,比如MPI,Spark等。毕竟现在Hadoop的单节点CPU利用率并不高,那么假如这种迭代密集型运算是和现有平台的互补。同时,这对资源调度系统就提出了更高的要求。有关资源调度方面,UC Berkeley貌似也在做一个Mesos的东西,还用了Linux container,统一调度Hadoop和其他应用模型。
来源:http://tech.it168.com/a2012/0401/1333/000001333287.shtml
四.MemSQL
MemSQL是一款内存数据库,它通过将数据存在内存中,将SQL语句预编译为C++而获得极速的执行效率。MemSQL宣称这是世界上最快的分布式关系型数据库,兼容MySQL但快30倍,能实现每秒150万次事务。
MemSQL由前Facebook工程师Eric Frenkiel和微软SQL Server高级工程师Nikita Shamgunov(CTO)联合创办,MemSQL的高性能数据库还参照了Facebook的脚本,有着强烈的Facebook印记。在2011年7月,MemSQL获得了Ashton Kutcher、SV Angel、Paul Buchheit以及New Enterprise Associates等14家风投的青睐,融资210万美元。仅一年以后又再次获得了IA Ventures和Digital Sky Technologies两家共计300万美元的风险投资。
从MemSQL官网上了解到,MemSQL具有以下几大特色:
1.无可比拟的效率:MemSQL执行效率比传统的基于磁盘的数据库要快30倍,它优于其他内存数据库,因为它将SQL语句预编译为C++。
2.强大的SQL执行能力:支持全功能的关系型数据库,开发者不必修改现有程序即可获得NoSQL键/值存储系统的效率。
3.横向和纵向扩展:MemSQL支持纵向扩展,CPU越好效率就越高;而且支持向多CPU扩展;此外,MemSQL还可与MySQL节点结合起来处理PB级的负载。
4.缺省支持数据持久性:MemSQL缺省支持数据从内存到磁盘/SSD的同步,保证数据的安全可靠。
5.简易安装:只需30秒即可完成安装并使用MemSQL,兼容MySQL,学习曲线平滑。
五.Snowflake
一款弹性的数据云服务平台,能够在一个系统内处理半结构化和结构化数据而不需要转换存储结构或者设置统一的操作模式。
PS:全局唯一ID生成服务snowflake
Twitter在把存储系统从MySQL迁移到Cassandra的过程中由于Cassandra没有顺序ID生成机制,于是自己开发了一套全局唯一ID生成服务:Snowflake。
1.41位的时间序列(精确到毫秒,41位的长度可以使用69年)
2.10位的机器标识(10位的长度最多支持部署1024个节点)
3.12位的计数顺序号(12位的计数顺序号支持每个节点每毫秒产生4096个ID序号)最高位是符号位,始终为0。
优点:高性能,低延迟;独立的应用;按时间有序。 缺点:需要独立的开发和部署,这个是php的实现。
六.Caspida
一款利用机器学习实现自动检测程序数据中的隐藏安全威胁的工具。
相关推荐
OSC源创会2016年终盛典(链家 杨永林).pptx
【标题】:“OSC源创会2016年终盛典-BrowningWan.pptx”是2016年开源中国(OSC)举办的年度盛会中,由Browning Wan进行的一场技术分享,主要聚焦在深度学习领域的最新进展,特别是图像处理方面的核心算法。...
OSC 杭州源创会PPT: 网易杭研 - 网易的那些开源项目,Tengine - 淘宝开源 Web 服务器,Cloud Foundry 开源 PaaS 平台,Cloudify-不需修改代码部署程序到云端,zlog - 纯 C 日志函数库
在2016年的OSC源创会年终盛典中,阴明可能分享了关于Vue.js 2.0的重要更新和特性。Vue.js的核心理念是通过简洁的API来实现MVVM(Model-View-ViewModel)模式,让开发者能够更高效地构建用户界面。 Vue.js 2.0 的...
【 OSC源创会2016年终盛典-蔡白银-1201.pptx 】这份文件聚焦于机器学习在房产领域的应用,由链家网的大数据架构师蔡白银进行分享。蔡白银,有着丰富的行业背景,曾任职于百度和NVIDIA,并且拥有北京大学的学术背景。...
在这个PDF文档中,杨晓峰专家可能会涵盖以下几个关键的新特性: 1. 模块系统(Project Jigsaw):这是JDK 9最重要的特性之一,它的目标是通过模块化来增强Java平台的可维护性、安全性和性能。模块系统引入了`module...
OpenStack是一个开源的云计算平台,主要用于构建私有云和公有云服务,提供基础设施即服务(IaaS)功能。在2016年的OpenStack年终盛典中,陈沙克分享了OpenStack在国内的发展情况和未来趋势。这一年,国内OpenStack...
4. osc-android-app:这是整个开源中国APP的主项目文件,包含所有必要的模块和组件,如用户界面、业务逻辑、网络请求等,开发者可以在此基础上进行二次开发或学习。 5. UmengShareLib:这可能是友盟分享库,友盟是...
开源中国社区 Android 客户端项目是一个专门为 Android 设备设计的应用程序,旨在为开发者和开源爱好者提供一个互动的平台,可以在这里浏览、分享和参与开源项目的讨论与开发。这个项目体现了Android应用程序的设计...
**标题解析:** "OSC.zip_osc" 这个标题暗示了我们正在处理一个与OSC(Open Sound Control)相关的程序或库,它被压缩在名为"OSC.zip"的文件中。OSC是一种通信协议,常用于实时互动软件,如音乐、视觉艺术和多媒体...
【标题】"oschina-iphone-app-master(开源中国).zip" 是一个包含了开源中国(OSC)iOS应用程序的源代码库。这个项目源自GitHub上的仓库,为开发者提供了深入研究和学习iOS应用开发的机会。 【描述】提到,这个源码...
"unity-osc-receiver-master"可能是一个开源的OSC接收器项目,用于处理从其他设备发送到Unity的OSC消息。 4. **设置OSC服务器和客户端**:在Unity中,开发者需要配置一个服务器来监听特定端口的OSC消息,同时在需要...
开源中国(OSChina)是国内领先的开源技术社区,致力于推广和使用开源软件。"oschina 开源中国客户端"指的是该社区开发的移动端应用,让用户能够方便地在Android设备上访问和参与开源中国的各项活动。"osc-android-...
OSC,全称Open Shopping Cart,是一种广泛使用的开源电子商务平台,它允许商家建立自己的在线商店,提供商品销售、订单处理等电子商务功能。这款平台以其灵活性、可扩展性和丰富的插件库而备受赞誉。CTUPAY则是针对...
"osc:开源中国应用程序代码"这个标题指的是开源中国(Open Source China)的源代码,它是一个专注于开源技术的社区平台,旨在推动中国开源软件的发展。开源中国的应用程序代码可能包括了社区论坛、项目托管、博客、...
开源中国(OpenSourceChina,简称OSC)作为国内知名的开源技术社区,也推出了针对Android平台的官方手机应用,旨在为开发者提供一个便捷、高效的信息获取与交流平台。本文将围绕"Android开源中国android手机应用最新...
Git 是一个开源的版本控制系统,广泛应用于软件开发、版本控制和协作开发中。IntelliJ 是一个集成开发环境(IDE),它支持多种编程语言和框架,包括 Java、Python、JavaScript 等。Git@OSC 是一个基于 Git 的版本...
**OSC协议介绍** OSC(Open Sound Control)是一种开放标准的通信协议,主要用于数字音频设备、音乐软件...在实际操作中,可能会涉及到网络连接稳定性、延迟优化以及错误处理等问题,这些都是确保控制效果的关键因素。
【标题】"osc-android-app2.0改动一下" 指的是开源中国(Open Source China)的Android应用程序的2.0版本进行了一些更新和优化,以便兼容Android Studio 1.3的Preview 2.0版本。这个过程通常涉及到对源代码的修改、...
使用试用版和轻量级许可时,可能会受到体积、运行时间和有效期等方面的限制。这些限制将在编辑器的调试窗口中列出。 #### 四、总结 OSC Reader插件是Quest3D中一个非常有用的工具,它使得开发者能够轻松地集成外部...