资讯月刊下载
[行业应用] 使用SMACK堆栈进行快速数据分析
引用作者:马小龙,浙江财经大学数据分析和大数据计算的客座教授。2006年在德国不来梅大学获得数学博士学位后,在多特蒙德大学软件工程研究所从事研究和教学工作直到2011年来到中国。 本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅《程序员》 从大数据到快速数据 除了能够以批处理模式分析大型数据集之外,现代数据驱动型组织还需要尽快从所收集的数据中生成洞察,并最终采取行动。在这方面,传统的H ...
[互联网] 从应用到平台,云服务架构的演进过程
引用 声明:本文为《从程序员》8月期原创投稿文章,未经许可禁止任何形式的转载。 作者:秦鹏,MaxLeap服务与架构部负责人,负责公司云平台、云应用的后端研发和维护工作。多年分布式、高并发场景的实战经验;目前在分布式存储、缓存、中间件、容器技术、微服务、DevOPS等领域均有涉猎。毕业于上海交通大学,曾供职于SAP,后投身MaxLeap致力于为企业和开发者提供快稳定、可靠的云服务。 摘要:MaxL ...
[编程语言] Java程序员在用的大数据工具,MongoDB稳居第一
据日前的一则大数据工具使用情况调查,我们知道了Java程序猿最喜欢用的大数据工具。 问题:他们最近一年最喜欢用什么工具或者是框架? 受访者可以选择列表中的选项或者列出自己的,本文主要关心的是大数据工具。上一篇Java调查包括下列内容: 开发语言 Web框架 应用服务器 数据库工具 SQL数据 大数据 开发工具 云供应商 现在,来看看维基百科上对大数据的定义: 引用大数据,广义上来说是一组量很 ...
[互联网] 浅谈Spark应用程序的性能调优
Spark是基于内存的分布式计算引擎,以处理的高效和稳定著称。然而在实际的应用开发过程中,开发者还是会遇到种种问题,其中一大类就是和性能相关。在本文中,笔者将结合自身实践,谈谈如何尽可能地提高应用程序性能。 分布式计算引擎在调优方面有四个主要关注方向,分别是CPU、内存、网络开销和I/O,其具体调优目标如下: 1.提高CPU利用率。 2.避免OOM。 3.降低网络开销。 4.减少I/O操作。 第1 ...
[数据库] DB-Engines:Oracle是2015年度 DBMS
Oracle在2015年的DB-Engines排行榜上,相比于其他290个监控的系统都更受欢迎。所以,DB-Engines 宣布 Oracle 数据库是 2015 年度最棒的数据库管理系统。 今年年度DBMS的结果是根据2016 年1月份获得的分数减去2015年1月份的分数,而不是百分比。 年度 DBMS:Oracle Oracle 在过去 3 年的 DB-Engines 排行榜一直都是名列前 ...
[数据库] NoSQL数据库的分布式算法
系统的可扩展性是推动NoSQL运动发展的的主要理由,包含了分布式系统协调,故障转移,资源管理和许多其他特性。这么讲使得NoSQL听起来像是一个大筐,什么都能塞进去。尽管NoSQL运动并没有给分布式数据处理带来根本性的技术变革,但是依然引发了铺天盖地的关于各种协议和算法的研究以及实践。正是通过这些尝试逐渐总结出了一些行之有效的数据库构建方法。在这篇文章里,我将针对NoSQL数据库的分布式特点进行一些系 ...
[互联网] 今天上市价值45亿美元的GoDaddy是个什么样的公司
美国域名注册公司GoDaddy已经确定IPO(首次公开招股),招股价为每股20美元,高于此前每股17至19美元的区间。 照此计算,如果包含债务在内,GoDaddy的估值约为45亿美元。此次融资总额为4.4亿美元。摩根士丹利、摩根大通和花旗集团是这次IPO的主承销商,但GoDaddy尚未对此置评。 GoDaddy,全球最大的域名服务商,托管的域名达到5700万个,用户1200万,去年新增用户110万 ...
[企业架构] 如何开始学习高伸缩性编程?
【编者按】大数据地兴起对应用程序提出了更高地要求,其中高可伸缩性就是当今任何Web都应具备的条件之一。那么如何才能学好高可伸缩编程呢?本文作者列出了一个简单的学习向导。简单,但只要坚持,你一定会成为高手。 当我们对可伸缩性感兴趣时,便会寻找链接、说明、书籍、引用等各种可以学习利用的资料。本文篇幅较短,但希望能够帮助你高效地开启高可伸缩性编程之旅。 声明: 你无需使用N台机器来构建/测试一个集群 ...
[数据库] 盘点2013:21款最优秀的开源数据库
作为一名软件开发人员或DBA,其中一份必不可少的工作就是与数据库打交道,比如MS SQL服务器、MySQL、Oracle、PostgreSQL、MongoDB等等。众所周知,其中MySQL是目前使用最广泛最好的免费开源数据库,此外,还有一些你不知道或者没用过但又非常出色的开源数据库,例如 PostgreSQL、 MongoDB、HBase、Cassandra、Couchbase、Neo4j、Ria ...
[数据库] Apache Cassandra 1.2 发布,分布式 K/V 存储系统
Apache软件基金会近日发布了Apache Cassandra 1.2版本。 Apache Cassandra是一套开源分布式Key-Value存储系统,最初由Facebook开发,后转变成了开源项目。Cassandra是一个网络社交云计算方面理想的数据库,它以Amazon专有的完全分布式的Dynamo为基础,结合了Google BigTable基于列族(Column Family)的数据模 ...
[数据库] Apache Cassandra 1.1.0 稳定版发布
Apache Cassandra团队今天正式推出了1.1分支的首个稳定版1.1.0版本。 Apache Cassandra是一套开源的分布式 NoSQL 数据库系统,遵循 Apache Lience 2 协议。它最初由 Facebook 开发,用于储存收件箱等简单格式数据,集 Google BigTable 的数据模型与 Amazon Dynamo 的完全分布式的架构于一身。Facebook于2 ...
[数据库] Apache Cassandra 1.0正式版发布,开源的分布式NoSQL ...
Apache软件基金会(ASF)发布了 NoSQL 数据库 Cassandra 1.0 正式版。 ASF表示,Cassandra是一个具有高可扩展性、分布式的NoSQL数据库系统,它能够实时快速地处理大量的数据而不影响服务及系统性能。Cassandra在云计算中将扮演一个重要的角色。 Apache Cassandra是一套开源的分布式NoSQL数据库系统。它最初由Facebook开发,用于储 ...
[数据库] Twitter将开源MySQL/Hadoop转移工具
根据国外媒体报道,Twitter计划开源Hadoop-happy架构的一个附加部分,Twitter用来作为内部数据分析。作为知名的Crane,这个是用来将MySQL转化到Hadoop的工具。这一开源数据分析平台建立在Google的私有设施上。 Twitter使用Hadoop来进行数据分析,同时该平台也被使用在站点上,包括Twitter的名称搜索功能。 Twitter的大部分表格数据存储在 ...
[数据库] Digg网站放弃MySQL 迁移至NoSQL
社交新闻网站Digg近日决定放弃MySQL,并从LAMP(Linux、 Apache、MySQL和Perl/PHP/Python)架构迁移到基于Cassandra的NoSQL架构。不久之前,Twitter也做出了相同的举措。 Apache Cassandra是一套开源分布式数据库管理系统,最初由Facebook开发,用于储存特别大的数据。Cassandra的主要特点就是它不是一个数据库,而是由一 ...
[数据库] Cassandra NoSQL 数据库升级为Apache顶级项目
最近,Apache董事会决定批准Cassandra作为顶级项目,"Apache Cassandra" 将成为又一个高性能,非关系型数据库的成功案例。 点击查看更多详情:http://css.dzone.com/articles/cassandra-nosql-database Cassandra介绍 Cassandra项目是Facebook在2008年开源出来的,随后Fac ...
最近热门TAG
MySQL(258) Oracle(249) NoSQL(74) MongoDB(66) Redis(57) PostgreSQL(48) 数据挖掘(31) SQL Server(27) HBase(24) Cassandra(19) CouchDB(18) Access(16) SQLite(15) DB2(12) Derby(11) Informix(8) Sybase(6) PowerBuilder(5) HSQLDB(4) TokyoCabinet(1)