- 浏览: 161040 次
- 来自: ...
最新评论
-
liwanfeng:
情况是这样的,你的文件我觉得还是比较小,我现在需要处理的XML ...
dom4j处理大文件
文章列表
本章介绍Liferay的基本原理及入门知识。
Java Portlet的承诺:从失望到满足
进一步了解Liferay
Liferay支持LGPL开源协议,并另外提供一个商用的企业版
Liferay是一个应用程序聚合器
Liferay是一个内容管理器
Liferay是一个理想的协作工具
Liferay可以变成你所需要的任何东西和任何样子
Liferay是怎样构成的
高级视图 用户、角色、组织、用户组
添加内容到页面集
配置portlet的作用域
Liferay扫视
建立你的虚拟站点
原文 http://www.ibm.com/developerworks/cn/opensource/os-cn-cassandraxu1/
Cassandra 分布式数据库详解,第 1 部分:配置、启动与集群
许 令波, Java 工程师, 淘宝网
简介: 本文首先介绍了 Cassandra 服务器的配置文件各个配置项 ...
原文 http://www.ibm.com/developerworks/cn/opensource/os-cn-cassandraxu2/
Cassandra 的数据存储结构
Cassandra 中的数据主要分为三种:
CommitLog:主要记录下客户端提交过来的数据以及操作。这个数据将被持久化到磁盘中,以便数据没有被持久化到磁盘时可以用来恢复。
Memtable:用户写的数据在内存中的形式,它的对象结构在后面详细介绍。其实还有另外一种形式是 BinaryMemtable 这个格式目前 Cassandra 并没有使用,这里不再介绍了。
SSTable:数据被持久 ...
原文 http://www.oschina.net/question/12_60107
Redis 是一个高级的 key-value 存储系统,类似 memcached,所有内容都存在内存中,因此每秒钟可以超过 10 万次 GET 操作。
我下面提出的解决方案是在 Redis 中缓存所有输出的 HTML 内容而无需再让 WordPress 重复执行页面脚本。这里使用 Redis 代替 Varnish 设置简单,而且可能更快。
安装 Redis
如果你使用的是 Debian 或者衍生的操作系统可使用如下命令安装 Redis:
原文 http://www.oschina.net/question/12_18065
redis作为NoSQL数据库的一种应用,响应速度和命中率上还是比较高效的。项目中需要用集中式可横向扩展的缓存框架,做了一点调研,即便redis、memcached存在效率上的差异(具体比较参考http://timyang.net/data/mcdb-tt-redis/),但其实都能满足目前项目的需求;但是redis还是比较风骚的,支持链表和集合操作,支持正则表达式查找key,目前项目缓存的结果大多是链表,如果链表新增或者修改数据的话,redis就体现出了极大的优势(memcached只能 ...
原文 http://www.iteye.com/news/24675
Redis是一种面向“key-value”类型数据的分布式NoSQL数据库系统,具有高性能、持久存储、适应高并发应用场景等优势。它虽然起步较晚,但发展却十分迅速。 近日,Redis的作者在博客中写到,他 ...
原文 http://www.hadoopor.com/thread-1880-1-1.html
Google在新的内容索引系统中放弃MapReduce
mapreduce, google, 云计算
有消息表明,Google在新型网络内容索引系统——Caffeine中,将放弃以MapReduce为基础架构的分布式计算平台。据Googl ...
Yahoo!的分布式数据平台PNUTS简介及感悟
- 博客分类:
- 架构设计
原文 http://timyang.net/architecture/yahoo-pnuts/
Yahoo!的分布式数据平台PNUTS简介及感悟
Sunday, Jun 21st, 2009 by Tim | Tags: CAP, PNUTS
在分布式领域有个CAP理论(Brewer’s CAP Theorem) ,是说Consistency(一致性), Availability(可用性), Partition tolerance(分布) 三部分在系统实现只可同时满足二点,没法三者兼顾。所以架构设计师不要把精力浪费在如何设计能满足三者的完美分布式系统,而是应该进行取舍,选取 ...
原文 http://www.iteye.com/news/23045
微软已经展开了他们的“大数据”蓝图,其中担当主要角色的就是Apache Hadoop。
Hadoop是一个分布式系统基础架构,由Apache基金会开发。它是一个能够对大量数据进行分布式处理的软件框架。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储。在12日西雅图召开的微软PASS(Professional Association for SQL Server,SQL Server专家协会) Summit会议上,微软公司副总裁Ted Kumert描绘了这一蓝图。Ted K ...
原文 http://www.programmer.com.cn/7578/
淘宝网拥有国内最具商业价值的海量数据。截至当前,每天有超过30亿的店铺、商品浏览记录,10亿在线商品数,上千万的成交、收藏和评价数据。如何从这些数据中挖掘出真正的商业价值,进而帮助淘宝、商家进行企业的数据化运营,帮助消费者进行理性的购物决策,是淘宝数据平台与产品部的使命。
为此,我们进行了一系列数据产品的研发,比如为大家所熟知的量子统计、数据魔方和淘宝指数等。尽管从业务层面来讲,数据产品的研发难度并不高;但在 “海量”的限定下,数据产品的计算、存储和检索难度陡然上升。本文将以数据魔方为例,向大家介绍 ...
摘自 http://www.blogjava.net/killme2008/archive/2008/06/05/206043.html
Hadoop分布式文件系统:架构和设计要点原文:http://hadoop.apache.org/core/docs/current/hdfs_design.html一、前提和设计目标1、硬件错误是常态,而非异常情况,HDFS可能是有成百上千 ...
原文 http://www.iteye.com/news/25197
Apache Hadoop社区近日发布了最新的Apache Hadoop 2.0 Alpha版本,这标志着Apache Hadoop进入了一个新的分支。
Hadoop是Apache的顶级开源项目,由前雅虎开发者Doug Cutting(也是Nutch和Lucene的创始人)开发的分布式计算平台,是一个能够对大量数据进行分布式处理的框架。用户可以在不了解分布式底层细节的情况下开发分布式程序,充分利用集群的威力高速运算和存储。 该版本提供了一些新的、重要的功能,包括:
HDFS HA,当前只能实现人工切换。 ...
原文 http://www.jdon.com/34888
2008年下半年这些日子,虽然微软还在表示进军云计算,但是云计算在Java世界实际上已经从口号变成现实。这是一篇Web服务器Jetty集群文章的翻译,也就是说:Jetty已经可以嵌入下面这些云计算软件,而你只要将你的Web应用部署到Jetty,就能实现云计算,是不是很简单,现在就可以去做。将你的应用部署到Cloud computing 云计算环境. 再也无需你管理,可以很容易伸缩,大大提高处理能力,提供失败的可恢复性,硬件上云计算由一批成本低廉的服务器器组成。这些成本远低于传统数据库集中模型。Software as a se ...
安全第一!VMware云安全八项新举措
- 博客分类:
- 云计算
云与安全,就这种双重组合而言,它与饼干和牛奶,节奏和布鲁斯还不完全是一回事儿。
这对于那种有志于花费大量经费来销售公共云服务或公共云基础设施的公司来说是个问题。云也许(或不)是“安全的”,但这并不是 ...
原文 http://www.iteye.com/news/24811
10gen(MongoDB数据库开发商)今天发布了MongoDB Hadoop Connector 1.0 正式版本。 MongoDB Hadoop Connector的核心功能是允许读取MongoDB数据到Hadoop MapReduce工作中,以及将MapReduce工作的结果写回到MongoDB。用户可以针对每个实例来选择结合使用或单独使用MongoDB的读、写操作。该连接器的目标是根据用户的反馈和需求,继续完善对Hadoop生态系统中组件的支持。
10gen称,1.0版是一个长期支持版本,将提供超过1年的维 ...