`
小网客
  • 浏览: 1249161 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
Hadoop的key和value的传递序列化需要涉及两个重要的接口Writable和WritableComparable Writable: void write(DataOutput out) throws IOException; void readFields(DataInput in) throws IOException;  也就是读数据和写数据的方式 WritableComparable: WritableComparable<T> extends Writable, Comparable<T>   public interface Comp ...
        Hadoop用于数据的输入和输出,需要指定OutputFormat和InputFormat,这两个类的目的是为了指明读数据和写数据相关的包括格式等信息。 InputFormat:   public abstract List<InputSplit> getSplits(JobContext context ) throws IOException, InterruptedException; public abstract RecordReader<K,V&g ...
        数据库切分的垂直切分是根据业务而定的,就是把一个系统所涉及到的表根据业务拆分成多个类,然后没类放到一个server上去,就会出现T1,T2,T3这三个表分表放在不同的服务器上,这个叫水平拆分,根据是T1,T2,T3几乎没有关联查询。   垂直切分的优点: 数据库的拆分简单明了,拆分规则明确; 应用程序模块清晰明确,整合容易; 数据维护方便易行,容易定位。   垂直切分的缺点: 部分表关联无法在数据库级别完成,要在程序中完成; 对于访问极其频繁且数据量超大的表仍然存在性能瓶颈,不一定能满足要求; 事务处理相对复杂; 最重要的缺点是,如果某表T1表数据急剧增大 ...
       水平切分的目的是为了控制单表记录数,从而保证同一类型的数据散列到不同的表或者不同的库中。        数据库水平切分就是对某个表按照路由规则存储在多个表中,如表T会拆分成T1,T2,T3这些表也有可能存储在不同的库中,也有可能存储在同一个库中,如T表分别存在server1.T,server2.T中。水平切分的优点:不会存在某些超大型数据量和高负载的表遇到瓶颈的问题;基本上较难遇到扩展性限制。能够很好的控制表数据量。如果T1,T2,T3在水平切分的缺点:

mysql的字符串匹配

    博客分类:
  • DB
需求表数据如下: mysql> select * from test; +----+-------+ | id | name | +----+-------+ | 1 | abc** | +----+-------+ 1 row in set (0.00 sec)  我想匹配 abcde,也就是一个*代表一个字符 分析:在正则中*代表0个或者多个,因此此处的存储有问题,应该存储.或者_那么查询sql可以通过like和REGEXP 来实现结论:1.采用like
第一类关系模型描述:关系模型使用记录(由元组组成)进行存储,记录存储在表中,表由架构界定。表中的每个列都有名称和类型,表中的所有记录都要符合表的定义。SQL是专门的查询语言,提供相应的语法查找符合条件的记录,如表联接(Join)。表联接可以基于表之间的关系在多表之间查询记录。特点:1.表中的记录可以被创建和删除,记录中的字段也可以单独更新。2.关系模型数据库通常提供事务处理机制,这为涉及多条记录的自动化处理提供了解决方案。3.对不同的编程语言而言,表可以被看成数组、记录列表或者结构。表可以使用B树和哈希表进行索引,以应对高性能访问。
场景: 有时候需要通过js进行url的编码,那么我们直接调用js自身的函数进行编码 实现: <script type="text/javascript"> var imageUrl="http://www.someabcd.com/get.php?fid=11 "; alert(encodeURIComponent(imageUrl)); document.write(encodeURIComponent(imageUrl)); </script>  

jstl对url进行编码

    博客分类:
  • Java
场景: 有时候参数中有双井号,这样的话就需要进行url编码,我们采用jstl的url标签进行编码 实现: <c:url value="${ basePath}ar/listRelation" var="url"> <c:param name="id" value="${id}" /> <c:param name="name" value="${name}" /> </c:url> <a href=" ...

mahout 对比weka

mahout: 1.可大规模分布式计算 2.目标对象是程序开发人员 3.与hadoop和lucene有很好的接口 4.是围绕着可扩展的算法和接口特殊设计的 5.命令行和API 6.Apache  license weka: 1.内存消耗厉害 2.目标对象是数据挖掘分析人员 3.有大量的算法集 4.GUI 5.GPL
        Keep-Alive功能使客户端到服务器端的连接持续有效,当出现对服务器的后继请求时,Keep-Alive功能避免了建立或者重新建立连接。市场上 的大部分Web服务器,包括iPlanet、IIS和Apache,都支持HTTP Keep-Alive。对于提供静态内容的网站来说,这个功能通常很有用。但是,对于负担较重的网站来说,这里存在另外一个问题:虽然为客户保留打开的连 接有一定的好处,但它同样影响了性能,因为在处理暂停期间,本来可以释放的资源仍旧被占用。当Web服务器和应用服务器在同一台机器上运行时,Keep-Alive功能对资源利用的影响尤其突出。 此功能为HTTP 1.1预 ...
     java对script引擎的支持其实现在javax.script下,始于JDK1.6,默认仅支持Javascript,简单应用步骤如下所示: 1.获取ScriptEngineManager 2.获取ScriptEngine 3.执行javascript 代码如下: //获取ScriptEngineManager ScriptEngineManager sem = new ScriptEngineManager(); //获取ScriptEngine ScriptEngine engine = sem.getEngineByName("ECMAScript ...

ECMAScript与Javscript

    博客分类:
  • Java
       ECMAScript是一种由欧洲计算机制造商协会(ECMA)通过ECMA-262标准化的脚本程序设计语言。这种语言在万维网上应用广泛,它往往被称为JavaScript或JScript,但实际上后两者是ECMA-262标准的扩展。     从此以后的Javscript,JScript,ActionScript等脚本语言都是基于ECMAScript标准实现的。     所以,ECMAScript实际上是一种脚本在语法和语义上的标准。实际上JavaScript是由ECMAScript,DOM和BOM三者组成的。 所以说,在JavaScript,JScript和ActionScrip ...
首先创建ScriptEngineManager ScriptEngineManager sem = new ScriptEngineManager();  然后通过ScriptEngineManager根据ScriptEngine信息创建相应的ScriptEngine 有三种方式可以创建ScriptEngine getEngineByName(String shortName) getEngineByExtension(String extension) getEngineByMimeType(String mimeType) shortName就是我们所说的javascr ...
        Watcher是Zookeeper用来实现distribute lock, distribute configure, distribute queue等应用的主要手段。要监控data_tree上的任何节点的变化(节点本身的增加,删除,数据修改,以及孩子的变化)都可以在获取该数据时注册一个Watcher,这 ...
概述:           JDK6.0中对Script语言的支持,默认支持javascript,从而使得开发变的简洁,适用场景如下: 有个业务逻辑处理,需要根据提供的工资,然后计算出应缴的税,2009年假定为(工资-800)*20%为上缴的税 采用java实现的方式如下:   public double geTax(double salary){ Return (salary-800)*0.2; }  到2010年发生了变化,变为(工资-2000)*20%为上缴的税   修改代码,重启服务,代码如下:   public double geTax(dou ...
Global site tag (gtag.js) - Google Analytics