最新文章列表

hive二级分区

几年前的工作了,放在草稿箱2,3年了,整理一下吧。 内容主要是扩展了hive的分区方式,原生的hive支持多字段等值分区,对于很有用的range、hash、list等数据库传统的分区方式不支持,因此这个做了二级的多类分区的扩展。 这里只是antlr的定义,显然你还需要在查询、存储层做更多的工作来支持这种分区工作,量还是不小的,我们的工作不具参考性,这里只列一下sql解析的修改,给大家做参考。 ...
denniszjw 评论(0) 有1812人浏览 2016-03-04 15:43

Hash表分析

http://baike.baidu.com/link?url=Ua74895uGf1NuPxB4pawmuAXedi427jJvM6aSLh_V1-23ptlMc7XIrr_cylIBn5d
grefr 评论(0) 有642人浏览 2014-03-08 22:43

HashMap 底层算法分析

详见: http://blog.yemou.net/article/query/info/tytfjhfascvhzxcytp72 Hash算法HashMap使用Hash算法,所以在解剖HashMap之间,需要先简单的了解Hash算法,Hash算法一般也 ...
grefr 评论(0) 有1111人浏览 2014-02-26 16:30

E6与location.hash和Ajax历史记录 (转载)

为了在IE6中改变hash来保留历史记录实现ajax的前进后退,通常需要在页面内加入隐藏的iframe,对其open+close然后修改iframe的hash,再通过timer更新主窗口的hash,达到让主窗口生成历史记录的目的。 参见http://tkyk.github.com/jquery-history-plugin/ 但是这样做有一个问题,ie6默认是打开导航音的,对于用户而言,如果 ...
pucxin 评论(0) 有560人浏览 2014-02-26 12:23

遵守equals和hashCode方法的通用约定 (2)

  如前文所述,在覆盖了equals方法的类中,也必须覆盖hashCode方法。否则违反了Object.hashCode的通用约定会导致该类无法和基于散列的集合(HashMap,HashSet和HashTable)一起正常使用。   如下约定内容摘自Object规范:   1. 在应用程序中,只要对象的euqals方法的比较操作所用的信息没有修改,那么对于同一个对象的调用多次hashCode,必须始 ...
zhuyuyuseu 评论(2) 有1385人浏览 2014-02-25 11:37

JAVA加密算法实现用例 数字签名

所谓数字签名就是信息发送者用其私钥对从所传报文中提取出的特征数据(或称数字指纹)进行 RSA 算法操作,以保证发信人无法抵赖曾发过该信息( ...
cuisuqiang 评论(0) 有12221人浏览 2014-02-22 16:15

Hashtable与ConcurrentHashMap区别

相同点: Hashtable 和 ConcurrentHashMap都是线程安全的,可以在多线程环境中运行; key跟value都不能是null 区别: 两者主要是性能上的差异,Hashtable的所有操作都会锁住整个对象,虽然能够保证线程安全,但是性能较差; ConcurrentHashMap内部使用Segment数组,每个Segment类似于Hashtable,在“写”线程或者部分特殊的“读 ...
pi88dian88 评论(1) 有14250人浏览 2014-01-22 12:12

用hash表 来替换if else

    在写处理短信的时候,要根据短信的内容来判断是报名短信和竞价短信时候,要到一些 if else, 可以用hash表的形式来替换掉这些代码。 if(message.c ...
小嗷喏 评论(0) 有1363人浏览 2014-01-17 22:04

Oracle之range,hash,list分区现实应用及优缺点汇总

详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcytp51 [align=center;] Oracle之range,hash,list分区现实应用及优缺点汇总 [/align] 引言:Oracle的range,hash,list三大分区可能我们大家在熟悉不过了,但什么每种分区适用于什么场景可能是很多人的疑惑点,那么在选择 ...
grefr 评论(0) 有1367人浏览 2013-12-10 16:33

Key/Value存储引擎——Bitcask的Java实现 (转)

在关系数据库存储上,Btree一直是主角,但在读写性能要求更高的场景下,log(n)的读写操作并不是总是让人满意。 Bitcask是一种连续写入很快速的Key/Value数据存储结构,读写操作的时间复杂度均为常量。它是怎么做到的呢? BitCash连续写入操作 Bitcask具有高效的连续写入操作,连续写操作类似向log文件追加记录,因此Bitcash也叫Log结构存储。 BitCash中 ...
wbj0110 评论(0) 有1344人浏览 2013-12-06 10:16

常见hash算法的原理

散列表,它是基于快速存取的角度设计的,也是一种典型的“空间换时间”的做法。顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是 ...
wbj0110 评论(0) 有1178人浏览 2013-11-25 09:38

关于Nginx session sticky

Nginx以前对session 保持支持不太好,主要采用ip_hash把同一来源的客户(同一C段的IP)固定指向后端的同一台机器,ip_hash有个缺点是不能实现很好的负载均衡;直到nginx的扩展模块nginx-sticky-module的出现,解决了session sticky的问题。 基本的原理: 首先根据轮询RR随机到某台后端,然后在响应的Set-Cookie上加上route=md ...
wbj0110 评论(0) 有1878人浏览 2013-11-15 09:50

一致性hash算法 - consistent hashing

  1、   情景分析 前一篇博文分析了HashMap源码,HashMap在许多场景中作为存储数据的不二选择。   但是否使用HashMap就能解决所有在空间和时间的均衡问题??   下面考虑使用HashMap的二个极端情景:   原来有 N 台Server,所有数据通过一种 hash 算法(以hash(key)%N为例)映射到 N 台Server 中。   情景一:其中的 M ...
什么世道 评论(0) 有7677人浏览 2013-11-08 11:36

JAVA中的哈希表结构

      Java中的Hash结构有HashSet,HashTable和HashMap,哈希表中的每个位置称为桶(bucket),当发生哈希冲突时就以链表形式存放多个元素。       关键字值key和储存位置的对应关系h,这种对应关系我们称之为Hash函数,h(key)就是Hash地址。按这种思想建立的查找表就是Hash表。这样查询速度必须快。但是一般情况下不存在理想的一对一关系,关键字通常 ...
jiranjiran 评论(0) 有2165人浏览 2013-11-03 04:01

Hash结构

数组的特点是:寻址容易,插入和删除困难;而链表的特点是:寻址困难,插入和删除容易。 而哈希表就是结合两者的数据结构。 以下的代码是个人编写的简单Hash表结构,并与系统的进行了测试和比较。 //节点数据结构 class Node{ private Object value;//节点的值 private Node next;//链表中指向下一结点 public ...
原非珏 评论(1) 有1111人浏览 2013-10-31 22:42

【转载】Oracle hash分区的秘密

在面试时经常会问一个问题,请列举出hash在数据库内部的应用,hash的原理虽然简单,但是它在数据库中可以说是无处不在。其中hash partition是hash在数据库中一个简单的应用,虽然它没有range partition那么常用,但是我们在做数据库水平拆分时,其实就是利用了hash partition的原理,利用hash函数对某个key进行运算,然后将其分布到不同的主机上,原理很简单。    ...
cool010 评论(0) 有668人浏览 2013-08-17 19:14

JAVA深入集合--HashTable

一、介绍        Hashtable 是早期实现的一个哈希存储方式的类,也就是键值对(key-value)的存放方式。实际上市键值对 和 链表的组合,相对同步安全的。      特点:             1.是key-value 方式存放的,并且是无序存放的             2.线程安全的,性能较低             3.key 不允许重复,否者会覆盖数据 ...
greemranqq 评论(0) 有4614人浏览 2013-08-04 10:57

大数据量算法

第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大 的几个)及 ...
wbj0110 评论(0) 有1073人浏览 2013-07-24 13:28

PATH环境变量也有缓存

    hash - hash database access method hase 命令:用来显示和清除哈希表,执行命令的时候,系统将先查询哈希表。 当你输入命令,首先在hash表中寻找,如果不存在,才会利用$PATH环境变量指定的路径寻找命令,然后加以执行。同时也会将其放入到hash table 中,当下一次执行同样的命令时就不会再通过$PATH寻找。以此提高命令的执行效率。 ...
netkiller.github.com 评论(0) 有667人浏览 2013-03-28 15:33

FNV哈希算法

FNV哈希算法是一种高离散性的哈希算法,特别适用于哈希非常相似的字符串,例如:URL,IP,主机名,文件名等。 该算法实现简单,特别适合互联网行业。 但该算法也有几个缺点 1. 不适用于加密,因为其执行效率高,容易攻击; 2. 由于hash结果是按位异或和乘积的,如果任何一步出现0,则结果可能会造成冲突;   FVN哈希算法支持多种位的哈希算法,下面是一个32位FVN哈希算法的实现: ...
jamie.wang 评论(0) 有8173人浏览 2013-02-18 15:39

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics