数据库性能优化，关于oracle字符串比较优化的改进方案，大家拍砖

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 7289 次

锁定老帖子主题：数据库性能优化，关于oracle字符串比较优化的改进方案，大家拍砖精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
beyondqinghua 等级: 初级会员性别: 文章: 57 积分: 50 来自: 南昌	发表时间：2011-12-10 相关推荐: MySQL优化学习总结 oracle正则查询数字串长度 exp参数feedback_Oracle数据库逻辑增量备份恢复之exp/imp参数inctype oracle导出表为啥总是在执行,oracle导入导出表时因一个分号引发的惨案 oracle sqlldr 日期,Oracle sqlldr导入一个日期列实例详解更多相关推荐企业应用因为公司的单个业务数据达到千W级别，并且有源源不断的新数据进来。新数据进来都需要进行查重，重复数据不能进来，查重条件有很多字符串的对比，最大的字符串不超过1000个字符，但是字符串的比较，对于数据库来说，非常的耗性能，如果能将String转成数字来进行比较对于性能的提高将非常有用。后来想到String有一个hashcode，看看能否使用： <SPAN style="FONT-SIZE: small">/** * Returns a hash code for this string. The hash code for a * <code>String</code> object is computed as * <blockquote><pre> * s[0]31^(n-1) + s[1]31^(n-2) + ... + s[n-1] * </pre></blockquote> * using <code>int</code> arithmetic, where <code>s[i]</code> is the * <i>i</i>th character of the string, <code>n</code> is the length of * the string, and <code>^</code> indicates exponentiation. * (The hash value of the empty string is zero.) * * @return a hash code value for this object. / public int hashCode() { int h = hash; int len = count; if (h == 0 && len > 0) { int off = offset; char val[] = value; for (int i = 0; i < len; i++) { h = 31h + val[off++]; } hash = h; } return h; }</SPAN> 但是遗憾的是int的范围非常窄（-2147483648——2147483647），出现重复的概率虽然说比较低，但是不可避免会出现重复的可能性。于是想到，是否可以自己重新写过hashcode方法，将int的范围扩大到long类型（-9223372036854774808~9223372036854774807），这样在目前长度的字符生成的hashcode出现重复的可能性应该几乎为零。大家对于这个设想是否有什么更好的意见？声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

kimmking 等级: 性别: 文章: 3531 积分: 1500 来自: 中华大丈夫学院	发表时间：2011-12-10 MD5/SHA1
返回顶楼	回帖地址 0 1 请登录后投票

beyondqinghua 等级: 初级会员性别: 文章: 57 积分: 50 来自: 南昌	发表时间：2011-12-10 kimmking 写道 MD5/SHA1 MD5，并不是数字类型，还是字符串呀
返回顶楼	回帖地址 0 0 请登录后投票

salaxun 等级: 初级会员性别: 文章: 9 积分: 50 来自: 北京	发表时间：2011-12-10 hash(string+string.length)
返回顶楼	回帖地址 0 0 请登录后投票

richard_2010 等级: 初级会员性别: 文章: 272 积分: 60 来自: 杭州	发表时间：2011-12-14 hashcode相等并不代表字串相等，只能保证字串相等hashcode相等
返回顶楼	回帖地址 0 0 请登录后投票

夜神月等级: 初级会员性别: 文章: 165 积分: 40 来自: 北京	发表时间：2011-12-14 搞个MD5匹配下就好了
返回顶楼	回帖地址 0 0 请登录后投票

numberoneschool 等级: 初级会员性别: 文章: 1 积分: 30 来自: 杭州	发表时间：2011-12-14 1. 可以加一列用于保存md5的值 2. 在上面的列加上索引 3 新来的字符串 md5 后的值走索引去比较 4. 再来确定是否接受新来的字符串
返回顶楼	回帖地址 0 0 请登录后投票

byk 等级: 初级会员文章: 40 积分: 66 来自: ...	发表时间：2011-12-15 参考Map实现机制：先用hashcode，相等则比较完整字符串。
返回顶楼	回帖地址 0 0 请登录后投票

chengxj_1986 等级: 初级会员性别: 文章: 29 积分: 30 来自: 北京	发表时间：2011-12-15 richard_2010 写道 hashcode相等并不代表字串相等，只能保证字串相等hashcode相等 hashcode相等只能保证两个对象在一个HASH表里的同一条HASH链上，不能保证两个对象一定相等
返回顶楼	回帖地址 0 0 请登录后投票

yangguo 等级: 初级会员性别: 文章: 860 积分: 60 来自: 深圳	发表时间：2011-12-15 最后修改：2011-12-15 楼上这个即可：参考Map实现机制：先用hashcode，相等则比较完整字符串。
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛: