MD5是一种常用的单向哈希算法。它被广泛用于以下几个用途:
- 检查数据是否一致。将两地存储的数据进行哈希,比较结果,如果结果一致就无需再进行数据比对。这是利用了其“抵抗冲突”(collision- resistant)的能力,两个不同的数据,其哈希值只有很小的几率一致。相当多数据服务,尤其是网盘服务,利用类似的做法来检测重复数据,避免重复上传。
- 存储用户密码。将密码哈希后的结果存储在数据库中,以做密码匹配。这是利用了其做为单向哈希的特点,从计算后的哈希值不能得到密码。
- 校验数据是否被篡改。将数据和数据哈希后的结果一并传输,用于检验传输过程中数据是否有损坏。这是利用了很难找到两个不同的数据,其哈希结果一致的特点。
下面我们将说明为什么对于上面三种用途, MD5都不适用。
- 第一个用途尤其可怕。这个用途的最大的问题是,MD5在现实中已经被发现有相当多的数据都可能导致冲突(Hash碰撞)。这意味着,如果用户提供数据 1,服务器已经存储数据 2。通过简单的MD5哈希方式检查重复,服务器上为用户保存的数据就是2。 接下来发生的事情大家都知道了,就是用户数据丢了!
- 第二个用途很容易遭到rainbow table(彩虹表)攻击。
- 第三个用途里一般会在需要哈希的数据中混入某些秘密,也就是计算公式为md5(secret key + data)。 但这样并不适合用于验证数据的完整性。这是因为,从理论上上来说,如果知道md5(secret key +X),即使不知道secret key的内容, 仍然可能通过对X的分析,计算得到md5(secret key +Y),从而将X成功的替换成Y,导致接收方仍然认为数据是正确的。Understanding MD5 Length Extension Attack
上文是说
MD5算法在很多场合都不再安全,应该避免使用,并不是全面否定其他安全哈希算法。SHA-2系列算法在最近几年应该还是足够安全和可靠的。另外,按照计划,SHA-3系列的哈希算法也即将在近期公开发布。
因此,对读者而言,这篇文章最有意义的提示是:“在使用安全哈希算法时,考虑使用SHA-2系列算法乃至更高级别算法,而不是MD5“。
MD5最大的问题在于,通过我国的王晓云教授等学者的工作,md5已经被证明可以进行碰撞攻击。也就是说,攻击者可以产生两个应用程序,内容不一样,但是哈希值完全一样。
在云存储的应用场合中,这种危害表现为攻击者可以伪造一个Windows 的安装光盘,在其中嵌入木马,通过上述手段让MD5哈希值和微软官方发布的光盘一致,抢先上传到分享类网盘中。如果该网盘采用MD5检查重复文件(例如离线下载服务), 木马就会被植入到希望下载原版光盘用户的电脑中。
这种攻击形式不是天方夜谈,根据微软官方的报告,一款名为Flame的木马就用了类似的手段。当然,这种方式目前还是非常高级的攻击手段。
另外,实际应用中我们也常需要验证对方发送的数据没有经过任何攻击者篡改。 例如,微博的API(应用接口)服务就需要验证请求来自于一个合法的授权方,而不是一个借用第三方名义的攻击者。
使用私钥加密,公钥解密验证的方式是完全可行的,但是因为非对称加密算法执行效率低下。因此,很多时候会用类似MD5的哈希算法验证哈希值和内容一致来保证数据未被篡改。
从前一篇文章的描述可以看出,MD5在这种场景是不安全的,不过需要额外注意的是,即使SHA-2系列的算法用于这个场景也是不安全的,这个时候应该考虑使用HMAC系列的对称验证算法。这个问题的根源是,从理论上上来说,如果知道hash(secret key +X),即使不知道secret key的内容, 仍然可能通过对X的分析,计算得到hash(secret key +Y),从而将X成功的替换成Y,导致接收误以为Y就是X。而HMAC尽管基于安全哈希算法,却能避免这个类型的攻击。
从开放API的实例来看,Flickr的API在早期犯过这个错误。
当然,如果用于验证通信中的数据是否因为信道干扰损坏(而非攻击者人为干扰),或者将数据进行足够均匀的分布,MD5还是完全称职的,甚至是优秀的。关于这方面的内容,如果读者有兴趣,欢迎通过微博或者评论反馈,我们也可以再行补充。
转自:
为什么应该放弃或减少使用MD5
为什么应该放弃或减少使用MD5【续】
关联算法:
Understanding MD5 Length Extension Attack
Rainbow table(彩虹表):是一个庞大的、针对各种可能的字母组合预先计算好的哈希值的集合,不一定是针对MD5算法的,各种算法的都有,有了它可以快速的破解各类密码。越是复杂的密码,需要的彩虹表就越大,现在主流的彩虹表都是100G以上。
RainbowCrack Project Website
朴素模式匹配算法又称简单匹配算法或Brute-Force算法,它是字符串模式匹配中比较简单的一种算法。它从主串的第一个字符开始进行模式匹配,依次 比较主串和模式串中的每个字符,若比较全部相等(模式匹配成功),则返回模式串中第一个字符在主串中的位置,否则主串指针从比较失败的字符处回溯到第二个 字符开始重新和模式串进行匹配,这样依此下去,直到和模式串匹配成功或到主串的末尾(匹配不成功)为止。
分享到:
相关推荐
- 优化代码以减少堆栈使用:审查代码中是否存在不必要的递归调用,并尽可能地将它们替换为循环或更高效的数据结构。同时,应避免在堆栈上分配大量数据,尤其是在ISR中,可以使用静态内存存储数据来减少堆栈使用。 ...
对于复杂对象,将其转换为简单类型(如列表、字典等)通常能够减少序列化时发生错误的可能性。而且,确保对象中没有包含无法序列化的元素,如文件句柄、网络连接等,如果这些内容存在,在序列化之前需要将其移除或...
此外,合理的资源管理也是避免死锁的关键,比如尽量减少锁定资源的时间,以及优先使用无锁编程技术(比如使用原子操作类)。 在鸿蒙开发中遇到的ResourceLockException异常问题,可以通过合理的同步机制和异常处理...
重新设计意味着放弃使用中断机制来控制线程行为,而是引入其他形式的控制方式,如使用显式的取消标志或条件变量。这类设计可以更清晰地表达程序的行为,而且可以避免线程中断引发的异常处理逻辑,减少潜在的错误和不...
在HarmonyOS开发过程中,开发者可能会遇到一个特定的异常——TaskInterruptionException。这个异常表明一个任务在执行...只有这样,才能开发出高质量的应用程序,满足用户的使用需求,并推动项目的成功落地和广泛使用。
资源死锁,简单来说,就是两个或多个进程在执行过程中,因争夺资源而造成的一种僵局,它们之间形成一种互相等待对方释放资源的循环等待关系,从而导致进程无法向前推进。死锁问题不仅影响程序的运行效率,严重时甚至...
如果锁已经被占用,根据业务需求,程序可以选择等待一段时间后再尝试获取锁,或者直接采取其他的异常处理逻辑,比如放弃获取锁或通知用户。 其次,实现重试策略可以有效应对临时性网络波动或短暂的资源竞争。通过...
后来,他转而使用了异步线程处理,这是Redis内部使用的`BIO`(BackgroundIO)线程。这部分内容还提到了“share-nothing”设计,这是为了实现懒惰删除而对原有对象共享机制的放弃。 从描述中可以提取的关键知识点...
包括网络的容错设计,如设置超时机制,当网络请求超过设定的超时时间后,自动放弃此次请求,避免程序长时间等待而影响用户使用。此外,也可以通过备份机制,比如多服务器部署,保证在某一个节点出现异常时,其他节点...
改进穷举法,减少内层循环的次数,使时间复杂度降为 \( O(N^2) \)。 ```cpp int maxSubSum2(const vector<int>& a) { int maxSum = 0; for (int i = 0; i (); ++i) { int thisSum = 0; for (int j = i; j (); +...
标题中的“为什么您应该停止使用Gerrit”表明了文章的核心议题,即对Gerrit代码审查系统的批评以及探讨寻找更注重隐私且高效的替代方案。Gerrit是一款广泛用于开源项目,尤其是那些遵循GPLv3(GNU General Public ...
ERR_DEADLOCK_DETECTED是数据库操作中一种典型的错误,它通常出现在多个客户端或进程尝试访问和修改相同数据时,由于彼此之间相互等待对方释放锁而无法继续执行操作,从而导致死锁状态。为了避免和解决这类问题,...
这个压缩文件是专为SDCC编译器打造的STC15单片机开发资源,提供了一系列的头文件,帮助开发者放弃原有的Keil环境,转而使用开源的SDCC环境进行项目开发。这样不仅可以减少开发成本,而且还能利用开源社区提供的资源...
实用性方面,系统应以经济实用为原则,为系统维护人员提供关键信息,形成即时的管控对策,确保系统的有效运转。 对于有志于学习Matlab技术的科研人员或学生,可以通过个人主页提供的联系方式获取Matlab项目合作机会...
J2ME虽然功能有限,但仍可使用如MD5或SHA系列的哈希算法对密码进行单向加密,这样即使数据被盗,也不能直接还原密码。另外,应支持用户修改密码,修改过程同样需要验证旧密码并更新新密码的哈希值。 6. **错误处理*...
标题和描述都在探讨一个主题——为何应该放弃使用Google的Material Design,并寻找以隐私保护为核心的设计方案。Material Design是Google推出的一种视觉设计语言,它为应用程序和网站提供了一套统一的设计规范,包括...
5. 报告文档(如report.md或report.html):总结分析结果和建议。 在Python中,我们可以使用Matplotlib和Seaborn库进行数据可视化,帮助我们更好地理解数据。通过分析购物车放弃的时间间隔、用户浏览历史、设备类型...
用户在使用模板前,应该先阅读这份文档,以了解如何正确部署和配置模板,避免遇到兼容性或功能问题。 总的来说,商品价位表展示网站模板是电子商务网站提高转化率和用户体验的重要工具。通过合理设计和有效利用,它...
在4.0.0版本中,Bootstrap放弃了之前使用的 Glyphicons 图标库,转而采用开源的 Font Awesome 图标集,提供了更多样化的图标选择。同时,字体方面引入了更现代的开源字体Open Sans和Source Sans Pro,提高了可读性。...
为什么设备驱动程序可能使用到汇编语言编写? - **使用汇编语言的原因**:汇编语言可以直接访问硬件,对于某些对性能要求极高的设备驱动来说,使用汇编语言可以实现更高效的控制。 #### 45. 为什么要引入缓冲? ...