`
kekeemx
  • 浏览: 8683 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

多线程下lrumap的操作经验

阅读更多
   前些时候用到了apache的Lrumap,用来维护N个用户的定购关系列表,大致是Lrumap<string,List<string>>后来测试的时候出现了一个很奇怪的问题,就是系统运行一段时间后会发现某些用户的某些定购关系在内存中不存在,但是数据库中却是有值的。开始的时候我怀疑用户名id(即map的key)所对应的List空掉了,最后想了很久发现应该是值缺失了一部分,而不是空掉了。


下边是一个经过抽象后的简单模型:

Map<String, List<String>> m = new LruMap<String, List<String>>; 
// 由于最新的apache 的common-collection3.2.1包中的lrumap是不同步的.
// 所以我想当然的对其进行了一次同步。
    boolean foo(value) { 
        List<String> list; 
        synchronized (m) { 
            list = m.get(uid); 
        } 
        if (list == null) { 
            list = getdataFormDatabase(); // 将其放在外边是由于这块可能非常慢,而并发又很严重,考虑到性能就放同步块外边了
            synchronized (m) { 
                m.put(uid, list); 
            } 
            return list.contains(value); 
        } else { 
            return list.contains(value); // 问题出现在这里,返回的是false,实际上应该为true
        } 
    } 

    foo(uid, value) { 
        List<String> list; 
        synchronized (m) { 
            list = m.get(uid); 
        } 
        if (list == null) { 
            list = getDataFromDatabase(); // 理由同上
            list.add(value); 
            synchronized (m) { 
                m.put(uid,list); 
            } 
        } else { 
            list.add(value); 
        } 
    }  
分享到:
评论
8 楼 kekeemx 2009-03-27  
dennis_zane 写道
我觉的你是简单问题复杂化了,在我看来,这个错误最简单的修正方式就是扩大锁的范围,在没有明确测试之前怎么能确定一定有性能上的问题呢?况且从数据库加载数据这一操作也只是一次调用。采用cas方式不一定能带来性能提升,但是代码复杂度的提升倒是显而易见。

因为我这个系统的业务比较复杂,中间掺杂了很多特殊的业务处理都是非常耗时的(包括一次远程ice调用和若干个无法避免的数据库写操作)所以对这个查询的性能(即模型中第一个用于判断的foo方法)要求必须稳定而且是尽量能越小越好,  我大概在测试环境的服务器上测试了一下,这块getDatafromDb的时间消耗很不稳定(因为测试环境跑了很多其他服务,应用服务器和db的负载很不稳定.所以这个测试结果也只能大略参考一下)。性能主要看数据库当时负载,查询的结果集大小等因素.从1ms到10+ms不等. 虽然getDatafromdb对一个用户而言只会执行一次(不考虑lru),但是
在高并发的情况下,这块的性能表现可能就很不稳定了.很有可能是时快时慢. 所以我认为, 令可增加程序的复杂度,也
需要尽量保证其稳定性。对我这里map的get和put操作来说,string作为key应该可以保证其性能。(按照之前做过map的get和put性能测试来看还是很理想的)
7 楼 kekeemx 2009-03-27  
sdh5724 写道
高并发的对象控制还是需要很多经验的。 我们最近做了不少多线程的代码, 确实不同程序员反应出来的经验差异很的。 要控制线程安全, 不是那么简单的事情, 特别是你处要注意锁与性能的问题。 如果不考虑性能, 处处有LOCK也行。。。。

的确.之前也写了不少多线程方面的代码,感觉并发控制不是那么困难, 但是经此一役,发现自己还差很远.呵呵.

6 楼 dennis_zane 2009-03-26  
我觉的你是简单问题复杂化了,在我看来,这个错误最简单的修正方式就是扩大锁的范围,在没有明确测试之前怎么能确定一定有性能上的问题呢?况且从数据库加载数据这一操作也只是一次调用。采用cas方式不一定能带来性能提升,但是代码复杂度的提升倒是显而易见。
5 楼 sdh5724 2009-03-26  
高并发的对象控制还是需要很多经验的。 我们最近做了不少多线程的代码, 确实不同程序员反应出来的经验差异很的。 要控制线程安全, 不是那么简单的事情, 特别是你处要注意锁与性能的问题。 如果不考虑性能, 处处有LOCK也行。。。。
4 楼 kekeemx 2009-03-26  
修改完成之后, 还没有经过实际的检验, 不过这个put操作 可能引起list值缺失的情况我倒是通过几个多线程测试例子验证了。的确会发生这种情况,不过现在怎么看这个修改怎么都觉得不太优雅。不知道大牛门有没有更好的方法。
3 楼 kekeemx 2009-03-26  
  问题找是找到了.怎么解决呢?

  估计最简单的是增大同步块,将getdatafromdb的操作一起都同步了就没问题了。不过考虑到性能(因为系统会对这个lrumap有非常高的并发操作.大部分都是想执行get操作),这个一同步,外部很多线程都会被阻塞.系统估计就差不多down掉了。

   后来想到了CAS(compare and swap貌似是一个原子操作).大概修改思路类似于cas,就是put之前再次看看是否已经有线程put值进去了。不多说,看代码大家就明白了。
    boolean foo(value) { 
        List<String> original; 
        synchronized (m) { 
            original = m.get(uid); 
        } 
        if (original == null) { 
            original = getdataFormDatabase(); // 这里返回的list是 同步的 list 
            List<String> modifys = null; 
            synchronized (m) { 
                modifys = m.get(uid); 
                if (modifys != null) { 
                    // saysomething here but no need to addall here; 
                } else { 
                    m.put(uid, original); 
                } 
            } 
            if (modifys != null) { 
                if (original.size > modifys.size) { 
                    modifys.addAll(original); // 尽量减少一次addAll操作,因为addall在数据量很大的情况下也是性能瓶颈,当然我这里数据量撑死了1w,不过为了那么一点点性能,还是判断一下
                } 
                return modifys.contains(value); 
            } 
            return original.contains(value); 
        } else { 
            return original.contains(value); 
        } 
    }

基本的原则是,只要某个uid的list被put过一次,之后就只能修改这个list而不会被新的put操作给替换掉。

同理,添加的操作也做对应的修改:
foo(uid, value) { 
        List<String> original; 
        synchronized (m) { 
            original = m.get(uid); 
        } 
        if (original == null) { 
            original = getDataFromDatabase(); // 这里返回的list是 同步的 list 
            original.add(value); 
            List<String> modifys = null; 
            synchronized (m) { 
                modifys = m.get(uid); 
                if (modifys != null) { 
                    // saysomething here but no need to addall here; 
                } else { 
                    m.put(uid, original); 
                } 
            } 
            if (modifys != null) { 
                if (original.size > modifys.size) { 
                    modifys.addAll(original); 
                } 
                modifys.add(value); 
            } else { 
                original.add(value); 
            } 
        } else { 
            original.add(value); 
        } 
}
2 楼 kekeemx 2009-03-26  
下边来简单说明一下我认为的问题所在(各位大牛可以看看是否如此)

 synchronized (m) { 
            list = m.get(uid); // 步骤1
        } 
        if (list == null) { 
            list = getdataFormDatabase(); // 步骤2
            synchronized (m) { 
                m.put(uid, list); //问题出在这里
            } 

首先, 假设我们现在有2个线程(线程1,和线程2),先后获得m的使用权通过了步骤1,这样两个线程都会执行步骤2,好了,问题开始了。
线程1顺利执行完成 getdatafromdb的操作, 获取了listA数据,此时数据是完整的。并且再次获取了m的使用权,将其put进入map中, 此时线程2也顺利提取完成获得了另外一个listB。他准备将自己的listB也put进map。

当当当,这个时候线程3突入闯入进来, 并且获取了m的使用权,执行了步骤3,发现内存有值了(listA),于是顺利执行了步骤4。
 synchronized (m) { 
            list = m.get(uid); // 步骤3
        } 
        if (list == null) { 
            list = getDataFromDatabase(); 
            list.add(value); 
            synchronized (m) { 
                m.put(uid,list); 
            } 
        } else { 
            list.add(value);  // 步骤4  
        } 
 
其实本来listA的内容跟listB一样, 但是由于线程3的干扰,listA的内存中有了一个新的值.但是线程3执行完成后走掉了, 线程2终于轮到m的使用权,并且将listB重新put进入map,顶替掉了listA。悲剧就这样产生了.

假设之后再也不出现这种情况(我们实际系统中理论上是不会产生一个用户id同时执行foo这2个方法的),而且这个id又一直没有被lrumap清理掉, 就会导致内存值永久的缺失了一个值。就会出现之前的问题 了。

1 楼 kekeemx 2009-03-26  
如果并发经验比较丰富的大牛一眼就会看出问题所在,
不过我开始的时候一直是认为用户id对应的List没有同步才导致的值丢失,就出现了调用foo(value)方法返回false.当然了.这里list肯定也是需要同步的.但是问题的根源我后来想了很久发现还不是在于这个list没有同步。

问题应该出现在对 getDatafromDb()操作上.这个放到同步块外边会导致后边的put(uid,list)产生问题。

相关推荐

    高吞吐、线程安全的LRU缓存详解

    线程安全是指缓存能够在多线程环境中安全地执行读写操作,而不影响缓存的正确性和性能。为了实现线程安全,LRU 缓存采用了多种机制,例如使用锁机制来保护缓存的访问,使用 atomic reference 来维护缓存的顺序。 4....

    操作系统 LRU

    以上代码展示了LRU算法的基本思路,但并未涵盖所有细节,例如错误处理和多线程安全。在实际应用中,还需要考虑这些因素以确保正确性和性能。这个简单的C++实现可以作为一个起点,根据具体需求进行扩展和优化。

    concurrentlinkedhashmap-lru-1.3.jar.zip

    在ConcurrentLinkedHashMap-LRU 1.3中,这种策略被巧妙地融入到并发环境下,保证了在多线程环境下的高效运行。 该版本的ConcurrentLinkedHashMap实现了ConcurrentMap接口,保证了线程安全的读写操作。其核心设计...

    Volley。fastJson解析网络Json ,多线程显示图片,简单缓存图片,万能适配器,完美解决图片排序混乱问题,完美解决图片多次加载问题

    综上所述,这个项目展示了如何利用Volley进行网络请求和FastJson解析JSON数据,同时结合多线程和图片缓存技术优化用户体验。万能适配器则使得数据绑定更加灵活,解决了图片排序和加载问题,提升了应用的整体性能。

    java-leetcode题解之第146题LRU缓存.zip

    在实际编程中,可能还需要考虑并发安全,如果在多线程环境下使用,可以使用ConcurrentHashMap替换HashMap,使用LinkedBlockingDeque替换LinkedList,并使用synchronized关键字进行同步控制。 总的来说,Java实现LRU...

    LRU.rar_WORKING

    这个简单的实现提供了一种基础的LRU缓存机制,但实际应用中可能需要考虑线程安全、性能优化等更多因素。例如,可以使用`ConcurrentHashMap`代替`HashMap`以支持并发操作,或者使用`LinkedHashMap`替代自定义的链表...

    一个有用的性能和线程安全的Go数据结构的集合.zip

    7. **映射(Map)**: Go的标准库中的映射(map)并非完全线程安全,因此在多线程环境中使用时,需要额外的同步措施,如使用互斥锁或读写锁。 8. **双端队列(Doubly Linked List)**: 双端队列允许在两端进行插入和删除...

    Java集合框架Map接口.pdf

    Java集合框架中的Map接口是Java编程中非常重要的一个部分,它提供了一种存储键值对数据的方式。在Map中,每个键(key)都是...同时,如果在多线程环境中,可以考虑使用`ConcurrentHashMap`,它提供了线程安全的操作。

    C++开发在IOS环境下运行的LRUCache缓存功能.pdf

    为了在多线程环境中安全地访问Singleton实例,文章使用了读写互斥锁(Read-Write Lock)进行同步。读写互斥锁允许多个读取者同时访问资源,但只允许一个写入者。这样可以提高并发性能,因为读操作通常是无冲突的,而...

    LRU-Replacement-Policy

    注意,这个简化版本的LRU缓存并没有处理并发情况,如果在多线程环境下使用,还需要添加适当的同步机制,例如使用互斥锁。 总之,LRU替换策略是优化系统性能的关键手段之一,通过高效的数据结构实现,可以在内存资源...

    页面替换程序--操作系统

    - 锁和同步:多线程环境下,需要确保数据结构的线程安全,避免数据竞争。 页面替换算法的选择和实现直接影响系统的性能。不同的工作负载和应用环境可能会使得某种算法表现更优。因此,在实际操作系统的内存管理中,...

    map的概要介绍与分析

    - **并发需求**:在多线程环境中,应选择线程安全的Map实现,如Java中的`ConcurrentHashMap`,或者使用`std::unordered_map`加上适当的同步机制(例如互斥锁)来实现。 总之,Map作为一种灵活且高效的数据结构,其...

    java map 实现缓存技术

    5. **线程安全**:在多线程环境中,确保对缓存的操作是线程安全的。如果是并发访问,应使用ConcurrentHashMap。 6. **缓存更新与一致性**:当源数据发生更改时,需要同步更新缓存,以保持数据一致性。 7. **缓存...

    Java本地缓存的实现代码

    其线程安全的特性使得基于ConcurrentHashMap的LocalCache在多线程并发环境下的操作是安全的。在JDK1.8中,ConcurrentHashMap还支持完全并发读,这对本地缓存的效率也是一种提升。 基于LinkedHashMap的实现 ...

    Python性能优化经验谈.zip

    - GIL(全局解释器锁):理解Python的GIL限制了多线程的并行执行,但在多核CPU上,多进程可以实现真正的并行计算。 - `concurrent.futures`模块:提供线程池和进程池,方便地进行异步任务调度。 7. **C扩展与...

    图片下载工具类

    内存缓存利用Java集合框架如LRUMap(Least Recently Used Map)存储最近使用的图片,当内存不足时自动移除最不常用的图片。磁盘缓存则将图片保存在设备的文件系统中,通常在应用的私有目录下。 3. **图片处理**:...

    Redis入门必学操作手册

    4. **网络模型**:Memcached采用多线程非阻塞IO复用,Redis使用单线程的多路IO复用模型。 **Redis常见数据结构及其应用场景:** 1. **String**:基础的键值对,常用于存储简单数据,如计数器(如微博数、粉丝数)。...

    kkkNO1管理系统 (4).zip

    6. **并发编程与ConcurrentHashMap**:在多线程环境下,Java提供`java.util.concurrent.ConcurrentHashMap`类,它提供了线程安全的Map实现,同时保持高性能。相比于`synchronized` Map,ConcurrentHashMap使用分段锁...

    C++、基于MFC的模拟内存分页系统-2025

    MFC、多线程 该项目要求使用LRU算法对一个大文件进行读取,模拟内存不够大时,想要处理大文件的情况,每次读取一个页面,并对该页面进行操作,当内存空间不足时,置换出最近最久未使用的页面。 在这个项目中,使用了...

    Python高性能编程技术

    7. **多线程与多进程**: Python的全局解释器锁(GIL)限制了多线程在CPU密集型任务中的并行性,但在IO密集型任务中,多线程依然有用。多进程可以绕过GIL,利用多核CPU资源,但有额外的进程管理开销。 8. **并发与...

Global site tag (gtag.js) - Google Analytics