`
fly_hyp
  • 浏览: 307822 次
  • 性别: Icon_minigender_1
  • 来自: 合肥
社区版块
存档分类
最新评论

分布式Key-Value数据的开发可行性分析

    博客分类:
  • Java
阅读更多

 

前段时间和同事讨论key-Value DB的用途的问题,说是非常的有用。下周打算实现一个原型。今天把前几天写的文档总结一下。希望大家提些建议和意见。

功能:
    相对于关系数据库功能更少,只提供有限的Key-Value查询功能,以及一些可管理功能。相对于关系数据库可以提供更加强劲的性能,提供更好的可管理性(大部分自管理),可伸缩性。
    目标:
           简单的Key-Value操作
           管理功能
           自管理特性
           高性能
           数据高安全
 
应用范围:
    大数据量、高访问量的网站
    对数据安全要求高的软件
 
项目工程:
    因为总体功能比较少,各个组成部分可以使用现有的技术,开发工作量应该不会很大。1-2个人就可以完成。
    数据存储层可以用berkeydb 或 Mysql
    数据通讯可以用Http协议 或 tcp
   
功能设计
    每一个数据存 N 份 Copy
    Client 向一个节点写数据,同时复制给其他copy节点
 
    客户端API
        get(groupName,key)
        getMulti(groupName,keys)
        set(groupName,key,value)
        setMulit(groupName,keyValuePairs)
        listKey(groupName,startPos,count)
        listKey(groupName,startKey,count)
 
     管理功能
        查看各节点运行情况
        添加节点
        移除节点
 
     性能管理
        查看各客户端(ip)的使用量数据 (命中内存的次数、未命中内存的次数、写的次数)
        查看各个账号的使用量数据  (命中内存的次数、未命中内存的次数、写的次数)
        限制某客户端(ip)的使用
        限制某账号的使用
2
0
分享到:
评论
2 楼 fly_hyp 2009-04-26  
willko 写道

支持支持支持支持开发好了,通知一声我希望能加入基本的数据结构,链表、集合之类的。。。

谢谢关注。希望用一周时间出一个能用的原型。
1 楼 willko 2009-04-25  
支持支持支持支持
开发好了,通知一声
我希望能加入基本的数据结构,链表、集合之类的。。。

相关推荐

    基于云计算的大数据分析平台构建研究.pdf

    传统的关系型数据库管理系统(RDBMS)在处理半结构化和非结构化数据方面存在局限性,而NoSQL数据库,如键值存储(Key-Value Stores)、文档存储(Document Stores)、列式存储(Column-Family Stores)等,则能够更...

    基于映射_归约的分布式并行索引方法的研究与改进.pdf

    这证明了分布式并行索引方法在处理大数据集时的可行性和高效性。 总的来说,本文提出了一种基于映射/归约框架的分布式并行索引方法,并通过改变映射节点中间数据的结构和使用改进的排序函数,对传统方法进行了改进...

    MemcacheRedisMongoDB数据缓存系统方案对比与分析.docx

    Memcached简单易用,适合基本的Key-Value缓存,而Redis则提供了更丰富的数据结构和持久化选项,适合需要更复杂操作和数据持久化的场景。选择哪种方案,需要根据具体的应用需求和业务场景来决定。

    浅谈云计算环境下的大规模图数据处理技术.pdf

    本文通过分析云计算环境下大规模图数据处理技术的实践应用情况,研究了大规模图数据处理问题,总结了关键性技术实施情况,并探讨了这些技术在未来技术创新中的可行性。这项研究为中国未来在大规模图数据处理技术方面...

    大数据时代档案信息资源共享平台数据存储系统的设计与实现.pdf

    本文将探讨在大数据时代背景下,档案信息资源共享平台数据存储系统的设计与实现,详细分析了利用Hadoop分布式文件系统(HDFS)和Redis缓存技术来构建高性能的档案信息资源存储系统的设计方案,并对所提出的架构的...

    MapReduce-a-flexible-data-.rar_mapReduce_reduce

    总的来说,MapReduce通过将复杂的大数据处理任务分解为可并行处理的小部分,极大地提高了大规模数据处理的效率和可行性。其设计理念和实现方式对分布式计算领域产生了深远影响,成为现代大数据技术栈中的重要组成...

    Hadoop权威指南

    MapReduce作业分为Map阶段和Reduce阶段,Map阶段主要负责读取输入数据并进行处理,然后生成键值对(key-value pairs);Reduce阶段则接收键值对并进行汇总。MapReduce将任务分解成多个小任务,通过并行处理来提高...

    高并发下的大数据处理架构探索与实践.pdf

    在分布式数据库的选择上,存在基于Key-Value的NoSQL数据库(如Hadoop、Cassandra等)和基于传统数据库的分布式数据库(如CloudSQL、GBase集群数据库等)两种主要方案。前者在某些方面具有优势,如水平扩展能力较强、...

    海量数据处理常用方法

    关联式容器是基于键值对(key-value pair)的概念设计的。常见的关联式容器包括: - **Set**:存储唯一键值的容器,支持高效的查找操作。 - **Map**:存储键值对的容器,键必须是唯一的。 - **Multiset**:与Set相似,...

    金融信息服务平台项目技术与方案.pdf

    最后,经费预算部分未详细列出,但显然会考虑开发、人力、运维等各项成本,以确保项目的经济可行性。 综上所述,该金融信息服务平台项目技术方案着重于打造一个高效、安全、易维护的系统,通过合理的架构设计和技术...

    《大数据技术原理和应用操作》试卷B卷及答案.docx

    **判断题部分**涵盖了reduce()函数的功能(对相同key的value进行汇总)、Zookeeper选举机制(基于FastLeaderElection算法,多数票获胜)、Source组件(数据收集)、SecureCRT(SSH终端仿真程序)、大数据在医疗行业...

    第二次哈希表.pdf

    - **定义**: 哈希表是一种高效的数据结构,它通过哈希函数将键(Key)转换为索引值,进而快速地访问存储在该索引位置的值(Value)。 - **基本操作**: - 插入: 根据键值对 (Key, Value) 进行插入操作。 - 查找: 通过键...

    基于MapReduce框架一种文本挖掘算法的设计与实现

    通过对比不同规模数据集的处理时间,可以看出算法的效率随数据量的增加而保持稳定,验证了其在实际应用中的可行性与优势。 #### 结论与展望 综上所述,基于MapReduce框架的文本挖掘算法为从大规模文本数据中提取有...

    键值对数据库综述.doc

    键值对数据库是一种非关系型数据库,其核心概念是通过键(Key)来唯一标识和检索数据,而值(Value)则包含实际存储的信息。这种数据模型非常简单,适合大规模数据存储和高并发访问,特别是在分布式环境中的水平扩展...

    键值对数据库综述.docx

    而面向内存的读写方式则将所有数据存储在内存中,避免磁盘I/O延迟,适用于对特定数据进行高速并发访问的场景,随着内存技术的发展,这种方式变得越来越可行。 键值数据库的优点在于: 1. 高效的读写性能,尤其是...

    ReferenceCards15-PDF.rar

    MongoDB 是一个流行的开源、分布式文档数据库系统,它属于NoSQL数据库家族,以其高性能、高可用性和可伸缩性而闻名。"ReferenceCards15-PDF.rar" 文件很可能包含了一份关于MongoDB数据库基本操作的参考卡片,PDF文档...

    MapReduce基础.pdf

    MapReduce模型和Hadoop框架的发展,对处理大规模数据集的效率和能力带来了革命性的提升,使得原来难以处理的数据分析工作变得可行,尤其在处理互联网搜索、社交网络、大数据分析等领域展现出了强大的能力。

Global site tag (gtag.js) - Google Analytics