`
sebarzi
  • 浏览: 1396 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

密文全文检索系统中大规模密文文档管理研究

阅读更多
报告内容
1、选题来源及研究的意义
2、国内外研究现状及分析
3、主要研究内容
1、选题来源及研究的目的和意义
来源863 项目计划
(二)密文文档的分布式安全存储
分布式密文全文检索系统关键技术研究 ( 国家863计划项目 ) (2007AA01Z403 ) ( 2007 - 2009 )

Mimir数据特点
Mimir数据属性:  
      (1)密态小文档:
      (2)结构化XMl文档加密后大小3-10k;
      (3)数目达到百万甚至千万篇(T级数据)
      (4)密钥更换
      (5)全文检索服务

管理难点:
      (1)块数据管理
      (2)单xml文档管理
      (3)热点数据的处理

目标细化
结构上:
(1)文档管理模块与上层查询模块松耦合,实现由文件名透明访问文件

性能上:
(2)实现百万篇级密文文档分布式存储、随机访问
(3)查找并内容返显的时间控制在一定范围[目标500ms/30篇]
(4)文档密钥更换以及安全审计
(5)优化的压缩算法和解压速度

课题意义
有助于加强各行各业文献信息资源建设、开发、利用,其产品的推广也将带来巨大的社会和经济效益,对我国科技进步和经济、社会发展具有十分重要的战略意义。

         (1)密文全文检索系统(协作)
         (2)涉密小文档的管理(独立)
2、国内外研究现状及分析
2.1 搜索引擎中的文档管理体系结构
2.2 搜索引擎中的文档存储策略
2.3 搜索引擎中的文档数据更新维护策略
2.4 密文全文检索系统中密文文档管理需求
2.1 搜索引擎中的文档管理体系结构
(1)基于数据库思路的:
     Yahoo!PNUTS
(2)基于文件系统思路的:
     Google: GFS+Bigtable+MapReduce
      天网搜索 类似Google,但又有差别[blocksize/ Read]
(3)基于网络虚拟存储思路的:
     目前没有用于搜索引擎的,p2p文件共享的  居多
2.2 搜索引擎中的文档存储策略
共性:
(1)目标都是一致的,为检索请求提供及时的数据。 “三本”方式
(2)存储策略的选择依赖搜索引擎选择的存储体系结构。
(3)搜索引擎中数据的存储量非常大、单个文件大小不一致、数据格式不统一、数据内容千差万别、数据更新速度不一致等等。
(4)对数据进行分类压缩存储,并保证一定的解压速度
(5)数据在块级别上一般都实现了冗余备份,具有一定的容错性

特性:
   Google    Bigtable  行列
   Yahool!   PNUTS  table
2.3 搜索引擎中的文档数据更新维护策略
(1)数据更新维护的范围和粒度
   局部少、全局频繁、块级别、单文档

(2)数据更新维护的类型和内容
   读、写、删除、移动

(3)数据更新维护的代价
    数据库、文件系统
2.4 密文全文检索系统中密文文档管理需求
(1)块级别管理
   密态小文档合并成块后,系统对大块数据的管理能够提供扩展性、灵活性。系统能够管理千万篇的文档数据,在大数据集下系统性能稳定。

(2)单密态文档管理
   适应涉密企事业单位的涉密公文的类型、大小、加密和密钥更换需求,同时对热点文档做优化处理。

3、主要研究内容
   1.MStore框架设计
   2.MStore数据存储策略
   3.MStore数据操作
4、技术方案与进度安排
主要技术关键包括:
1、块的大小选择和属性定义。
2、加密粒度和快速解压设计。
3、热点文档的处理。
4、块数据和单密文文档数据的缓存策略

分享到:
评论

相关推荐

    密文全文检索系统中的索引机制研究

    密文全文检索系统中的索引机制研究的文献文献

    HTML基于Web的数据库加密与密文检索系统源码.zip

    HTML基于Web的数据库加密与密文检索系统源码HTML基于Web的数据库加密与密文检索系统源码HTML基于Web的数据库加密与密文检索系统源码HTML基于Web的数据库加密与密文检索系统源码HTML基于Web的数据库加密与密文检索...

    高分项目基于AES密文检索系统源码+项目说明+数据库.zip

    高分项目基于AES密文检索系统源码+项目说明+数据库.zip 高分项目基于AES密文检索系统源码+项目说明+数据库.zip 高分项目基于AES密文检索系统源码+项目说明+数据库.zip 高分项目基于AES密文检索系统源码+项目说明+...

    分布式环境下多关键词并行密文检索方案.pdf

    分布式环境下多关键词并行密文检索方案是计算机安全领域中的一个重要研究方向,它旨在解决在保证数据安全性的前提下如何高效检索加密数据的问题。可搜索加密(Searchable Encryption)是一种允许用户对密文执行...

    基于Simhash的安全密文排序检索方案.pdf

    在密文检索中应用Simhash,可以构建安全多关键词密文排序检索索引(SMRI),这是一种基于Simhash降维思想的索引结构。通过对文档进行处理,可以生成文档的指纹和向量表示,然后利用这些分段指纹和加密向量构建B+树...

    人工智能-项目实践-信息检索-密文检索系统(基于AES加密)

    在本项目实践中,我们关注的是一个融合了人工智能、安全性和信息检索技术的系统——密文检索系统。这个系统的核心特点是其使用了高级加密标准(AES)来保护数据的安全性,同时允许用户对加密后的信息进行有效检索。...

    加密与密文检索云服务系统.pdf

    加密与密文检索云服务系统.pdf

    区块链电子病历中基于密钥聚合的密文检索方案.pdf

    本文主要探讨了一种在区块链电子病历系统中应用的基于密钥聚合的密文检索方案。这个方案旨在解决如何在保证患者数据隐私的同时,高效地...未来的研究可能会进一步探索如何在更大规模的系统中实施此方案,并优化其性能。

    基于区块链的公平可靠密文检索系统.pdf

    根据提供的文件信息,本篇知识解读将专注于标题《基于区块链的公平可靠密文检索系统.pdf》所涉及的知识点。这篇文章探讨了在云计算环境下,用户如何在保证数据安全的前提下,实现对存储在云服务器上的加密数据进行...

    LEAF:基于同态加密的高效密文检索技术.pdf

    高效密文检索技术 基于同态加密的LEAF技术是一种高效的密文检索技术,它可以实现在加密数据上进行快速检索的操作。下面是LEAF技术的详细知识点: 同态加密概念 同态加密是一种特殊的加密技术,它允许在加密数据上...

    密文数据库检索技术综述.docx

    【密文数据库检索技术综述】 数据库技术是信息技术的核心组成部分,随着云计算的发展,数据安全问题愈发突出。在云环境中,用户的数据通常存储在第三方服务提供商的服务器上,这引发了数据隐私保护的需求。密文...

    密文检索系统源码+项目说明+数据库(基于AES加密).zip

    【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考...密文检索系统源码+项目说明+数据库(基于AES加密).zip

    支持检索关键词语义扩展的可排序密文检索方案.pdf

    针对云计算环境下已有的密文检索方案不支持检索关键词语义扩展、精确度不够、检索结果不支持排序的问题,提出一种支持检索关键词语义扩展的可排序密文检索方案。首先,使用词频逆文档频率(TF-IDF)方法计算文档中关键词...

    明文变密文和密文变明文

    在这个过程中,明文(未加密的数据)通过特定的算法和密钥转换为密文(加密后的数据),而密文再通过相应的解密过程恢复成明文。本文将深入探讨这些概念以及相关的加密技术。 首先,我们需要了解什么是明文和密文。...

    云环境下安全密文区间检索方案的新设计

    针对目前密文区间检索多次断言存在信息泄露等问题,有单断言的密文区间检索方案(SRQSAE 方案),并证明方案在唯密文攻击下的隐私安全性。对SRQSAE方案的安全性进行了分析,分析结果表明SRQSAE方案并不能隐藏搜索...

    云计算环境下密文搜索算法的研究.pdf

    在研究云计算环境下密文搜索算法的过程中,相关研究人员和工程师应深入探索和完善密文搜索技术,使其能够适应不断变化的云计算环境,切实保障用户数据的安全和隐私。通过不断的技术创新和理论研究,密文搜索技术有望...

Global site tag (gtag.js) - Google Analytics