`

Berkeley DB使用简介

 
阅读更多
BDB的全称Berkeley DB,是一套开放源码的嵌入式数据库的程序库。它为应用程序提供可伸缩的、高性能的、有事务保护功能的数据管理服务。Berkeley DB为数据的存取和管理提供了一组简洁的函数调用API接口。

BDB为多种编程语言提供了API接口,其中包括C、C++、Java、Perl、Tcl、Python和PHP,所有的数据库操作都在程序库内部发生。多个进程,或者同一进程的多个线程可同时使用数据库,有如各自单独使用,底层的服务如加锁、事务日志、共享缓冲区管理、内存管理等等都由程序库透明地执行。

BDB物理结构:

2        存储逻辑介绍

BDB所管理数据的逻辑组织单位是若干个独立或有一定关系的数据库(database),每个数据库由若干记录组成,这些记录全都被表示成(key,value)的形式。

如果把一组相关的(key,value)对也看作一个表的话,那么每一个数据库只允许存放一个table,这一点不同于一般的关系数据库。实际上,在Berkeley DB中所提到的“数据库”,相当于一般关系数据库系统中的表;而“key/data”对相当于关系数据库系统中的行(rows);Berkeley DB不提供关系数据库中列直接访问的功能,而是在“key/data”对中的data项中通过实际应用来封装字段(列)。

在物理组织上,每一个数据库在创建的时候可以由应用程序根据其数据特点来选择一种合适的存储结构。可供选择的四种文件存储结构分别是:哈希、B树、定长记录(队列)和变长记录(基于记录号的简单存储方式)。

其中定长记录和变长记录存储方法必须使用逻辑记录号(logical record numbers,本质上就是一个整数)做为key。

哈希和B树存储方法对key没有特别的要求。当数据量非常多时(内存不能放下所有数据时),建议使用哈希,因为哈希比B树的索引信息小,会少一些I/O操作。
3        系统结构介绍:

BDB由五个主要的子系统构成.包括: 存取管理子系统、内存池管理子系统、事务子系统、锁子系统以及日志子系统。     
3.1      数据存取子系统

    数据存取(Access Methods)子系统为创建和访问数据库文件提供了多种支持。Berkeley DB提供了以下四种文件存储方法:

哈希文件、B树、定长记录(队列)和变长记录(基于记录号的简单存储方式),应用程序可以从中选择最适合的文件组织结构。

创建表时可以使用任意一种结构,并且可以在同一个应用程序中对不同存储类型的文件进行混合操作。
3.2      内存池管理子系统

    内存池(Memory pool)子系统对Berkeley DB所使用的共享缓冲区进行有效的管理。它允许同时访问数据库的多个进程或者进程的多个线程共享一个高速缓存,负责将修改后的页写回文件和为新调入的页分配内存空间。

    它也可以独立于Berkeley DB系统之外,单独被应用程序使用,为其自己的文件和页分配内存空间。

内存池管理子系统适用于需要灵活的、面向页的、缓冲的共享文件访问的应用。

内存数据和硬盘文件的同步有两种方式:

1.         需要程序显式条用同步函数才能完成,当数据量比较大时同步比较慢,会造成大量的I/O操作,而且由于内部锁的原因,会对查询造成影响。

2.         在BDB打开时会设置一个cache的大小,也就是BDB使用内存的大小。如果超过这个大小,BDB会自动同步数据到硬盘文件。
3.3      事务子系统



本文来自: (www.91linux.com) 详细出处参考:http://www.91linux.com/html/article/database/20071202/8699.html





事务(Transaction)子系统为Berkeley DB提供事务管理功能。它允许把一组对数据库的修改看作一个原子单位,这组操作要么全做,要么全不做。在默认的情况下,系统将提供严格的ACID事务属性,但是应用程序可以选择不使用系统所作的隔离保证。该子系统使用两段锁技术和先写日志策略来保证数据库数据的正确性和一致性。

它也可以被应用程序单独使用来对其自身的数据更新进行事务保护。事务子系统适用于需要事务保证数据的修改的应用。

在本次项目里,并没有用到事务,所以对此研究也不够深入。
3.4      锁子系统

    锁(Locking)子系统为BDB提供锁机制,为系统提供多用户读取和单用户修改同一对象的共享控制。

数据存取子系统可利用该子系统获得对页或记录的读写权限;事务子系统利用锁机制来实现多个事务的并发控制。  

该子系统也可被应用程序单独采用。锁子系统适用于一个灵活的、快速的、可设置的锁管理器。

目前的使用上来看,当使用BDB的进程异常终止时,所占用的锁并不能释放,需要删除BDB环境文件才能释放所有锁。这个问题后期再详细研究一下。
3.5      日志子系统

日志(Logging)子系统采用的是先写日志的策略,用于支持事务子系统进行数据恢复,保证数据一致性。
4        编译、安装

可以在http://www.oracle.com/technology/products/berkeley-db/index.html 现在最新的安装包和文档。

       将安装包结压后,进入build_unix目录

    ../dist/configure

    Make

    Make install

    就可以完成编译,安装

       安装的默认目录是/usr/local/BerkeleyDB.4.5/,如果要安装到其他目录,在configure是指定--prefix=NEW_DIR即可。如果要使用BDB的c++,在configure指定--enable-cxx即可。


本文来自: (www.91linux.com) 详细出处参考:http://www.91linux.com/html/article/database/20071202/8699_2.html







5        C++API介绍

经常用的类有5个

1.         DbEnv:环境类,主要用于设置BDB是否需要日志、是否需要锁等信息;提供打开、关闭等操作

2.         Db:DB类,用户操作数据,提供打开、关闭、查找、删除、同步等操作

3.         Dbt:数据类,向Db中存入、取出数据都需要使用这个类。

4.         DbException及其子类:异常类

5.         Dbc:游标类,当对数据库中多组数据进行操作时使用

#include <db_cxx.h>
 
#include <string>
 
#include <iostream>
 
using namespace std;
 
DbEnv *g_env = NULL;
 
Db *g_db = NULL;
 
void closeEnv()
 
{
 
    try
 
    {
 
        if(g_db)
 
        {
 
            g_db->close(0);
 
            delete g_db;
 
            g_db = NULL;
 
        }
 
        if(g_env)
 
        {
 
            g_env->close(0);
 
            delete g_env;
 
            g_env = NULL;
 
        }
 
    }
 
    catch(...)
 
    {
 
    }
 
}
 
int main()
 
{
 
    //环境目录,日志文件将创建在这个目录下
 
    string strEnvHome = "./db/";
 
    //创建DB|初始化日志
 
    unsigned int nEnvFlags = DB_CREATE | DB_INIT_LOG | DB_INIT_MPOOL;   

   

    //db文件名
 
    string strDbFileName = get_current_dir_name();
 
    strDbFileName += "/db/datafile";   

   

    try
 
    {
 
        g_env = new DbEnv(0);
 
        g_env->set_error_stream(&std::cerr);
 
        g_env->set_cachesize(0, 10 * 1024 * 1024, 1);
 
        //打开环境
 
        g_env->open(strEnvHome.c_str(), nEnvFlags, 0);
 
       

        g_db = new Db(g_env, 0);
 
        g_db->set_error_stream(&std::cerr);
 
        //用B树的结构打开数据库,如果不存在则创建
 
        g_db->open(NULL, strDbFileName.c_str(), NULL, DB_BTREE, DB_CREATE, 0);
 
    }
 
    catch(DbException& e)
 
    {
 
        cout<<"打开数据库出错:"<<e.what()<<endl;
 
        closeEnv();
 
        return -1;
 
    }
 
   

    Dbt key, data;
 
    char sKey[1024], sData[1024];
 

本文来自: (www.91linux.com) 详细出处参考:http://www.91linux.com/html/article/database/20071202/8698.html
 
 
 
 
 
 
 
 //插入数据库
 
   try
 
   {
 
     for(int i=0; i<100; i++)
 
     {       

         snprintf(sKey, sizeof(sKey), "key%d", i);
 
         snprintf(sData, sizeof(sData), "data%d", i);
 
        

         key.set_data(sKey);
 
         key.set_size( strlen(sKey) );
 
         data.set_data(sData);
 
         data.set_size( strlen(sData) );
 
        

         //put方法:当数据库中有对应的key时,做updata操作;当没有对应的key时,做insert操作
 
         if( g_db->put(NULL, &key, &data, 0) != 0)
 
         {
 
            //插入出错
 
            cout<<"插入第"<<i<<"个数据时出错"<<endl;
 
         }
 
     }
 
   }
 
   catch(DbException& e)
 
   {
 
      cout<<"写入数据库出错:"<<e.what()<<endl;
 
      closeEnv();
 
      return -1; 

   }
 
   

    //同步内存的数据到文件
 
    g_db->sync(0);
 
   

    //查找数据
 
    try
 
    {
 
        snprintf(sKey, sizeof(sKey), "key%d", 57);
 
        key.set_data(sKey);
 
        key.set_size( strlen(sKey) );
 
       

        if(g_db->get(NULL, &key, &data, 0) != 0)
 
        {
 
            //未查找到
 
            cout<<"未查找到,key:"<<sKey<<endl;
 
        }
 
        else
 
        {
 
            //查找到
 
            memcpy(sData, data.get_data(), data.get_size() );
 
            sData[data.get_size()] = '/0';
 
           

            cout<<"key:"<<sKey<<";data:"<<sData<<endl;
 
        }
 
    }
 
    catch(DbException& e)
 
    {
 
      cout<<"查找数据库出错:"<<e.what()<<endl;
 
      closeEnv();
 
      return -1; 

    }
 
   

    //用游标遍历
 
    try
 
    {
 
        Dbc *cursorp;       

            

        if( g_db->cursor(NULL, &cursorp, 0) != 0)
 
        {
 
            cout<<"[get cursor 错误."<<endl;
 
        }
 
        else
 
        {
 
            while (cursorp->get(&key, &data, DB_NEXT) == 0)
 
            {
 
                memcpy(sKey, key.get_data(), key.get_size() );
 
                sKey[key.get_size()] = '/0';
 
                memcpy(sData, data.get_data(), data.get_size() );
 
                sData[data.get_size()] = '/0';
 
               

                cout<<"key:"<<sKey<<";data:"<<sData<<endl;
 
            }
 
        }
 
    }
 
    catch(DbException& e)
 
    {
 
      cout<<"用游标遍历出错:"<<e.what()<<endl;
 
      closeEnv();
 
      return -1; 

    }
 
    closeEnv();
 
}
分享到:
评论

相关推荐

    晋城市-晋城市-街道行政区划_140500_Shp数据-wgs84坐标系.rar

    晋城市-晋城市-街道行政区划_140500_Shp数据-wgs84坐标系.rar

    【Linux系统管理】经典Linux面试题汇总:涵盖路径操作、文件管理、权限设置及磁盘配额查询等核心知识点

    内容概要:本文档汇总了46个经典的Linux面试题及其答案,涵盖了Linux系统操作的基本命令和概念。内容涉及路径表示与目录切换、进程管理、文件和目录操作、权限设置、文件内容查看等多个方面。每个问题都给出了明确的答案,旨在帮助面试者全面掌握Linux命令行操作技能,同时加深对Linux系统原理的理解。 适合人群:准备Linux相关职位面试的求职者,尤其是有一定Linux基础但缺乏实战经验的技术人员。 使用场景及目标:①用于个人自学或面试前复习,巩固Linux基础知识;②作为企业内部培训资料,帮助员工提升Linux操作水平;③为初学者提供系统化的学习指南,快速入门Linux命令行操作。 其他说明:文档内容侧重于实际操作命令的讲解,对于每个命令不仅提供了基本语法,还解释了具体应用场景,有助于读者更好地理解和记忆。建议读者在学习过程中多加练习,将理论知识转化为实际操作能力。

    唐山市-路南区--街道行政区划_130202_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接下载使用。

    【C++编程竞赛】华中杯C++真题解析:涵盖函数参数传递、宏定义、数组操作等10个经典算法题型及源码实现

    内容概要:本文提供了10道华中杯C++竞赛真题的详细解析,涵盖多种基础编程技能与高级特性。每道题目不仅包含详细的解题思路和代码实现,还附带了完整的运行结果。具体包括:函数参数传递(指针实现)、宏定义比较、数组元素打印、几何图形面积计算、字符串拼接、素数判断、多态的实现、文件操作、简单计算器和学生信息管理。这些题目帮助读者深入理解C++语言的核心概念和技术应用。 适合人群:对C++有一定了解的编程初学者和中级开发者,尤其是准备参加编程竞赛的学生或程序员。 使用场景及目标:①作为编程练习和竞赛备考资料,帮助读者掌握C++的基本语法和常用算法;②通过实际代码示例加深对C++特性的理解,如指针、宏定义、面向对象编程等;③提供完整的源码供读者参考和调试,增强动手能力和问题解决能力。 阅读建议:建议读者按照题目难度逐步学习,先理解题目背景和解题思路,再仔细研读代码实现,并尝试独立编写和调试代码。同时,鼓励读者扩展思考,探索更多可能的解决方案,以提高编程水平。

    邯郸市-曲周县--街道行政区划_130435_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接使用。

    沧州市-孟村回族自治县--街道行政区划_130930_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接使用。

    通用计算器的设计FPGA.doc

    通用计算器的设计FPGA.doc

    晋城市-沁水县-街道行政区划_140521_Shp数据-wgs84坐标系.rar

    晋城市-沁水县-街道行政区划_140521_Shp数据-wgs84坐标系.rar

    赤峰市-松山区-街道行政区划_150404_Shp数据-wgs84坐标系.rar

    赤峰市-松山区-街道行政区划_150404_Shp数据-wgs84坐标系.rar

    JAVA中Stream编程常见的方法分类

    JAVA中Stream编程常见的方法分类

    呼和浩特市_和林格尔县_街道级--街道行政区划_150123_Shp_wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接使用。

    【K02】基于51单片机的秒表计时器设计(二).zip

    大同市-浑源县-街道行政区划_140225_Shp数据-wgs84坐标系.rar

    大同市-浑源县-街道行政区划_140225_Shp数据-wgs84坐标系.rar

    包头市-昆都仑区-街道行政区划_150203_Shp数据-wgs84坐标系.rar

    包头市-昆都仑区-街道行政区划_150203_Shp数据-wgs84坐标系.rar

    临汾市-翼城县-街道行政区划_141022_Shp数据-wgs84坐标系.rar

    街道级行政区划shp矢量数据,wgs84坐标系,下载直接使用

    张家口市-阳原县--街道行政区划_130727_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接下载使用。

    汽车电子车载网络拓扑开发概述:涵盖总线类型、设计原则及流程优化

    内容概要:本文详细介绍了车载电子电器架构中的网络拓扑开发,涵盖开发概述、车载网络总线、网络设计原则、开发流程及小结。网络拓扑开发是汽车电气架构中的重要环节,旨在设计合理的网络结构以确保各电子控制单元(ECU)之间的高效通信。文中阐述了通信协议选择、网络节点布局、通信介质选择、拓扑结构设计及安全性考虑等关键要素,并强调了仿真与验证的重要性。此外,还讨论了网络设计的原则,如前瞻性、兼容性、拓展性、实时性、可靠性和安全性,以及网络负载的优化措施。最后,总结了网络拓扑开发的流程,包括需求分析、设计、仿真验证、优化迭代及文档记录。 适合人群:汽车电子工程师、各域功能工程师、子系统及零部件开发者、测试工程师等从事汽车电气架构开发的相关人员。 使用场景及目标:①帮助工程师理解汽车网络拓扑开发的关键步骤和技术要点;②指导工程师在设计过程中遵循科学合理的设计原则,确保网络拓扑的高性能和可靠性;③提供网络负载优化的措施,确保数据传输的实时性和效率。 其他说明:网络拓扑开发不仅需要考虑技术层面的因素,还需兼顾成本效益,以适应不断变化的市场需求和技术趋势。本文建议读者在实践中不断积累经验,关注新技术的应用和发展,以应对未来的挑战和机遇。

    金融行业智能分析AI Agent的应用实践与技术创新:提升企业数字化决策能力

    内容概要:本文探讨了智能分析AI Agent在金融行业的先进实践与展望,指出金融行业在经营分析领域面临的现状和痛点,包括管理团队无法快速获得深度结论,业务团队面对BI产品学习门槛高、依赖人工等问题。文中介绍了智能分析AI Agent相较于传统解决方案的技术创新,如数据建模右移、基于虚拟层的数据编织、指标平台与大模型组合方案等,强调其在降低使用门槛、提高效率和增强交互性方面的优势。同时,文章展示了智能分析AI Agent在交互式指标问询、自动分析报告生成等应用场景中的价值,并对未来的发展进行了展望。 适合人群:金融行业的管理层、业务分析师、数据科学家以及对金融科技感兴趣的从业者。 使用场景及目标:①帮助管理层快速获取数据背后的深层次原因和结论;②降低业务团队使用数据分析工具的门槛,提高工作效率;③实现数据的自动化处理和分析,减少人工干预;④推动企业内部的数据民主化,使更多员工能够参与数据分析和决策。 阅读建议:本文不仅提供了智能分析AI Agent的技术细节,还结合实际案例展示了其应用效果,因此在阅读过程中应重点关注技术创新点及其对企业管理和业务流程的具体影响。

    邢台市-南宫市--街道行政区划_130581_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接下载使用。

    脑机接口基于贝叶斯优化的FBCCA参数自动调优系统设计与实现:EEG数据处理及优化流程详解

    内容概要:本文档详细介绍了将贝叶斯优化应用于FBCCA(滤波器组公共空间模式)参数调整的完整解决方案,包括代码实现和优化流程。首先,通过MNE库加载并预处理EEG数据,进行7-30Hz的预滤波处理,提取相关事件片段。接着,定义了FBCABayesianOptimizer类,该类包含创建动态滤波器组、获取模型参数以及定义优化目标函数的方法。其中,参数空间由离散和连续参数组成,涵盖了滤波器数量、CSP组件数、起始频率、带宽、交叠率等,并通过Optuna库进行多维搜索。优化过程中采用5折交叉验证机制,同时引入智能早停策略以提高效率。最后,提供了优化结果的可视化工具,如优化轨迹图、参数重要性图和滤波器组配置图,帮助用户更好地理解和分析优化过程。 适合人群:具有一定编程基础,尤其是对机器学习、脑电数据分析及贝叶斯优化感兴趣的科研人员和技术开发者。 使用场景及目标:①通过动态滤波器组生成算法,捕捉频段间的过渡特征;②利用混合参数空间设计,探索不同参数组合的效果;③借助高效交叉验证机制和智能早停策略,提高优化效率;④通过可视化工具,直观展示优化过程和结果。 阅读建议:此资源不仅展示了完整的代码实现,还深入探讨了FBCCA参数调整的理论基础和实际应用。建议读者在学习过程中结合理论知识与代码实践,逐步理解每个步骤的原理,并尝试调整参数以观察不同设置对优化效果的影响。同时,可根据自身硬件条件,考虑扩展建议中的GPU加速、分布式优化和在线学习等高级特性。

Global site tag (gtag.js) - Google Analytics