`

无限分类树设计方案之左值右值

阅读更多

引自:

http://blog.csdn.net/monkey_d_meng/article/details/6647488
http://wizardmin.com/2012/08/left-right-code-tree/
http://www.eeice.com/archive/design/zuoyou-fl.html
http://demo.netfoucs.com/dreamer0924/article/details/7580278
http://www.tuicool.com/articles/yQveEn

 

 

程序设计过程中,我们常常用树形结构来表征某些数据的关联关系,如企业上下级部门、栏 目结构、商品分类等等,通常而言,这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库,都是以二维表的形式记录存储数据信息,因此 是不能直接将Tree存入DBMS,设计合适的Schema及其对应的CRUD算法是实现关系型数据库中存储树形结构的关键。

    理想中树形结构应该具备如下特征:数据存储冗余度小、直观性强;检索遍历过程简单高效;节点增删改查CRUD操作高效。无意中在网上搜索到一种很巧妙的 设计,原文是英文,看过后感觉有点意思,于是便整理了一下。本文将介绍两种树形结构的Schema设计方案:一种是直观而简单的设计思路,另一种是基于左 右值编码的改进方案。

一、基本数据

    本文列举了一个食品族谱的例子进行讲解,通过类别、颜色和品种组织食品,树形结构图如下:

二、继承关系驱动的Schema设计

    对树形结构最直观的分析莫过于节点之间的继承关系上,通过显示地描述某一节点的父节点,从而能够建立二维的关系表,则这种方案的Tree表结构通常设计为:{Node_id,Parent_id},上述数据可以描述为如下图所示:


    这种方案的优点很明显:设计和实现自然而然,非常直观和方便。缺点当然也是非常的突出:由于直接地记录了节点之间的继承关系,因此对Tree的任何 CRUD操作都将是低效的,这主要归根于频繁的“递归”操作,递归过程不断地访问数据库,每次数据库IO都会有时间开销。当然,这种方案并非没有用武之 地,在Tree规模相对较小的情况下,我们可以借助于缓存机制来做优化,将Tree的信息载入内存进行处理,避免直接对数据库IO操作的性能开销。

三、基于左右值编码的Schema设计

    在基于数据库的一般应用中,查询的需求总要大于删除和修改。为了避免对于树形结构查询时的“递归”过程,基于Tree的前序遍历设计一种全新的无递归查询、无限分组的左右值编码方案,来保存该树的数据。


    第一次看见这种表结构,相信大部分人都不清楚左值(Lft)和右值(Rgt)是如何计算出来的,而且这种表设计似乎并没有保存父子节点的继承关系。但当 你用手指指着表中的数字从1数到18,你应该会发现点什么吧。对,你手指移动的顺序就是对这棵树进行前序遍历的顺序,如下图所示。当我们从根节点Food 左侧开始,标记为1,并沿前序遍历的方向,依次在遍历的路径上标注数字,最后我们回到了根节点Food,并在右边写上了18。

    第一次看见这种表结构,相信大部分人都不清楚左值(Lft)和右值(Rgt)是如何计算出来的,而且这种表设计似乎并没有保存父子节点的继承关系。但当 你用手指指着表中的数字从1数到18,你应该会发现点什么吧。对,你手指移动的顺序就是对这棵树进行前序遍历的顺序,如下图所示。当我们从根节点Food 左侧开始,标记为1,并沿前序遍历的方向,依次在遍历的路径上标注数字,最后我们回到了根节点Food,并在右边写上了18。

    依据此设计,我们可以推断出所有左值大于2,并且右值小于11的节点都是Fruit的后续节点,整棵树的结构通过左值和右值存储了下来。然而,这还不够,我们的目的是能够对树进行CRUD操作,即需要构造出与之配套的相关算法。

 四、树形结构CRUD算法

(1)获取某节点的子孙节点

    只需要一条SQL语句,即可返回该节点子孙节点的前序遍历列表,以Fruit为例:SELECT* FROM Tree WHERE Lft BETWEEN 2 AND 11 ORDER BY Lft ASC。查询结果如下所示:

    那么某个节点到底有多少的子孙节点呢?通过该节点的左、右值我们可以将其子孙节点圈进来,则子孙总数 = (右值 – 左值– 1) / 2,以Fruit为例,其子孙总数为:(11 –2 – 1) / 2 = 4。同时,为了更为直观地展现树形结构,我们需要知道节点在树中所处的层次,通过左、右值的SQL查询即可实现,以Fruit为 例:SELECTCOUNT(*) FROM Tree WHERE Lft <= 2 AND Rgt >=11。为了方便描述,我们可以为Tree建立一个视图,添加一个层次数列,该列数值可以写一个自定义函数来计算,函数定义如下:

    CREATE FUNCTION dbo.CountLayer  
    (  
        @node_id int  
    )  
    RETURNS int  
    AS  
    begin  
        declare @result int  
        set @result = 0  
        declare @lft int  
        declare @rgt int  
        if exists(select Node_id from Tree where Node_id = @node_id)  
        begin  
            select @lft = Lft, @rgt = Rgt from Tree where node_id = @node_id  
            select @result = count(*) from Tree where Lft <= @lft and Rgt >= @rgt  
        end  
        return @result  
    end  
    GO  

基于层次计算函数,我们创建一个视图,添加了新的记录节点层次的数列:

    CREATE VIEW dbo.TreeView  
    AS  
    SELECT Node_id, Name, Lft, Rgt, dbo.CountLayer(Node_id) AS Layer FROM dbo.Tree ORDER BY Lft  
    GO  

 创建存储过程,用于计算给定节点的所有子孙节点及相应的层次:

CREATE PROCEDURE [dbo].[GetChildrenNodeList]  
(  
    @node_id int  
)  
AS  
declare @lft int  
declare @rgt int  
if exists(select Node_id from Tree where node_id = @node_id)  
    begin  
        select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id  
        select * from TreeView where Lft between @lft and @rgt order by Lft ASC  
    end  
GO 

 现在,我们使用上面的存储过程来计算节点Fruit所有子孙节点及对应层次,查询结果如下:


    从上面的实现中,我们可以看出采用左右值编码的设计方案,在进行树的查询遍历时,只需要进行2次数据库查询,消除了递归,再加上查询条件都是数字的比 较,查询的效率是极高的,随着树规模的不断扩大,基于左右值编码的设计方案将比传统的递归方案查询效率提高更多。当然,前面我们只给出了一个简单的获取节 点子孙的算法,真正地使用这棵树我们需要实现插入、删除同层平移节点等功能。

 (2)获取某节点的族谱路径

    假定我们要获得某节点的族谱路径,则根据左、右值分析只需要一条SQL语句即可完成,以Fruit为例:SELECT* FROM Tree WHERE Lft < 2 AND Rgt > 11 ORDER BY Lft ASC ,相对完整的存储过程:

CREATE PROCEDURE [dbo].[GetParentNodePath]  
(  
    @node_id int  
)  
AS  
declare @lft int  
declare @rgt int  
if exists(select Node_id from Tree where Node_id = @node_id)  
    begin  
        select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id  
        select * from TreeView where Lft < @lft and Rgt > @rgt order by Lft ASC  
    end  
GO 

 

(3)为某节点添加子孙节点

    假定我们要在节点“Red”下添加一个新的子节点“Apple”,该树将变成如下图所示,其中红色节点为新增节点。


    仔细观察图中节点左右值变化,相信大家都应该能够推断出如何写SQL脚本了吧。我们可以给出相对完整的插入子节点的存储过程:

CREATE PROCEDURE [dbo].[AddSubNode]  
(  
    @node_id int,  
    @node_name varchar(50)  
)  
AS  
declare @rgt int  
if exists(select Node_id from Tree where Node_id = @node_id)  
    begin  
        SET XACT_ABORT ON  
        BEGIN TRANSCTION  
        select @rgt = Rgt from Tree where Node_id = @node_id  
        update Tree set Rgt = Rgt + 2 where Rgt >= @rgt  
        update Tree set Lft = Lft + 2 where Lft >= @rgt  
        insert into Tree(Name, Lft, Rgt) values(@node_name, @rgt, @rgt + 1)  
        COMMIT TRANSACTION  
        SET XACT_ABORT OFF  
    end  
GO

 

(4)删除某节点

    如果我们想要删除某个节点,会同时删除该节点的所有子孙节点,而这些被删除的节点的个数为:(被删除节点的右值 – 被删除节点的左值+ 1) / 2,而剩下的节点左、右值在大于被删除节点左、右值的情况下会进行调整。来看看树会发生什么变化,以Beef为例,删除效果如下图所示。

    则我们可以构造出相应的存储过程:

    CREATE PROCEDURE [dbo].[DelNode]  
    (  
        @node_id int  
    )  
    AS  
    declare @lft int  
    declare @rgt int  
    if exists(select Node_id from Tree where Node_id = @node_id)  
        begin  
            SET XACT_ABORT ON  
            BEGIN TRANSCTION  
                select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id  
                delete from Tree where Lft >= @lft and Rgt <= @rgt  
                update Tree set Lft = Lft – (@rgt - @lft + 1) where Lft > @lft  
                update Tree set Rgt = Rgt – (@rgt - @lft + 1) where Rgt > @rgt  
                COMMIT TRANSACTION  
            SET XACT_ABORT OFF  
        end  
    GO  

 

五、总结

    我们可以对这种通过左右值编码实现无限分组的树形结构Schema设计方案做一个总结:

    (1)优点:在消除了递归操作的前提下实现了无限分组,而且查询条件是基于整形数字的比较,效率很高。

    (2)缺点:节点的添加、删除及修改代价较大,将会涉及到表中多方面数据的改动。

    当然,本文只给出了几种比较常见的CRUD算法的实现,我们同样可以自己添加诸如同层节点平移、节点下移、节点上移等操作。有兴趣的朋友可以自己动手编 码实现一下,这里不在列举了。值得注意的是,实现这些算法可能会比较麻烦,会涉及到很多条update语句的顺序执行,如果顺序调度考虑不周详,出现 Bug的话将会对整个树形结构表产生惊人的破坏。因此,在对树形结构进行大规模修改的时候,可以采用临时表做中介,以降低代码的复杂度,同时,强烈推荐在 做修改之前对表进行完整备份,以备不时之需。在以查询为主的绝大多数基于数据库的应用系统中,该方案相比传统的由父子继承关系构建的数据库Schema更 为适用。

参考文献:《Storing Hierarchical Data in a Database Article》

分享到:
评论

相关推荐

    ASP+ACCESS二叉树左右值无限级分类,支持增,删,改,查,排序

    无限级分类通常使用左值右值法(也称为闭包表法),通过两个字段来记录每个节点的左右边界。新增节点时,可以在适当的位置插入新的左值和右值;删除节点时,需要更新受影响的节点的左值和右值;修改节点位置时,同样...

    无限分类带数据库

    通常有两种主要方法:递归函数和层级序号(如左值右值或路径法)。递归函数是通过调用自身来处理子分类,而层级序号则通过为每个分类分配一个表示其位置的数字,以便快速定位和构建分类树。 在这个案例中,描述提到...

    无限级分类/多级分类【左右值方式实现】

    4. 遍历分类:可以按照左值从小到大的顺序遍历整个分类树,实现层次结构的展示。 左右值法的优势在于其简单性和高效性,但也有需要注意的事项。比如,插入和删除操作可能导致大量的数据更新,尤其是在大型分类系统...

    mysql 无限级分类实现思路

    总结来说,递归算法适用于简单场景,字符串表示法适合快速查找子分类,而改进前序遍历树模型则提供了更高效且灵活的解决方案,尤其在处理大量数据和复杂操作时。选择哪种方法取决于具体项目的需求、数据规模以及性能...

    [TREE]采用左右值编码来存储无限分级树形结构的数据库表设计.doc

    标题提及的“左右值编码”是一种在数据库中存储无限分级树形结构的方法,常用于组织层级数据,如商品分类、组织架构等。这种方法的核心在于为每个节点分配两个数值:左值(Lft)和右值(Rgt),它们能够唯一地确定...

    SQL Server 存储层级数据实现无限级分类,左右值分类

    为解决这一难题,SQL Server 提供了一种高效的方法——**左右值分类**,即通过给每个节点赋予一对数值(左值和右值)来表示节点之间的层级关系。 #### 二、左右值分类原理 左右值分类的核心思想是将层级结构转换为...

    [TREE]采用左右值编码来存储无限分级树形结构的数据库表设计.docx

    【左右值编码】是一种在数据库中存储无限分级树形结构的有效方法,主要应用于有层级关系的数据,如组织架构、商品分类等。这种方法的核心思想是为每个节点分配两个数值:左值(Lft)和右值(Rgt),通过这两个值可以...

    无限级分类数据库及代码实现.doc

    在分类 ID 下添加新分类时,我们需要先获取分类的左值和右值,然后计算出新增加分类的左值和右值。最后,我们可以使用 INSERT 语句将新增加分类添加到数据库中。 2、分类的删除 删除分类 ID 为$id 的分类时,我们...

    Codeigniter无限分类类库

    而MPTT则在数据库中预先存储了每个分类的左值和右值,能够快速查询出分类的层级和同级元素,适合大数据量的分类管理。 这个类库可能包含了以下关键功能: 1. **添加分类**:允许用户输入新分类并指定其父分类,...

    php的多种无限分类库.zip

    2. **Nested Set Model**:使用左值(lft)和右值(rgt)字段,可以高效地查询祖先、子类别和同级类别,但插入和删除操作较为复杂。 3. **Materialized Path**:存储完整的路径字符串,查询速度快,但更新路径时...

    前序遍历树—–关于无限分类的问题

    在IT行业中,处理树形结构的数据是一个常见的挑战,特别是在实现无限分类的问题时。前序遍历作为一种有效的树遍历方法,被广泛应用于解决此类问题,因为它能提供更好的性能和灵活性。本文将深入探讨前序遍历树模型,...

    C#无限极分类

    - **左值右值(Nested Set Model)**:通过两个额外的字段,如`LeftValue`和`RightValue`,来表示节点的左边界和右边界,便于查询和操作。 - **路径枚举(Path Enumeration)**:用一个字段存储节点的路径,如“1/...

    tp树形无限极分类

    3. **左值右值法**(如 Nested Set Model):另一种常见方法,通过额外的两个字段`lft`和`rgt`记录每个分类的左边界和右边界,方便插入、删除和查询操作。 4. **预排序遍历树(Pre-Order Tree Traversal,PTT)**:...

    无限级分类

    2. nested set模型,也称为MPTT(Modified Preorder Tree Traversal)模型,每个分类存储左值和右值,用于表示它在整个树中的位置。虽然插入和删除操作相对复杂,但查询效率高,能一次性获取某个分类的所有子分类...

    树形结构的数据库表Schema设计1

    在数据库设计中,树形结构是一种常见的数据组织方式,它被广泛应用于表示层次关系,例如组织结构、分类系统等。本文以食品族谱为例,探讨如何在关系型数据库中存储和操作树形结构数据。 首先,最基本的树形结构设计...

    超简单无限极分类

    3. **左值右值法**(Nested Set Model):为每个类别记录两个数值,分别表示该类别的左值和右值,这样就可以快速地计算出类别及其子类别的范围,从而进行高效的查询和操作。 4. **Materialized Path**:在每个类别...

    java分级设计案例

    另一种方法是使用"左值右值法",为每个节点分配一对数值,表示其在树中的位置,从而简化了获取子节点和父节点的查询。 在实际应用中,还要考虑性能优化,比如使用索引、预加载数据、缓存技术等。同时,设计时要考虑...

    php树形菜单类.rar

    这可能涉及到递归查询或者使用像“左值右值”(Nested Set Model)这样的数据模型。 2. **添加节点**:向树中添加新的分类,可以指定其父节点,从而决定新分类的位置。 3. **删除节点**:删除一个分类时,需要考虑其...

    php小代码(图片上传,无限分类,时间函数等等)

    2. **层级序列表法(Nested Set Model)**:使用左值和右值来表示节点的相对位置,插入、删除和遍历操作相对复杂,但效率较高。 再者,PHP的时间函数可以帮助我们处理日期和时间相关的任务: 1. **时间戳**:`time...

    Python库 | django-ptree-0.2.18.zip

    2. **左值和右值(Left-Right Values)**:该库利用了左值和右值的概念来高效地存储和查询树结构。左值和右值是两个额外的字段,它们指示每个节点在其兄弟节点中的位置。 3. **树操作**:`django-ptree` 提供了一...

Global site tag (gtag.js) - Google Analytics