`

水壶(Kettle)问题

阅读更多

8-4  水壶

   假设给定了n个红色的水壶和n个蓝色的水壶,它们的形状和尺寸都不相同。所有红色水壶中所盛水的量都不一样,蓝色水壶也是一样。此外,对于每个红色的水壶,都有一个对应的蓝色水壶,两者所盛的水量是一样的。反之亦然。

  你的任务是将所盛水量一样的红色水壶和蓝色水壶找出来。为了达到这一目的,可以执行如下操作:挑选出一对水壶,其中一个是红色的,另一个是蓝色的:将红色水壶中倒满水;再将水倒入到蓝色的水壶中。通过这个操作,可以判断出来这两只水壶的容量哪一个大,或者是一样大。假设这样的比较需要一个时间单位。你的目标是找出一个算法,它通过执行最少次数的比较,来确定分组和配对问题。记住不能直接比较两个红色的或两个蓝色的水壶。

  a)给出一个确定型的算法,它利用Θ(n^2)次比较来完成水壶的配对。

  b)证明:对于一个可以解决本问题的算法,必须执行的比较次数的下界为Ω(nlgn)。

  c)给出一个随机化的算法,其期望的比较次数为O(nlgn),并证明这个界是正确的。对你的算法来说,最坏情况下的比较次数是什么?

a)先用朴素的方法,拿出第1个红色水壶,然后从n个蓝色水壶中去配对,需要Θ(n)次比较。重复上述操作,知道所有的红色水壶都完成了配对。总的时间复杂度为Θ(n^2)

b)采用决策树的方法进行分析,总共可能的配对有n!种,每次比较的产生的分支有3个(大于、相等或小于),若决策树的高度为h,则Ω(nlgn)就是比较次数的下界。

c) 由于每个红色的水壶和蓝色的水壶都有一个配对,因此理论上我们只需要分别将其进行排序即可。但是实际问题中,是不容许两个各红色或蓝色的水壶进行比较的,必须颜色不一样的水壶才能进行比较。因此需要一定的技巧。

     整个排序的过程中采用快速排序的思想,现对最关键也是有所不同的PATITION部分,这个过程有点类似交叉验证,具体描述如下:

1. 从红色水壶序列中随机选择一个作为枢轴元素

2. 在蓝色水壶序列中查找和该红色水壶容量一样的那个作为枢轴元素

3. 利用红色水壶枢轴元素对蓝色水壶序列进行PATITION。

4. 利用蓝色水壶枢轴元素对红色水壶序列进行PATITION。

如此PATIION部分就完成了,期望的时间复杂度为Θ(n)。整个过程类似快排迭代进行即可完成排序。

整个时间的复杂度为:即时间复杂度为O(nlgn)。最坏的情况下时间复杂度为O(n^2)。

下面是一个简单的代码实现:

struct Kettle
{
    int I,V;//水壶的初始下标,容量
    Kettle():I(0),V(0){}
    Kettle(int _i,int _v):I(_i),V(_v){}
};

/*随机产生[L,R]上的随机数*/
int Rand(int L,int H)
{
    return rand()%(H-L+1) + L;
}
istream& operator>>(istream& in,Kettle& k)
{
    in>>k.I>>k.V;
    return in;
}
void swap(Kettle& lh,Kettle& rh)//重载swap函数
{
    swap(lh.I,rh.I);
    swap(lh.V,rh.V);
}

/*
A代表红色水壶
B代表蓝色水壶
L,R表示当前处理的数据在数组中的上下界
step 1:从A中随机选择一个壶r
step 2:从蓝色水壶中找到和r容量一样的蓝色水壶b
step 3:将r作为蓝色水壶Partition的分隔元素,b作为红色水壶Partition的分隔元素
*/
int Partition(Kettle* A,Kettle *B,int L,int R)
{
    int I = Rand(L,R),J;
    int bKey = A[I].V;//从红色中随机选取的分隔元素,做蓝色的分隔元素

    for(J=L; J<=R; ++J)//找B中和rKey一样的元素
        if(B[J].V==bKey)
        {
            cout<<"A["<<A[I].I<<"] = B["<<B[J].I<<"] = "<<bKey<<endl;
            break;
        }
    int rKey = B[J].V; //做红色的分隔元素

    int j,ir=L-1;
    swap(A[I],A[R]);
    for(j=L; j<R; ++j)//对红色水壶进行划分
    {
        if(A[j].V<=rKey)
        {
            ++ir;
            swap(A[ir],A[j]);
        }
    }
    swap(A[ir+1],A[R]);

    int ib=L-1;
    swap(B[J],B[R]);
    for(j=L; j<R; ++j)//对蓝色水壶进行划分
    {
        if(B[j].V<=bKey)
        {
            ++ib;
            swap(B[ib],B[j]);
        }
    }
    swap(B[ib+1],B[R]);
    return ir+1;//这里肯定 ib==ir
}

void Match(Kettle *A,Kettle *B,int L,int R)//整个过程和快排基本一致
{
    if(L < R)
    {
        int M = Partition(A,B,L,R);
        Match(A,B,L,M-1);
        Match(A,B,M+1,R);
    }
    else if(L==R) //单个的元素直接配对
        cout<<"A["<<A[L].I<<"] = B["<<B[L].I<<"] = "<<A[L].V<<endl;
}

void TestPartition()
{
    srand(11);
    int a[] = {2, 3, 7, 5, 1, 9, 6, 8, 4};
    int b[] = {4, 7, 9, 5, 1, 3, 8, 2, 6};
    Kettle A[9],B[9];
    for(int i=0;i<9;++i)
    {
        A[i].I = i; A[i].V = a[i];
        B[i].I = i; B[i].V = b[i];
    }
    Match(A,B,0,8);
}

分享到:
评论

相关推荐

    java调用kettle的依赖包

    在Java开发中,有时我们需要与不同的工具或框架集成,例如Kettle(也称为Pentaho Data Integration或PDI)。Kettle是一款强大的ETL(提取、转换、加载)工具,允许开发者进行数据清洗、转换和迁移。Java调用Kettle的...

    Kettle水壶集

    **Kettle水壶集** Kettle,又称为Pentaho Data Integration(PDI),是由Pentaho公司开发的一款开源ETL(Extract, Transform, Load)工具。它以其独特的水壶图标而闻名,寓意数据从一个地方流向另一个地方,如同水...

    kettle工具——用于数据迁移等

    通过理解Kettle的基本概念和特点,我们可以更有效地利用这个工具来解决实际的ETL问题,提升数据处理的效率和质量。在学习和使用Kettle时,建议逐步熟悉其工作原理,掌握各个组件的功能,并结合具体的业务需求,设计...

    kettle基础简介

    ### Kettle基础简介 #### ETL基本概念 ETL(Extract-Transform-Load)是一种用于数据集成的关键技术,尤其在构建...此外,Kettle丰富的社区支持和文档资源也是其一大优势,可以帮助用户解决实际问题并不断深入学习。

    kettle基础文档

    Kettle的设计理念是将来自不同数据源的数据汇集到一起,进行处理后以特定格式输出,形象地比喻为将各种数据放入水壶,经过加工后再倒出。Kettle项目家族包括四个主要组件: 1. Spoon:提供图形化界面,用于设计和...

    Kettle学习资料大全

    Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,...

    Kettle完整操作手册

    Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。...Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

    pentaho-Kettle安装及使用说明(例子).doc

    Kettle是一个开源的ETL项目,项目名来自于水壶的英文单词,意为把各种数据放到一个壶里,然后以一种你希望的格式流出。Kettle包括三大块:Spoon、Kitchen和Pan。 * Spoon是一个GUI方式的转换/工作设计工具,用于...

    kettle DM动态脱敏水壶数据转化

    在IT行业中,数据安全是至关重要的,特别是在处理敏感信息时。Kettle,也称为Pentaho Data ...总之,Kettle DM动态脱敏水壶数据转化是一个涉及多个环节的复杂过程,需要综合运用数据库知识、ETL技能以及数据安全策略。

    KETTLE教程-第3篇之kettle环境搭建.rar_etl_kettle_教程

    Kettle是一款国外开源的ETL工具,它是纯java语言编写,可以在Window、Linux、Unix上运行...kettle的中文名称叫水壶,kettle的原始开发团队,他们希望把各种数据放到kettle这个数据的水壶里,然后以一种指定的格式流出。

    kettle 7.1 官方例子(附带文档整理-中英文对照)

    Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 这是我在学习的时候整理的文档,主要是官方的例子,有excel表格,列出了所有的官方例子,中英文对照,可以...

    官方kettle最新8.2下载百度云

    百度云进行下载 Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取...Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

    Kettle3.2使用手册.pdf

    Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里然后以 一种指定的格式流出。Kettle 主要包括四部分,分别为Chef,Spoon,Kitchen,Pan。 Kettle 提供一个图形用户界面Spoon,用来设计数据...

    KETTLE教程-第11篇之Excel输入.rar_etl_kettle_教程

    Kettle是一款国外开源的ETL工具,它是纯java语言编写,可以在Window、Linux、Unix上运行...kettle的中文名称叫水壶,kettle的原始开发团队,他们希望把各种数据放到kettle这个数据的水壶里,然后以一种指定的格式流出。

    ETL工具Kettle简介和安装配置基本使用.pdf

    Kettle的中文名称为“水壶”,寓意是将各种数据放入壶中,再按特定格式流出。事实上,Kettle的设计理念就是帮助用户实现数据的抽取、转换、传输和加载,从而满足他们的ETTL(Extract-Transform-Transport-Load)需求...

    kettle_7.1_api文档.rar

    Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,...

    Kettle 7.1.0 API (CHM格式)

    Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,...

    ETL工具Kettle简易使用

    通过对Kettle的基本概念、安装配置、文件定义、个性化设置、菜单介绍以及数据步骤间的连接方式等内容的了解,读者可以更深入地掌握Kettle的应用技巧,并能够在实际工作中灵活运用这一工具解决复杂的ETL问题。

    kettle例子加文档

    Kettle由Pentaho公司开发并维护,其名称来源于英语中的“水壶”,寓意将各种来源的数据汇聚在一起,并以用户期望的格式输出。 Kettle主要由以下几个组成部分构成: - **Spoon**:用于图形化设计转换和作业的工具。 ...

    Kettle 4.4.0_API CHM格式

    Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,...

Global site tag (gtag.js) - Google Analytics