复杂多数据源报表join后再计算

datamachine

浏览: 164618 次

最近访客更多访客>>

mx122723

ymm0514

tmuffamd

fhtwins

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

DB
Java相关

复杂多数据源报表 join 集算器计算

复杂数据源是报表开发的常见问题，比如不同数据库表先进行join运算，再进行后续的过滤分组排序等运算。JasperReport/Birt等报表工具有virtual data source或table join，可以一定程度地实现多数据源join后计算，但掌握起来并不容易。

集算器具有结构化强计算引擎，支持多样性数据源，集成简单，可以协助报表工具方便地实现此类需求，下面通过一个例子来说明多数据源join后计算的过程。

Sales是mysql数据库中的表，存储着多名销售员每天的多个订单，其中字段SellerId是销售员编号。emp是mssql数据库中的表，存储着销售员信息，其中字段EId是销售员编号，Name是销售员名字，Dept是部门名称。现在需要在报表中展现：订单编号、日期、金额、销售员名字、部门名称，条件是：订单日期在最近N天（比如30天）或者订单属于某几个受关注的部门（比如Markeding和Finance）。

由于订单编号、日期、金额来自于表sales，而销售员名字、部门名称来自于表emp，因此要进行不同数据库之间join运算，join之后还要进行条件过滤。部分源数据如下：

表sales

表emp

集算器代码：

A1=myDB1.query("select * from sales")

这句代码从数据源myDB1查询出sales表的记录，myDB1指向mysql数据库。函数query用来执行SQL查询，可以接收外部参数。A1的计算结果如下：

A2=myDB2.query("select * from emp")

这句代码从数据源myDB2查询出emp表的记录，myDB2指向mssql数据库。

A3=A1.switch(SellerId,A2:EId)

上述代码将A1中的SellerId字段替换成A2中对应的记录，关联字段为EId。A3的计算结果如下（蓝色字体表示该数据项包含下级成员）：

当A2中找不到对应的记录时，函数switch默认保留A1中记录，对应的SellerId显示为空，效果类似于左连接。如果想进行内连接，应当使用选项@i，形如：A1.switch@i(SellerId,A2:EId)

A4=A3.select(OrderDate>=after(date(now()),days*-1)|| depts.array().pos(SellerId.Dept))

上述代码可对关联结果进行过滤，条件有2个，第1个条件是：订单日期在最近N天（对应参数days），表达式为OrderDate>=after(date(now()),days*-1)。第2个条件是：订单属于某几个受关注的部门（对应参数depts），表达式是depts.array().pos(SellerId.Dept)。运算符||表示逻辑关系“或”。

函数now可以取当前时间，函数date将当前时间转为日期，函数after可以算出相对时间，比如after("2015-01-30",-30)表示将时间后退30天，即2015-01-01。使用不同的选项，函数after还能以年、季、月、秒为单位计算相对时间。

函数array可以按分隔符将字符串变成集合，比如"Marketing,Finance".array()等于["Marketing ","Finance"]。函数array的默认分隔符是逗号，也可以指定其他分隔符。函数pos可以找出成员在集合中的位置，比如["Marketing ","Finance"].pos("Finance")等于2，在逻辑关系中等于true。如果成员不在集合中，则返回null，在逻辑关系中等于false。