本来早就打算要写一篇日志来讲讲ETL测试的自动化执行,以及ETL自动化测试框架实现的一些相关东东。前后托了近一个月,今天总算落实到键盘了。
不过由于部门组织结构调整,该ETL测试框架面临着刚出生就可能夭折的命运,现在写起来,似乎也夹杂一些悲壮。
其实这个ETL自动化测试框架是我在09年面试阿里巴巴ETL测试职位的时候就在脑海中盘旋了。当时的面试官,也是自己后来的主管boss说我们要自己搞一套ETL的自动化测试框架。然后我就怀揣着理想来了...
而10年7月入职之后,由于种种原因,该理想都未能付诸于实际。有环境的因素,也有自己积累不到位的原因。直到前一段时间,自己算是有了实现自己idea的机会之后,果断将其落实。终于按照自己想法的第一个产品诞生了。
在框架初生阶段,很大程度上借鉴了某PHP开源单元测试框架simpleTest的实现思路,主要包括其TestCase、Suite、Expecation、Assert、Report等元素的实现,也让自己对单元测试框架的实现思路有了更清晰的认识。
在此要重点感谢开源SimpleTest项目的所有贡献者,你们懂得。
框架简介:
该框架的用例执行和断言、报告等实现都是基于SimpleTest的实现思路。将其中关于web、浏览器等相关的内容排除,只留下Case、Suite、Report、Expecatation、Assert等相关组件,并增加了对应的用于ETL测试的Expecatation、Assert以及TestCase。
主要实现了SQL语句的执行、SQL执行结果的判断等。
如何使用:
1. 一个最简单的ETL测试用例:a.php
class A extends DBunitTestCase{ public $constr = "host=10.20.143.243 port=5132 dbname=aligputf8 user=gpadmin"; function testCountForA($stat_date){ $sqlact = " select 1; "; $sqlexp = " select 2; "; $this->assertLessThanCount($sqlact,$sqlexp); } }
上述代码的测试逻辑为检查SQL:select 1的结果是否比SQL:select 2的结果要小。
有了测试用例,执行还需要一个执行器,执行器代码如下:
#!/export/home/gpadmin/rosei.liuzq/php-install/bin/php <?php require_once('etl/runner.php'); //其实这就是执行器 class UserBasic extends TestSuite{ public function __construct(){ parent::__construct("UserBasic"); $this->addFile('hello',array('a.php')); //此处其实可以放多个的array('a.php','b.php',....) } }
我们将刚才完成的测试单元放在这个测试执行器中。
执行器中的addFile,可以add多个,如上注释所属,一次addFile生成一个测试Suite。
当然可以执行多次addFile。
ps:一般来讲一个项目的测试会有一个执行器,项目中的不同模块测试逻辑分别对应一个addFile,一个模块中的不同测试用例或针对不同表的测试,可以是一个个.php文件。执行器除了有执行用例的功能,也有组织项目测试的作用。
上述用例执行命令为:
cd dir //directory where you put the case and runner
./run.sh
运行结果为:
如果我们需要输出xml格式的结果,只需要在执行时加上-x即可:
cd dir //directory where you put the case and runner
./run.sh -x
结果如下:
2. 其他的Assert逻辑:
目前该ETL测试框架中共实现了如下Assert逻辑:
- assertScalarEqual //SQL执行结果与标量值比较:$this->assertScalarEqual($sql,1)
- assertSqlResult //两个SQL结果的比较: $this->assertSqlResult($sql1,$sql2)
- assertLessThanCount //上例演示
- assertCustomize //自定义Assert逻辑: $this->assertCustomize($sql,$cust_func)
class A extends DBunitTestCase{ public $constr = "host=10.20.143.243 port=5132 dbname=aligputf8 user=gpadmin"; function testCountForA($stat_date){ $sqlact = " select 1; "; $sqlexp = " select 2; "; $this->assertLessThanCount($sqlact,$sqlexp); } function testForTestArg($dateArg){ $sql = "select $dateArg"; $this->assertScalarEqual($sql,"20110909"); } }
cd dir //directory where you put the case and runner
./run.sh -d=20110909

相关推荐
4. **工具使用**:使用自动化工具可以提高效率,如ETL(提取、转换、加载)工具,或者数据库管理系统的内置导入功能。 5. **格式兼容**:确保数据文件格式(如CSV、Excel、XML或JSON)与目标系统兼容,并正确处理...
2. **自动化管理**:自动化的管理系统负责资源的分配、调度和监控。 3. **安全性保障**:提供数据加密、身份验证等安全措施,保护用户数据的安全。 4. **服务编排**:支持服务的自动化部署和配置,提高服务交付的...
4. 自动化测试:在软件开发中,自动化测试是一种关键实践,通过编写测试脚本,可以快速地执行回归测试,确保代码更改不会引入新的错误。常见的自动化测试工具有JUnit(Java)、PyTest(Python)和Appium(移动应用...
6. **自动化与部署**:利用Jupyter Notebook或Script编写自动化脚本,结合Git进行版本控制,使用Docker容器化技术进行项目部署。 通过学习和实践这些代码,你可以深入了解Python全栈数据工程师的日常工作流程,提升...
19. **营销活动优化**:邮件发送策略优化和提高响应率涉及A/B测试和营销自动化。 20. **数据库性能优化**:可能涉及索引优化、查询重构和硬件升级。 21. **非结构化数据处理**:转换成结构化数据可能需要ETL流程,...
12. **自动化脚本**:编写Python或R脚本自动化数据清理过程,提高效率,减少人为错误。 13. **版本控制**:使用Git进行版本管理,可以追踪代码或数据的变化,便于团队协作和回溯错误。 14. **测试与验证**:设置...