在【核心对象】-【脚本】下有个【User Defined Java Class】插件,功能很强大,允许自己在这里写java代码,其中用到了一个jar包,janino,有兴趣的自己上网去搜。janino只支持jdk 1.4,所以只能在【User Defined Java Class】里写jdk 1.4的代码,泛型这些是不支持的了。
把【User Defined Java Class】拖出来后双击打开,然后再双击左边的【Code Snippits】-【Common use】-【Main】,出现如下代码
public boolean processRow(StepMetaInterface smi, StepDataInterface sdi) throws KettleException
{
Object[] r = getRow();
if (r == null) {
setOutputDone();
return false;
}
if (first)
{
first = false;
}
// It is always safest to call createOutputRow() to ensure that your output row's Object[] is large
// enough to handle any new fields you are creating in this step.
r = createOutputRow(r, outputRowSize);
/* TODO: Your code here. (See Sample)
// Get the value from an input field
String foobar = get(Fields.In, "a_fieldname").getString(r);
foobar += "bar";
// Set a value in a new output field
get(Fields.Out, "output_fieldname").setValue(r, foobar);
*/
// Send the row on to the next step.
putRow(data.outputRowMeta, r);
return true;
}
点确定窗口关闭,之后再打开,发现左边的【Input fields】和【Output fields】下都是显示“Getting fields...please wait”,这算是kettle的一个bug吧,因为代码有问题,编译不通过。
这一行代码
r = createOutputRow(r, outputRowSize);
outputRowSize这个变量不存在,可以改为
r = createOutputRow(r, data.outputRowMeta.size());
或在前面加上
int outputRowSize = data.outputRowMeta.size();
即可,点确定关闭窗口再打开就可以发现【Input fields】和【Output fields】下有显示输入输出字段了。
另外,打开窗口,在右侧的【Class code】的标题栏右键,可以增加一个自定义java类,但是没用,因为现在还不支持在一个自定义java类中引用另一个自定义java类,所以写了多个自定义java类也没用,kettle暂时还不支持
分享到:
相关推荐
《详解kettle之User Defined Java Class步骤》示例代码,是最详细的udjc步骤说明文档,有示例理解更容易,更全面。
6. **执行Java代码**:将自定义的Java类添加到Kettle转换中,并配置相关参数,如数据库连接信息、表名等。 7. **数据写入**:添加"Java代码结果到表"步骤,将Java步骤返回的结果写入目标SQL Server数据库。 8. **...
首先,Kettle支持两种方式来调用Java类:使用“Java Class”步骤和使用“Execute Java Script”步骤。"Java Class"步骤允许直接执行一个预编译的Java类,而"Execute Java Script"步骤则用于运行Java Script...
插件功能:用户输入需要替换的字符和替换后的字符以及需要替换的列号,插件进行自动替换。原文地址:https://blog.csdn.net/xhy1999/article/details/108375836
通过上述步骤,我们可以在Kettle的JScript控件中成功调用自定义的Java类,从而扩展Kettle的功能,实现更复杂的业务逻辑处理。这对于需要灵活定制数据处理流程的应用场景尤其有用。希望本文能帮助读者更好地理解和...
- 将这些jar添加到项目的类路径中,就可以在Java代码中导入并使用Kettle的相关类和接口。 4. **一键启动与无需添加代码** - "一键启动"可能是指提供了一个预配置的脚本或者工具,使得用户无需手动配置Kettle环境...
kettle通过java脚本获取数据库的值..................................................................
然而,在Java应用程序中集成Kettle,需要将相关的Jar包添加到项目的类路径中,以便能够调用其API来执行工作流或转换。 首先,要理解Java与Kettle的集成,我们需要知道Kettle的主要组件。Kettle由以下几部分组成: ...
Kettle的统计控件不仅支持基本的统计计算,还提供了高级功能,如自定义脚本、过滤条件和排序选项,以满足各种复杂的数据处理需求。 总之,Kettle的统计控件和分组功能为数据处理提供了一套强大且灵活的工具。通过...
Kettle Java API提供了`StepInterface`接口和`StepMeta`类,前者定义了步骤运行时的行为,后者存储步骤的元数据,如名称、配置等。 3. **Repository API**: Kettle支持多种类型的仓库(如JDBC、S3等),用于存储...
这个是Kettle一个转换的脚本,可以通过这个demo结合java代码来进行数据清洗。
- 在Kettle中,创建新的数据库连接,选择“自定义”类型。 - 指定数据库类型为“ClickHouse”或输入JDBC驱动类名(通常是`ru.yandex.clickhouse.ClickHouseDriver`)。 - 填写JDBC URL(如`jdbc:clickhouse://...
`KJob.java` 文件可能包含了Kettle作业类的定义。这个类可能会扩展`org.pentaho.di.job.Job`,这是Kettle提供的基础类,用于运行作业。通过这个类,你可以加载作业定义文件,设置参数,然后调用`execute()`方法来...
生成记录_生成365条记录-增加序列-计算器的使用-拼接年月-拼接年季-值映射-字段选择-Microsoft Excel 输出数据
Kettle的使用公式清理数据、Kettle的使用用户自定义Java表达式清理数据【ktr源文件】 实验内容如下: 掌握基于Kettle的使用公式清理数据 掌握基于Kettle的使用用户自定义Java表达式清理数据
在Java开发中,有时我们需要与不同的工具或框架集成,例如Kettle(也称为Pentaho Data Integration或PDI)。Kettle是一款强大的ETL(提取、转换、加载)工具,允许开发者进行数据清洗、转换和迁移。Java调用Kettle的...
5. **代码优化**:检查并优化Kettle的自定义脚本或Java代码,避免无用的对象创建和内存泄漏。 6. **定期清理和释放资源**:确保Kettle在处理完数据后,及时释放不再使用的对象和资源,避免内存碎片。 最后,监控...
通过这个示例,我们可以了解到Kettle API在Java应用程序中实现ETL流程的强大能力,包括创建自定义的数据流,管理数据库交互,以及控制Transformation的生命周期。这为开发者提供了灵活的方式,能够根据业务需求构建...
在本篇“Kettle课程之映射控件”中,我们将深入探讨映射这一核心功能及其相关的输入和输出规范。 映射在Kettle中扮演着关键角色,它是转换中的一个类别,编号为第十八。映射的主要目的是封装和重用子转换,这样可以...
文件夹里面存在java集成kettle所需要的包,将java集成到kettle中,具体操作步骤请访问http://blog.csdn.net/xiaosemei/article/details/77868737