`
datamachine
  • 浏览: 163117 次
社区版块
存档分类
最新评论

结构化文本文件零代码导入数据库的方法

阅读更多

         直接用JAVA将结构化文本文件导入数据库时,需要手工拼凑SQL语句,还需要处理各种麻烦情况,比如:表中数据是否已经存在,是要update还是要insert,文件中是否包含字段,文件中的字段是否和表字段一致。

使用集算器来辅助Java编程,这些问题都不需要自己写代码解决。下面我们通过例子来看一下具体作法。

 

         文本文件sales.txt中存储着销售订单数据,列分隔符是tab,前几行数据如下:



 

下面,我们要把sales.txt导入到结构相同的空表中。

 

         先在集算器中编写脚本,脚本名为test.dfx



 

         上述脚本中,import函数用来读入文本文件,其默认的列分割符是tab,函数选项@t表示将第一行作为列名。update函数用来将A1中的数据批量导入数据库,这里的OracleDB是数据源名,Tsales是表名。

上述脚本已经完成了所有的导入工作,接下来只需在JAVA代码中调用即可。

         //建立esProc jdbc连接

         Class.forName("com.esproc.jdbc.InternalDriver");

         con= DriverManager.getConnection("jdbc:esproc:local://");

         //调用esProc,其中test是脚本文件名

         st =(com.esproc.jdbc.InternalCStatement)con.prepareCall("call test(?)");

         //类似存储过程的方式执行esProc脚本

         st.execute();

         只要执行上述JAVA代码,sales.txt就会被集算器引擎导入到Tsales表。

上面的集算器脚本比较简单,因此可以直接将脚本嵌入JAVA代码,而不用脚本文件,如下所示:

st.executeQuery("=OracleDB.update(file("E:\\sales.txt").import@t(),Tsales)");

 

         有时,库表并不为空,此时就不能把数据全部导入表中,而应该按照主键来比对。对于主键相同的数据,应当生成update语句,对于库表中没有的主键,应当生成insert语句。这要分几种情况来处理:

         假如库表已经设置了主键(这里是OrderID),则前面的代码无需任何变化。换句话说,集算器引擎可以自动判断数据库主键(包括联合主键),并和文本文件中的字段进行比对,并生成相应的updateinsert语句。

         假如库表没有设置主键,则只需在update函数中手工设置主键,即将A2单元格中的脚本改为:=OracleDB.update(A1,Tsales; OrderID)

如果不想改变库表原来的数据,集算器也可以只生成insert语句,这是需要在脚本中加入函数选项@i,比如:=OracleDB.update@i(A1,Tsales)类似的,函数选项@u表示只生成update语句。

 

 

在前面的例子中,我们假设库表和文本文件的结构一致,但有时两者并不完全相同。比如:库表比文本文件的字段多3个,分别是StateOrderYearMemo,现在要在库表的State字段中填入默认值”done”OrderYear要从OrderDate中计算出年份,Memo保持空。要解决这个问题,只需书写如下脚本:



 

         上述脚本中的derive函数可以为A1加入新的字段,也可以加入计算列。Memo字段不用管,update函数会自动略过它。

         如果库表中的字段比文本文件少,则应当只读取部分列,比如:

         =file("E:\\sales.txt").import@t(OrderID,SellerId,Amount,OrderDate)

         这句脚本表示忽略Client字段,只从文件中读取其他四个字段。

 

 

         前面的例子中,文本文件的第一行正好是库表中的字段名,但有时文本文件中没有列名信息,我们需要手工对应。代码如下:



 

         可以就看到,由于第一行不是字段名,因此import函数也无需选项@t,此时,A1的数据会有默认的字段名,依次为:_1,_2,_3等等。Update函数中的Order_ID:_1表示将A1中的字段“_1”导入到库表中的OrderID字段,以此类推。

 

         如果文本文件中的字段名和库表不一样,比如库表中的Client字段在文本文件中是ClientID,此时可以用同样的办法来对应,代码如下:



 

         前面的例子中,列分隔符是tab,但有时也会遇到“,”等符号,则只需将import函数修改为:=file("E:\\sales.txt").import(; ”,”)

  • 大小: 30 KB
  • 大小: 11.1 KB
  • 大小: 20.3 KB
  • 大小: 19.5 KB
  • 大小: 15.1 KB
0
0
分享到:
评论

相关推荐

    易语言记事本txt文本文件导入access数据库

    2. **解析TXT内容**:TXT文件可能包含结构化的数据,例如每行代表一条记录,每列由特定分隔符(如逗号、制表符)分隔。我们需要解析这些数据,将其转换为可以被数据库理解的格式。易语言中可以使用字符串分割函数,...

    数据库连接文本文件

    本文将深入探讨如何连接和操作这些文本文件,以便将数据导入数据库。 首先,我们需要理解数据库的基本概念。数据库是一个组织化的数据集合,它使用结构化查询语言(SQL)进行操作。常见的关系型数据库管理系统...

    exl文件导入数据库中

    在IT行业中,数据库管理和...总之,将Excel文件导入数据库是一项常见的数据管理任务,涉及到数据的预处理、数据库连接、数据转换和批量加载等多个环节。掌握这一技能对于数据分析、业务智能和数据库管理来说至关重要。

    将Excel导入数据库超简单方法

    而数据库如MySQL、SQL Server或Oracle等,是用于存储、管理并检索大量结构化数据的系统,它们提供了更高级的数据管理和安全性。 将Excel数据导入数据库的步骤如下: 1. **准备数据**:在Excel中整理好你要导入的...

    文本,Excel导入导出到SQL数据库

    在IT行业中,数据管理和操作是核心任务之一,而将数据从文本文件和Excel表格导入到SQL数据库是一项常见的工作流程。这个过程有助于数据整理、分析和存储,尤其在处理大量结构化数据时。以下是对这个主题的详细阐述:...

    SpringBootMybatis+poi+Thymeleaf实现excel文件数据导入到数据库以及从数据库将数据导出成excel.zip

    在本项目中,"SpringBootMybatis+poi+Thymeleaf实现excel文件数据导入到数据库以及从数据库将数据导出成excel.zip",我们主要关注的是如何利用Java技术栈来处理Excel文件,并与数据库进行交互。以下是相关知识点的...

    c# 文件导入数据库并图表显示

    总结,这个项目涵盖了C#与SQL数据库的交互、TXT文件的处理以及数据可视化的基本步骤。通过学习这个例子,开发者可以掌握数据导入、数据库操作以及使用第三方控件展示数据的技能,这些都是在开发过程中非常实用的技能...

    文件导入的实现

    本文将深入探讨如何实现文件导入,结合给定的标题“文件导入的实现”和标签“源码”、“工具”,我们将围绕文件导入的原理、常用方法以及相关工具进行详细讲解。 一、文件导入的基本原理 文件导入通常涉及到读取...

    批量读取txt文件导入数据库Demo实例

    - **数据格式**:TXT文件通常包含结构化数据,如CSV(逗号分隔值)或TSV(制表符分隔值)。理解数据格式是解析文件的关键。 - **正则表达式**:对于复杂的数据格式,可以使用正则表达式进行匹配和提取。 - **数据...

    excel树形字典,导入数据库

    "Excel树形字典,导入数据库"这个主题就聚焦于如何将结构化的Excel数据,特别是树形结构的数据,有效地整合到数据库系统中。 首先,我们需要理解什么是"树形字典"。在Excel中,树形字典通常指的是通过表格形式表示...

    文本文件导入到SQL库

    在IT领域,文本文件导入到SQL数据库是一种常见的数据迁移或数据加载操作,尤其适用于大量数据的批量处理。这里,我们将详细探讨这个过程,包括相关的工具、步骤和技术。 首先,我们需要理解SQL(Structured Query ...

    向NaviCat表格中导入的.txt文本数据

    此外,对于结构化良好的`.txt`文件,还可以考虑使用ETL(提取、转换、加载)工具进行更复杂的数据清洗和转换。 总之,将`.txt`文本数据导入NaviCat需要理解文件格式、数据库表结构以及NaviCat的导入机制。熟练掌握...

    php 指定文件中的数据导入数据库

    在PHP中,将指定文件中的数据导入到数据库是一项常见的任务,尤其在处理大量结构化数据时,如CSV或TSV文件。以下是一个详细的步骤和知识点介绍,如何使用PHP实现这个功能,以及涉及到的相关技术。 首先,我们需要...

    TXT文件数据导入到mysql数据库

    总之,从TXT文件导入数据到MySQL数据库是数据处理中的常见任务,通过选择合适的方法和工具,我们可以有效地完成数据迁移,为后续的数据分析和应用奠定基础。在进行这个过程时,理解TXT文件的格式,熟悉MySQL的数据...

    xml中的数据导入数据库

    XML(eXtensible Markup Language)是一种用于存储和传输数据的结构化格式,它独立于软件和硬件,常用于在不同系统间交换数据。在IT领域,将XML数据导入数据库是一项常见的任务,尤其是在需要整合来自不同来源的数据...

    易语言txt导入access数据库例程

    将TXT文件导入Access数据库,可以帮助我们将非结构化的文本数据转化为结构化数据,便于进一步分析和处理。 在易语言中,我们可以利用“文件”和“数据库”相关的命令来实现这个功能。例如,我们首先要打开TXT文件,...

    C#如何将Excel导入数据库

    在C#中将Excel数据导入数据库是一个常见的任务,特别是在处理大量结构化数据时。下面将详细解释这个过程,包括步骤、关键代码以及注意事项。 首先,我们需要建立一个连接Excel文件的方法。在提供的代码中,`...

    txt导入至数据库.zip

    数据库是一种高效、可靠的方式来存储和管理大量结构化数据。本文将详细讲解如何将TXT文件和Excel文件批量导入到数据库,以C#编程语言为例,结合Access数据库进行操作。 首先,我们要了解TXT文件。TXT文件是一种纯...

    XML文件数据导入到数据库中

    在IT行业中,XML文件的数据导入到数据库是常见的数据迁移或整合任务,特别是在处理大量结构化信息时。本篇将详细讲解如何将XML文件中的数据导入到SQL Server数据库中。 首先,了解XML文件的结构至关重要。XML文件由...

Global site tag (gtag.js) - Google Analytics