`
hongyu6
  • 浏览: 20150 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

超大文本文件数据导入MYSQL

阅读更多

今天用到一个处理650万的数据导入数据库处理的问题,在网上找了半天,终于在在三灯的博客找到办法,特此转过来以备后用,哈哈!

我执行的命令语句是mysqlimport -uroot -p123456 -L -v --fields-terminated-by=, all hongjun.txt





以下原文转载:http://blog.sina.com.cn/s/blog_406127500100jagk.html






mysqlimport -uroot -pEastlinden -L -v --fields-terminated-by=$$ searchpatentDZ D:\3.0\temp_law_en.txt




第一次使用mysqlimport工具还真是费了不少功夫。总结下来最需要注意的有两点:

1.把导入文件转换为linux格式:如果是windows下编辑的文件,需要把\r去掉,否则此\r会被导入到字段的值里;

2.导入文件的字符集一定要与对应表的字段的字符集一至,否则很 可能导成乱码;mysqlimport虽然有一个设置字符集的参数,但是不太清楚是做什么用的,设置了以后,并没有做编码转换;




大容量的文件导入MYSQL方法(LINUX系统):
在使用MYSQLIMPORT导入大容量数据时,mysql一定会提示导入不成功,让你设置大的缓存,但是究竟设多大你也不好界定,所以我们可以从导入的原始文件入手,把他拆分为小的文件。
涉及到的工具:
1.使用MYSQL自带的导入工具MYSQLIMPORT
2.使用LINUX自带的拆分工具SPLIT
步骤:
1.使用SPLIT命令拆分源文件,拆分多大由你控制。
   命令格式:
             split -l 行数源文件
             (通过行数来控制文件的大小)
这时系统会将文件拆分成小文件,每个文件的行数是你自己定义的。拆分的文件名有系统自动生成。
2.使用MYSQLIMPORT导入数据。
   mysqlimport的命令详解
.mysqlimport的常用选项介绍:
    选项             功能
-L                 导入本地文件
-d or --delete     新数据导入数据表中之前删除数据数据表中的所有信息
-f or --force     不管是否遇到错误,mysqlimport将强制继续插入数据
-i or --ignore     mysqlimport跳过或者忽略那些有相同唯一关键字的行,导入文件中的数据将被忽略。
-l or -lock-tables 数据被插入之前锁住表,这样就防止了,你在更新数据库时,用户的查询和更新受到影响。
-r or -replace     这个选项与-i选项的作用相反;此选项将替代表中有相同唯一关键字的记录。
--fields-enclosed- by= char
          指定文本文件中数据的记录时以什么括起的, 很多情况下数据以双引号括起。 默认的情况下数据是没有被字符括起的。
--fields-terminated- by=char
          指定各个数据的值之间的分隔符,在句号分隔的文件中,分隔符是句号。您可以用此选项指定数据之间的分隔符。默认的分隔符是跳格符(Tab)
--lines-terminated- by=str
          此选项指定文本文件中行与行之间数据的分隔字符串或者字符。 默认的情况下mysqlimport以newline为行分隔符。
          您可以选择用一个字符串来替代一个单个的字符:一个新行或者一个回车。
mysqlimport命令常用的选项还有-v 显示版本(version), -p 提示输入密码(password)等。

3).例子:导入一个以逗号为分隔符的文件文件中行的记录格式是这样的:
1,werwer,345345,585858
命令:
./mysqlimport -u用户名 -p密码 -L -v --fields-terminated-by=, 库名表名.txt
表名.TXT这里需要注意的是,要把split拆分的文件重命名为表名.txt(在LINUX下重命名可以用mv 源文件名目的文件名),这样MYSQLIMPORT才能导入到你想导入的表中,比如库名是city,表名是sms,那么命令就应该为:./mysqlimport -u用户名 -p密码 -L -v --fields-terminated-by=, city sms.txt
经过我的测试,MYSQLIMPORT这个工具的导入速度是相当的快的2G的文件有10分钟就可以了(机器的配置是至强2.1,内存2G)




-----------------------------------------------------------------------------------

 1).mysqlimport的语法介绍:

   mysqlimport位于mysql/bin目录中,是mysql的一个载入(或者说导入)数据的一个非常有效的工具。这是一个命令行工具。有两个参数以及大量的选项可供选择。这个工具把一个文本文件(text file)导入到你指定的数据库和表中。比方说我们要从文件Customers.txt中把数据导入到数据库Meet_A_Geek中的表 Custermers中:
  mysqlimport Meet_A_Geek Customers.txt
  注意:这里 Customers.txt是我们要导入数据的文本文件, 而Meet_A_Geek是我们要操作的数据库,
  数据库中的表名是 Customers,这里文本文件的数据格式必须与Customers表中的记录格式一致,否则mysqlimport命令将会出错。其中表的名字是导入文件的第一个句号(.)前面文件字符串,另外一个例子:
  mysqlimport Meet_A_Geek Cus.to.mers.txt
  那么我们将把文件中的内容导入到数据库Meet_A_Geek 中的Cus表中。
  上面的例子 中,都只用到两个参数,并没有用到更多的选项,下面介绍mysqlimport的选项
  
  2).mysqlimport的常 用选项介绍:

  选项 功能
  -d or --delete 新数据导入数据表中之前删除数据数据表中的所有信息
  -f or --force 不管是否遇到错误,mysqlimport将强制继续插入数据
  -i or --ignore mysqlimport跳过或者忽略那些有相同唯一关键字的行, 导入文件中的数据将被忽略。
  -l or -lock-tables 数据被插入之前锁住表,这样就防止了,你在更新数据库时,用户的查询和更新受到影响。
  -r or -replace 这个选项与-i选项的作用相反;此选项将替代表中有相同唯一关键字的记录。
  --fields-enclosed- by= char
   指定文本文件中数据的记录时以什么括起的, 很多情况下数据以双引号括起。 默认的情况下数据是没有被字符括起的。
   --fields-terminated- by=char
  指定各个数据的值之间的分隔符,在句号分隔的文件中,分隔符是句号。您可以用此选项指定数据之间的分隔符。默认的分隔符是跳格符(Tab)
  --lines-terminated- by=str
  此选项指 定文本文件中行与行之间数据的分隔字符串 或者字符。 默认的情况下mysqlimport以newline为行分隔符。您可以选择用一个字符串来替代一个单个的字符: 一个新行或者一个回车。
  mysqlimport命令常用的选项还有-v 显示版本(version), -p 提示输入密码(password)等。
  
  3).例子:导入一个以逗号为分隔符的文件

  文件中行的记录格式是这样的:
  "1", "ORD89876", "1 Dozen Roses", "19991226"
  我们的任务是要把这个文件里面的数据导入到数据库Meet_A_Geek中的表格Orders中, 我们使用这个命令:
   bin/mysqlimport –prl –fields-enclosed-by=" –fields-terminated-by=, Meet_A_Geek Orders.txt
  这个命令可能看起来很不爽,不过当你熟悉了之后,这是非常简单的。第一部 分,bin/mysqlimport ,告诉操作系统你要运行的命令是mysql/bin目录下的mysqlimport,选项p是要求输入密码,这样就要求你在改动数据库之前输入密码,操作起来会更安全。我们用了r选项是因为我们想要把表中的唯一关键字与文件记录中有重复唯一关键字的记录替换成文件中的数据。我们表单中的数据不是最新的,需要用文件中的数据去更新,因而就用r这个选项,替代数据库中已经有的记录。l选项的作用是在我们插入数据的时候锁住表,这样就阻止了用户在我们更新表的时候对表进行查询或者更改的操作。

分享到:
评论

相关推荐

    python读取txt文件将数据导入mysql数据库

    在测试的时候,需要造模拟数据,或者是将生产环境的数据导出到测试环境中去,本文记录通过python读取txt文件,并将数据导入mysql数据库 1、示例代码: import pymysql # 打开数据库连接 conn = pymysql.connect(host...

    TXT文件数据导入到mysql数据库

    在完成数据库表的创建后,我们可以使用多种方法将TXT数据导入MySQL: 1. **LOAD DATA INFILE命令**:这是MySQL提供的一种高效导入方法。例如,如果你的TXT文件在服务器本地,可以使用以下命令: ```sql LOAD ...

    MySQL数据导入导出

    在数据库管理和维护中,数据导入和导出是非常关键的操作,尤其是在MySQL数据库管理系统中。数据导入导出的目的多种多样,比如数据备份、数据迁移、数据整合等,因此掌握高效可靠的数据导入导出方法对于数据库管理员...

    excel数据导入mysql工具

    Excel数据导入MySQL是一种常见的数据迁移操作,特别是在数据分析和报表制作中。这个工具“xls2sql”显然就是为了方便这种操作而设计的。以下是对这个主题的详细说明: 首先,Excel是Microsoft Office套件中的一个...

    用perl程序导入文本文件到mysql数据库中的方法

    用perl程序实现文本文件到mysql数据的自动加载.

    向MySQL批量导入文本文件

    在IT领域,数据库管理是至关重要的,而MySQL作为一款广泛使用的开源关系型数据库管理系统,其数据导入功能在日常工作中十分常见。本篇文章将详细讲解如何向MySQL批量导入文本文件,以便于快速有效地处理大量数据。 ...

    Mysql教程:将txt文本中的数据轻松导入MySQL表中的方法.doc

    其实,使用PHP脚本,我们可以轻松地将txt文本中的数据导入MySQL表中。 首先,我们需要将数据记录按行处理好,并用特定的字符分开,如逗号(,)。例如: aaa,bbb,ccc,ddd,eee fff,ggg,hhh,iii,jjj,kkk 然后,我们...

    txt数据文件导入mysql数据库

    这是MySQL提供的一种高效的数据导入工具,用于快速地从文本文件(如CSV、TXT等)中批量加载数据到已存在的表中。标题"txt数据文件导入mysql数据库"就是指的这个功能。使用方法如下: ```sql LOAD DATA INFILE '...

    MySQL数据导入导出各类型文件

    MySQL 数据导入导出是数据库管理中的重要操作,用于数据备份、迁移或在不同系统间交换数据。本篇文章主要探讨如何使用MySQL命令行和特定软件来导入导出不同类型的文件,如txt、sql和csv。 首先,数据导出可以通过两...

    使用kettle将文本文件导入到数据库

    一个简单的例子,使用kettle将文本文件导入到数据库

    mysql导入文本或excel文件

    在日常工作中,我们经常需要将现有的文本文件或Excel文件中的数据导入到MySQL数据库中。这一操作可以帮助我们快速构建数据库表,并填充必要的数据,为后续的数据分析、处理等任务打下坚实的基础。下面将详细介绍如何...

    MsSql数据导入MySql

    这里,`data_file.txt`是包含要导入数据的文本文件,`table_name`是你在MySQL中对应的表名。`FIELDS TERMINATED BY ','`定义字段间的分隔符,`ENCLOSED BY '"'`表示字段值用双引号括起,`LINES TERMINATED BY '\n'`...

    MYSQL数据导入

    `LOAD DATA INFILE` 是MySQL提供的一个高效的数据导入工具,它能够快速地从CSV或其他文本文件中导入数据。例如,如果你有一个名为`data.csv`的文件,你可以使用以下语句: ```sql LOAD DATA INFILE 'data.csv' ...

    solr5.3.1 导入mysql数据

    在本案例中,我们将探讨如何将 MySQL 数据库中的数据导入到 Solr 5.3.1 中,以便进行高效的全文检索。 首先,我们需要理解 Solr 的核心组件——Schema.xml 文件。这是 Solr 的模式定义文件,它定义了索引字段、字段...

    文本文件批量导入sql数据库

    在描述中提到,导入速度很快,这得益于SQL提供的高效数据导入机制,如BULK INSERT或LOAD DATA INFILE(在MySQL中)等命令。 **SQL数据库的基础** SQL数据库通常包括表(Table)、列(Column)、行(Row)和索引...

    java把文本文件内容导入到数据库

    在IT行业中,数据导入是一项常见的任务,特别是在大数据处理和企业信息系统中。Java作为一种广泛使用的编程语言,具有丰富的库和工具支持文件操作和数据库交互。在这个场景下,"java把文本文件内容导入到数据库"是一...

    MsSQL数据导入MySQL(含源码).net

    将MsSQL 数据导入 MySQL的工具 本工具的知识点有: 1、SQL2005读取表信息(如果是SQL2000更正一下读取表结构语句即可)。 2、用通过管道导入并执行MySQL语句。 3、.net 调用外部程序,如DOS命令。 4、SQL2005与...

    mysql导入txt文本

    在实际操作中,我们经常需要将外部数据,如TXT文本文件,导入到MySQL数据库中。这篇博客文章将指导你如何实现这一过程。 首先,我们需要了解TXT文件的格式。TXT文件通常包含纯文本数据,每一行代表一个记录,字段...

    文本文件导入到SQL库

    总之,文本文件导入到SQL库是一个多步骤的过程,涉及到数据预处理、数据库连接、数据导入以及可能的错误处理和性能优化。不同数据库系统提供了多种方法来实现这一操作,开发者可以根据具体需求选择最合适的工具和...

Global site tag (gtag.js) - Google Analytics