把几个大的文件的内容读到数据库中。
查看了手册open方法,首先想到了seek()方法,和fread()方法读到一段内容来执行插入。
大概说一下方法吧。
一 取数据
取一段内容,以回车(\n)分隔内容为数据,批量插入数据库
如要读取文件内容如下:
abcd
efgh
ijkl
mnop
按13个字符取内容
root_path = os.path.abspath('./') + os.sep
f = open(root_path + 'file/pass.txt', 'r')
f.seek(0)
line = f.read(13) #从文件中读取一段内容
输出如下:(回车[\n]占一个字符)
abcd
efgh
ijk
转换为数组后
L = ['abcd', 'efgh', 'ijk']
此时插入数据库内容为
['abcd', 'efgh']
将最后一条数据缓存 t = L.pop()
下一次循环得到数组为
L = ['l', 'mnop']
此时将第一条数据和缓存的数据合并
L[0] = t + L[0]
并缓存数组最后一条数据
二 插入数据
插入数据,使用批量插入
最开始的时候我拼好sql语句如:INSERT INTO XX(`a`) VALUES(1),(2),(3)...
然后调用mysql-python的方法
conn = mysql.connector.connect(host='127.0.0.1', database='xxx', user='xxx', password='xxx')
conn.cursor().execute(sql)
结果执行了大概2万多就报Lost connection to MySQL server错误了。后来我看mysql-python里面的代码原来批量插入数据有封装好的方法是
conn.cursor().execute(sql)
data = [
('Jane','555-001'),
('Joe', '555-001'),
('John', '555-003')
]
stmt = "INSERT INTO employees (name, phone) VALUES (%s,%s)"
cursor.executemany(stmt, data)
注意以上两点后,上代码:
#encoding:utf-8
'''
Created on 2013-1-27
@author: JinHanJiang
'''
'''
create table
CREATE TABLE `Passwords` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT 'id主键',
`pass` varchar(64) NOT NULL COMMENT '密码',
`md5` varchar(32) DEFAULT NULL COMMENT '32位md5值',
PRIMARY KEY (`id`),
UNIQUE KEY `pass` (`pass`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 COMMENT='密码'
'''
import os
import re
import time
from datetime import datetime
import hashlib
import mysql.connector
import random
root_path = os.path.abspath('./') + os.sep
f = open(root_path + 'file/f1.txt', 'r')
fields = ['pass', 'md5']
def writeDB(params):
try:
fields = '(`' + '`, `'.join(params['fields']) + '`)'
stmt = "INSERT IGNORE INTO Passwords"+fields+" VALUES (%s,%s)"
conn = mysql.connector.connect(host='127.0.0.1', database='password', user='root', password='admin')
conn.cursor().executemany(stmt, params['datas'])
conn.cursor().close()
conn.close()
except Exception as e:
print e
pos = 0
buff = 1024 * 1024
last = ''
dstart = datetime.now()
print "Program Start At: " + dstart.strftime('%Y-%m-%d %H:%M:%S')
while 1:
f.seek(pos)
line = f.read(buff) #从文件中读取一段内容
datas = []
if not line:
if '' is not last:
data = (last, hashlib.md5(last).hexdigest().upper())
datas.append(data)
params = {'fields': fields, 'datas': datas}
writeDB(params)
break; #如果内容为空跳出循环
pos += buff #计算取下一段内容长度
buff = pos
lines = re.split("\n", line) #以回车(\n)分隔内容到数组中
lines[0] = str(last) + str(lines[0])
last = lines.pop() #将数组最后一条数据剔除,并存到last变量中,到下次循环再处理
for lin in lines:
lin = lin.rstrip() #去除内容末尾的回车字符
if not lin:
continue
data = (lin, hashlib.md5(lin).hexdigest().upper())
datas.append(data) #封装内容
if len(datas) > 0:
params = {'fields': fields, 'datas': datas}
writeDB(params)
time.sleep(random.random()) #让Cpu随机休息0 <= n < 1.0 s
f.close()
dend = datetime.now()
print "Program End At:%s Time span %s"%(dend.strftime('%Y-%m-%d %H:%M:%S'), dend - dstart);
分享到:
相关推荐
以下是一个使用Python读取CSV文件并快速插入到数据库的实例: ```python # -*- coding:utf-8 -*- # auth:ckf # date:20170703 import pandas as pd import cStringIO import warnings from sqlalchemy import ...
python读取数据库数据对dxf文件进行标注并另存,链接数据库,读取数据,根据数据对dxf文件进行方框标注,并判断文字区域旋转角,最后另存
今天同事写代码,用python读取一个四五百兆的文件,然后做一串逻辑上很直观的处理。结果处理了一天还没有出来结果。问题出在哪里呢? 解决: 1. 同事打印了在不同时间点的时间,在需要的地方插入如下代码: print ...
这段代码读取CSV文件,然后使用`execute_many`方法将所有行一次性插入到数据库中。 另一个关键功能是`fancyMySQL`的流式处理,这允许你在处理大文件时避免一次性加载整个文件到内存。比如,你可以这样实现: ```...
本示例将介绍如何使用Python读取SQLite3数据库中的数据,并将统计结果写入Excel文件。 首先,确保已安装了`sqlite3`(Python标准库的一部分)和`pandas`(用于数据处理和分析)以及`openpyxl`(用于处理Excel文件)...
"fp.rar"这个文件可能是一个压缩包,里面包含了与Python文件操作、数据库连接以及数据读取相关的资源。在这里,我们将深入探讨这些关键知识点。 1. **Python 文件操作**: Python 提供了简洁易用的内置函数来处理...
使用Python连接KingBase(数据库)的库
本示例介绍了一个具体的Python脚本,它演示了如何读取Word文档并将其内容插入到MySQL数据库。 首先,我们需要导入必要的库: 1. `docx`:用于处理.docx格式的Word文档。 2. `pymysql`:Python的MySQL数据库连接库。...
在IT行业中,Python是一种广泛应用的编程语言,尤其在数据...只要正确配置连接信息并熟悉SQL语句,你就可以轻松地进行数据读取、写入和更新操作。同时,结合其他Python库,如`pandas`,可以实现更复杂的数据处理任务。
它们可能包含用某种编程语言(如C、Perl、Python或RPG)编写的脚本,用于读取`proc`数据库,将数据写入文件,然后从文件中读取数据并导入回数据库。代码可能会涉及文件I/O操作、数据库连接和SQL语句的执行。 源码...
本文将详细介绍如何使用Python读取TXT文件中的数据,并将其存储到SQLite3数据库中,同时也会涉及数据库的基本操作,如创建表、插入数据以及查询数据。 首先,我们需要导入`sqlite3`模块,这是Python标准库的一部分...
描述"使用python语言链接MySQL数据库"则明确了我们的目标,即通过Python编程来建立与MySQL数据库的连接,实现数据的读写等操作。 接下来,我们看看标签:"mysql mysql_python python_sql python_数据库 python...
本文将深入探讨如何使用Python连接并操作Microsoft Access数据库,这一过程不仅涉及了基础的数据库连接,还包括了数据的读取、写入以及查询等高级功能。 #### 一、环境准备与库导入 在开始之前,确保已安装了...
该脚本的开发背景源于琐碎的需要手动记录的学籍信息采集工作。具体功能主要是通过Python脚本语言读取Excel中的数据然后将其存入Access数据库中。
在IT行业中,批量读取文本文件(如TXT文件)并将其数据导入到数据库是一项常见的任务,特别是在处理大量数据时。这个“批量读取txt文件导入数据库Demo实例”可能是一个示例程序,展示了如何高效地完成这项工作。下面...
【Python连接MSSQL数据库】Python的pymssql库提供了与Microsoft SQL Server数据库进行交互的能力。pymssql作为专门针对SQL Server的接口,允许开发者在Python环境中执行SQL语句,进行数据的读写操作。而pyodbc则是一...
使用pandas,我们可以轻松读取Excel文件,并将其转换为DataFrame对象,便于后续处理。代码示例如下: ```python import pandas as pd # 读取Excel文件 def read_excel_file(file_path): return pd.read_excel...
python将数据插入数据库的方法: 首先读入数据并建立数据库连接; 然后创建数据库; 接着执行插入数据语句,迭代读取每行数据; 最后关闭数据库连接即可。 比如现在我们要将如下Excel数据表格插入到MySQL数据库...
本文将详细介绍如何利用Python从数据库中读取大量数据,并将其批量写入文件的方法。 #### 一、背景介绍 在实际应用中,特别是在使用机器学习模型进行训练之前,通常需要对数据进行预处理。如果数据集非常庞大,一...