`
zhuruxin86
  • 浏览: 107599 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

Python Excel

 
阅读更多
Python Excel Tutorial 指南
安装
有几种不同的安装方法。下面是以xlrd为例的,其它二个库都是使用同样的步骤。



从源码安装
Linux系统:

Python代码 
1.$ tar xzf xlrd.tgz  
2.$ cd xlrd-0.7.1 
3.$ python setup.py install 
$ tar xzf xlrd.tgz
$ cd xlrd-0.7.1
$ python setup.py installWindows系统:使用WinZip或类似工具解压xlrd-0.7.1.zip:

Python代码 
1.C:\> cd xlrd-0.7.1 
2.C:\xlrd-0.7.1> \Python26\python setup.py install 
C:\> cd xlrd-0.7.1
C:\xlrd-0.7.1> \Python26\python setup.py install注意:确保你想要在你的项目中使用python。



使用Windows Installer安装
Windows系统下,你可以下载运行xlrd-0.7.1.win32.exe安装。

注意它只是以注册表形式安装到Python中。



使用EasyInstall安装
这种跨平台方法需要你已经安装了EasyInstall。更多信息请参考:

http://peak.telecommunity.com/DevCenter/EasyInstall 

Python代码 
1.easy_install xlrd 
easy_install xlrd



使用Buildout安装
Buildout在遇见python包时依靠一个没有涉及到Python系统的项目,提供一种跨平台的方法。

创建一个目录mybuildout,在里面下载下面文件:

http://svn.zope.org/*checkout*/zc.buildout/trunk/bootstrap/bootstrap.py   

现在,在mybuilout目录中创建一个名为buildout.cfg的文件,内容如下:

Txt代码 
1.[buildout]  
2.parts = py   
3.versions = versions  
4.[versions]  
5.xlrd=0.7.1 
6.xlwt=0.7.2 
7.xlutils=1.3.2 
8.[py]  
9.recipe = zc.recipe.egg  
10.eggs =   
11.  xlrd   
12.  xlwt   
13.  xlutils  
14.interpreter = py 
[buildout]
parts = py
versions = versions
[versions]
xlrd=0.7.1
xlwt=0.7.2
xlutils=1.3.2
[py]
recipe = zc.recipe.egg
eggs =
  xlrd
  xlwt
  xlutils
interpreter = py 注意:这个版本部分是可选的。

最后,运行下面:

Python代码 
1.$ python bootstrap.py  
2.$ bin/buildout 
$ python bootstrap.py
$ bin/buildout这两行:

•初始化buildout环境
•运行buildout。 如果发生了变化这个命令每次都应该执行。
Buildout主页在 http://pypi.python.org/pypi/zc.buildout



读取Excel文件
下面展示的所有的例子都是基于xlrd目录的教程。



打开Workbooks
Workbooks能从一个文件、一个mmap.mmap对象或一个字符串加载:

Python代码 
1.from mmap import mmap,ACCESS_READ  
2.from xlrd import open_workbook  
3. 
4.print open_workbook('simple.xls')  
5. 
6.with open('simple.xls','rb') as f:  
7.    print open_workbook(  
8.        file_contents=mmap(f.fileno(),0,acc  
9.        )  
10. 
11.aString = open('simple.xls','rb').read()  
12.print open_workbook(file_contents=aString) 
from mmap import mmap,ACCESS_READ
from xlrd import open_workbook

print open_workbook('simple.xls')

with open('simple.xls','rb') as f:
    print open_workbook(
        file_contents=mmap(f.fileno(),0,acc
        )

aString = open('simple.xls','rb').read()
print open_workbook(file_contents=aString)操作Workbook
这是一个简单操作workbook的例子:

Python代码 
1.from xlrd import open_workbook  
2. 
3.wb = open_workbook('simple.xls')  
4. 
5.for s in wb.sheets():  
6.    print 'Sheet:',s.name  
7.    for row in range(s.nrows):  
8.        values = []  
9.        for col in range(s.ncols):  
10.            values.append(s.cell(row,col).value)  
11.        print ','.join(values)  
12.    print 
from xlrd import open_workbook

wb = open_workbook('simple.xls')

for s in wb.sheets():
    print 'Sheet:',s.name
    for row in range(s.nrows):
        values = []
        for col in range(s.ncols):
            values.append(s.cell(row,col).value)
        print ','.join(values)
    print下面几乎没有小节涉及到操作workbook的更多细节。



揭秘Book
通过open_workbook返回的xlrd.Book对象包含了所有对工作簿要的事情,能被用于在工作簿中取得独立的sheet。



这个nsheets属性是一个整数,包含工作簿sheet的数量。这个属性与sheet_by_index方法结合起来是获取独立sheet最常用的方法。



sheet_names方法返回包含工作簿中所有sheet名字的unicode列表。单独的sheet可以通过sheet_by_name方法使用这些名字获取。



sheets方法的结果是迭代获取工作簿中的每个sheet。



下面是这些方法和属性的例子示范:

Python代码 
1.from xlrd import open_workbook  
2. 
3.book = open_workbook('simple.xls')  
4. 
5.print book.nsheets  
6. 
7.for sheet_index in range(book.nsheets):  
8.    print book.sheet_by_index(sheet_index)  
9.      
10.print book.sheet_names()  
11.for sheet_name in book.sheet_names():  
12.    print book.sheet_by_name(sheet_name)  
13.      
14.for sheet in book.sheets():  
15.    print sheet 
from xlrd import open_workbook

book = open_workbook('simple.xls')

print book.nsheets

for sheet_index in range(book.nsheets):
    print book.sheet_by_index(sheet_index)
   
print book.sheet_names()
for sheet_name in book.sheet_names():
    print book.sheet_by_name(sheet_name)
   
for sheet in book.sheets():
    print sheet xlrd.Book对象有与工作簿内容相关的其它属性,但很少用到:

•codepage
•countries
•user_name
如果你可能需要运用这些属性,请查看xlrd文档。



揭秘Sheet
通过上面介绍的方法返回的xlrd.sheet.Sheet对象包含了所有对worksheet和它的内容操作的信息。



name属性是worksheet名字的unicode表示。



nrows和ncols属性分别包含了worksheet中的行数和列数。



下面例子展示了如何使用迭代来显示一个worksheet的内容:

Python代码 
1.from xlrd import open_workbook,cellname  
2. 
3.book = open_workbook('odd.xls')  
4.sheet = book.sheet_by_index(0)  
5. 
6.print sheet.name  
7. 
8.print sheet.nrows  
9.print sheet.ncols  
10. 
11.for row_index in range(sheet.nrows):  
12.    for col_index in range(sheet.ncols):  
13.        print cellname(row_index,col_index),'-',  
14.        print sheet.cell(row_index,col_index).value 
from xlrd import open_workbook,cellname

book = open_workbook('odd.xls')
sheet = book.sheet_by_index(0)

print sheet.name

print sheet.nrows
print sheet.ncols

for row_index in range(sheet.nrows):
    for col_index in range(sheet.ncols):
        print cellname(row_index,col_index),'-',
        print sheet.cell(row_index,col_index).value xlrd.sheet.Sheet对象有其他一些与worksheet内容相关的属性,但很少使用:

•col_label_ranges
•row_label_ranges
•visibility
如果你认为你可能需要运用这些属性,请参看xlrd文档。



获得特定的单元格
正如你在前面例子中看到的,Sheet对象的cell方法能用来返回特定单元格的内容。



cell方法返回一个xlrd.sheet.Cell对象。除了value包含了单元格的真实值,ctype包含了单元格的类型,Cell对象几乎没有其他属性。



另外,Sheet对象有两个方法返回这两种数据类型。cell_value方法返回特定单元格的值,而cell_type方法返回特定单元格的类型。这两个方法执行时比获取Cell对象更快。



后面会讲述更多Cell类型的细节。下面示范了这些方法,属性和起作用的类:

Python代码 
1.from xlrd import open_workbook,XL_CELL_TEXT  
2. 
3.book = open_workbook('odd.xls')  
4.sheet = book.sheet_by_index(1)  
5. 
6.cell = sheet.cell(0,0)  
7.print cell  
8.print cell.value  
9.print cell.ctype==XL_CELL_TEXT  
10. 
11.for i in range(sheet.ncols):  
12.    print sheet.cell_type(1,i),sheet.cell_value(1,i) 
from xlrd import open_workbook,XL_CELL_TEXT

book = open_workbook('odd.xls')
sheet = book.sheet_by_index(1)

cell = sheet.cell(0,0)
print cell
print cell.value
print cell.ctype==XL_CELL_TEXT

for i in range(sheet.ncols):
    print sheet.cell_type(1,i),sheet.cell_value(1,i)
迭代Sheet的内容
我们已经见过怎么迭代worksheet的内容,获取产生的单独的单元格。然而,有更容易的方法来获取单元格组。有一套对称的方法来通过行或列获取单元格组的信息。



row和col方法分别返回一整行(列)的Cell对象。



row_slice和col_slice方法分别返回一行(列)中以开始索引和一个可选的结束索引为边界的Cell对象列表。



row_types和col_types方法分别返回一行(列)中以开始索引和一个可选的结束索引为边界的表示单元格类型的整数列表。



row_values和col_values方法分别返回一行(列)中以开始索引和一个可选的结束索引为边界的表示单元格值的对象列表。



下面是所有sheet迭代方法的示例:

Python代码 
1.from xlrd import open_workbook  
2. 
3.book = open_workbook('odd.xls')  
4.sheet0 = book.sheet_by_index(0)  
5.sheet1 = book.sheet_by_index(1)  
6. 
7.print sheet0.row(0)  
8.print sheet0.col(0)  
9.print 
10.print sheet0.row_slice(0,1)  
11.print sheet0.row_slice(0,1,2)  
12.print sheet0.row_values(0,1)  
13.print sheet0.row_values(0,1,2)  
14.print sheet0.row_types(0,1)  
15.print sheet0.row_types(0,1,2)  
16.print 
17.print sheet1.col_slice(0,1)  
18.print sheet0.col_slice(0,1,2)  
19.print sheet1.col_values(0,1)  
20.print sheet0.col_values(0,1,2)  
21.print sheet1.col_types(0,1)  
22.print sheet0.col_types(0,1,2) 
from xlrd import open_workbook

book = open_workbook('odd.xls')
sheet0 = book.sheet_by_index(0)
sheet1 = book.sheet_by_index(1)

print sheet0.row(0)
print sheet0.col(0)
print
print sheet0.row_slice(0,1)
print sheet0.row_slice(0,1,2)
print sheet0.row_values(0,1)
print sheet0.row_values(0,1,2)
print sheet0.row_types(0,1)
print sheet0.row_types(0,1,2)
print
print sheet1.col_slice(0,1)
print sheet0.col_slice(0,1,2)
print sheet1.col_values(0,1)
print sheet0.col_values(0,1,2)
print sheet1.col_types(0,1)
print sheet0.col_types(0,1,2)
实用方法
当围绕workbook进行操作的时候,把行和列转换成用户习惯看到的Excel单元格引用(如:(0,0)转换成A1),这是很有用的。下面提供的方法帮助我们实现它:



cellname方法把一对行和列索引转换为一个对应的Excel单元格引用。



cellnameabs方法把一对行和列索引转换为一个绝对的Excel单元格引用(如:$A$1)。



colname方法把一个列索引转换为Excel列名。



下面是这三个方法的示例:

Python代码 
1.from xlrd import cellname, cellnameabs, colname  
2. 
3.print cellname(0,0),cellname(10,10),cellname(100,100)  
4.print cellnameabs(3,1),cellnameabs(41,59),cellnameabs(265,358)  
5.print colname(0),colname(10),colname(100) 
from xlrd import cellname, cellnameabs, colname

print cellname(0,0),cellname(10,10),cellname(100,100)
print cellnameabs(3,1),cellnameabs(41,59),cellnameabs(265,358)
print colname(0),colname(10),colname(100)
Unicode
由xlrd产生的所有文本属性不是unidecode对象,就是ascii字符串(很少)。



由Microsoft Excel输入的每个文本都是下列编码之一:

•Latin1,如果匹配
•UTF_16_LE,如果不匹配Latin1
•在更老的文件中,是按MS字符集规范编码的。他们由xlrd映射到Python编码,结果仍是unicode对象。
其他知名软件用错误字符集或不用字符集写入Excel文件的情况是很少的。这种情况下,可能需要在open_workbook方法中指定正确的字符集。

Python代码 
1.from xlrd import open_workbook  
2.book = open_workbook('dodgy.xls',encoding='cp1252') 
from xlrd import open_workbook
book = open_workbook('dodgy.xls',encoding='cp1252')

单元格的类型
我们已经看过单元格类型用一个整数表示。这个整数相当于xlrd识别单元格类型的一组常数。可能的单元格类型在下面部分全部被列出来了。



Text 文本
这是由xlrd.XL_CELL_TEXT常数表示的。
这种类型的单元格的值是unicode对象。



Number 数字
这是由xlrd.XL_CELL_NUMBER常数表示的。
这种类型的单元格的值是float对象。



Date 日期
这是由xlrd.XL_CELL_DATE常数表示的。

注意:日期在Excel文件中实际上是不存在的,它们只不过是特别格式化后的数字。



如果数字格式字符串看起来像日期,xlrd将会返回xlrd.XL_CELL_DATE作为单元格类型。



提供的xldate_as_tuple方法把日期单元格中的float数转化为适合实例化各种日期或时间对象的元组。这个例子展示了怎么使用它:

Python代码 
1.from datetime import date,datetime,time  
2.from xlrd import open_workbook,xldate_as_tuple  
3. 
4.book = open_workbook('types.xls')  
5.sheet = book.sheet_by_index(0)  
6. 
7.date_value =  
8.xldate_as_tuple(sheet.cell(3,2).value,book.datemode)  
9.print datetime(*date_value),date(*date_value[:3])  
10.datetime_value =  
11.xldate_as_tuple(sheet.cell(3,3).value,book.datemode)  
12.print datetime(*datetime_value)  
13.time_value =  
14.xldate_as_tuple(sheet.cell(3,4).value,book.datemode)  
15.print time(*time_value[3:])  
16.print datetime(*time_value) 
from datetime import date,datetime,time
from xlrd import open_workbook,xldate_as_tuple

book = open_workbook('types.xls')
sheet = book.sheet_by_index(0)

date_value =
xldate_as_tuple(sheet.cell(3,2).value,book.datemode)
print datetime(*date_value),date(*date_value[:3])
datetime_value =
xldate_as_tuple(sheet.cell(3,3).value,book.datemode)
print datetime(*datetime_value)
time_value =
xldate_as_tuple(sheet.cell(3,4).value,book.datemode)
print time(*time_value[3:])
print datetime(*time_value) 说明:

•Excel文件有两种可能的日期模式,一种用于最初由Windows创建的文件,一种用于最初由苹果电脑创建的文件。这个日期模式被表示成xlrd.Book对象的datemode属性,且必须传值给xldate_as_tuple方法。

•Excel文件格式对1904年一月3日以前的日期有各种问题,引起日期混乱,从而抛出XLDateError错误。

•Excel公式方法DATE()在某些情况下会返回出乎意料的日期。


Boolean 布尔值
这是由xlrd.XL_CELL_BOOLEAN常数表示的。
这种单元格的值是bool对象。



Error 错误
这是由xlrd.XL_CELL_ERROR常数表示的。
这种单元格的值是表示特定错误代码的整数。
error_text_from_code方法用来把错误代码转换为错误信息:

Python代码 
1.from xlrd import open_workbook,error_text_from_code  
2. 
3.book = open_workbook('types.xls')  
4.sheet = book.sheet_by_index(0)  
5. 
6.print error_text_from_code[sheet.cell(5,2).value]  
7.print error_text_from_code[sheet.cell(5,3).value] 
from xlrd import open_workbook,error_text_from_code

book = open_workbook('types.xls')
sheet = book.sheet_by_index(0)

print error_text_from_code[sheet.cell(5,2).value]
print error_text_from_code[sheet.cell(5,3).value] 对一种明显显示所有单元格类型的简单方法,参看xlutils.display。



Empty/Blank 空值或空白
Excel只是在单元格中存储信息,或者对单元格格式化。而xlrd是作为单元格的矩形网格表示。



Excel文件中没有任何信息的单元格由xlrd.XL_CELL_EMPTY常数表示。另外,只要有一个空值,用于xlrd后整个值是空串,所以空值单元格应该使用一种Python标识检查。



Excel文件中只有格式信息的单元格由xlrd.XL_CELL_BLANK常数表示,它的值总是一个空字符串。

Python代码 
1.from xlrd import open_workbook,empty_cell  
2. 
3.print empty_cell.value  
4. 
5.book = open_workbook('types.xls')  
6.sheet = book.sheet_by_index(0)  
7.empty = sheet.cell(6,2)  
8.blank = sheet.cell(7,2)  
9.print empty is blank, empty is empty_cell, blank is empty_cell  
10. 
11.book = open_workbook('types.xls',formatting_info=True)  
12.sheet = book.sheet_by_index(0)  
13.empty = sheet.cell(6,2)  
14.blank = sheet.cell(7,2)  
15.print empty.ctype,repr(empty.value)  
16.print blank.ctype,repr(blank.value) 
from xlrd import open_workbook,empty_cell

print empty_cell.value

book = open_workbook('types.xls')
sheet = book.sheet_by_index(0)
empty = sheet.cell(6,2)
blank = sheet.cell(7,2)
print empty is blank, empty is empty_cell, blank is empty_cell

book = open_workbook('types.xls',formatting_info=True)
sheet = book.sheet_by_index(0)
empty = sheet.cell(6,2)
blank = sheet.cell(7,2)
print empty.ctype,repr(empty.value)
print blank.ctype,repr(blank.value)下面例子展示了以上所有单元格类型一起的使用:

Python代码 
1.from xlrd import open_workbook  
2. 
3.def cell_contents(sheet,row_x):  
4.result = []  
5.for col_x in range(2,sheet.ncols):  
6.cell = sheet.cell(row_x,col_x)  
7.result.append((cell.ctype,cell,cell.value))  
8.return result  
9. 
10.sheet = open_workbook('types.xls').sheet_by_index(0)  
11. 
12.print 'XL_CELL_TEXT',cell_contents(sheet,1)  
13.print 'XL_CELL_NUMBER',cell_contents(sheet,2)  
14.print 'XL_CELL_DATE',cell_contents(sheet,3)  
15.print 'XL_CELL_BOOLEAN',cell_contents(sheet,4)  
16.print 'XL_CELL_ERROR',cell_contents(sheet,5)  
17.print 'XL_CELL_BLANK',cell_contents(sheet,6)  
18.print 'XL_CELL_EMPTY',cell_contents(sheet,7)  
19. 
20.print 
21.sheet = open_workbook(  
22.'types.xls',formatting_info=True 
23.).sheet_by_index(0)  
24. 
25.print 'XL_CELL_TEXT',cell_contents(sheet,1)  
26.print 'XL_CELL_NUMBER',cell_contents(sheet,2)  
27.print 'XL_CELL_DATE',cell_contents(sheet,3)  
28.print 'XL_CELL_BOOLEAN',cell_contents(sheet,4)  
29.print 'XL_CELL_ERROR',cell_contents(sheet,5)  
30.print 'XL_CELL_BLANK',cell_contents(sheet,6)  
31.print 'XL_CELL_EMPTY',cell_contents(sheet,7) 
from xlrd import open_workbook

def cell_contents(sheet,row_x):
result = []
for col_x in range(2,sheet.ncols):
cell = sheet.cell(row_x,col_x)
result.append((cell.ctype,cell,cell.value))
return result

sheet = open_workbook('types.xls').sheet_by_index(0)

print 'XL_CELL_TEXT',cell_contents(sheet,1)
print 'XL_CELL_NUMBER',cell_contents(sheet,2)
print 'XL_CELL_DATE',cell_contents(sheet,3)
print 'XL_CELL_BOOLEAN',cell_contents(sheet,4)
print 'XL_CELL_ERROR',cell_contents(sheet,5)
print 'XL_CELL_BLANK',cell_contents(sheet,6)
print 'XL_CELL_EMPTY',cell_contents(sheet,7)

print
sheet = open_workbook(
'types.xls',formatting_info=True
).sheet_by_index(0)

print 'XL_CELL_TEXT',cell_contents(sheet,1)
print 'XL_CELL_NUMBER',cell_contents(sheet,2)
print 'XL_CELL_DATE',cell_contents(sheet,3)
print 'XL_CELL_BOOLEAN',cell_contents(sheet,4)
print 'XL_CELL_ERROR',cell_contents(sheet,5)
print 'XL_CELL_BLANK',cell_contents(sheet,6)
print 'XL_CELL_EMPTY',cell_contents(sheet,7)
Names
这些是很少使用但很强大的抽象方法,常用于查找Excel文件的内部信息。



它们有很多用途,xlrd能从它们之中获取信息。一个值得注意的例外是与sheet和宏命令相关的信息将会被忽略。



Names在Excel中是通过Insert > Name > Define操作创建的。如果你想使用xlrd来从Names中获取信息,在你选择的电子表格应用程序中精通names的定义和运用是一个不错的想法。



Types 类型
一个Name可以涉及到:

•一个常数
CurrentInterestRate = 0.015
NameOfPHB = “Attila T. Hun”

•一个单元格的绝对引用
CurrentInterestRate = Sheet1!$B$4

•一个单元格的1D,2D或3D块的绝对引用
MonthlySalesByRegion = Sheet2:Sheet5!$A$2:$M$100

•一个绝对引用的列表
Print_Titles = [row_header_ref, col_header_ref])



常数可以被获取。



绝对引用的坐标可以被获取,以便你稍后获取相关sheet的对应数据。



相对引用只有当你很熟悉被作为起源使用的单元格时是有用的。Excel文件中包含函数调用在内的公式和多重引用并不是有用的,也太难而无法评估。



xlrd中没有包含全部的计算引擎。



Scope 范围
一个Name的Score可以是全局的,或者它只针对特定的sheet。一个Name的标识符在不同Scope内可以被重用。但有多个相同标识符的Name,根据scope使用最合适的一个。一个好例子是内置名为Print_Area;每个worksheet都可能有它们中的一个。



例:
name=rate, scope=Sheet1, formula=0.015
name=rate, scope=Sheet2, formula=0.023
name=rate, scope=global, formula=0.040



一个单元格公式(1+rate)^20出现在Sheet1等价于1.015^20,出现在Sheet2等价于1.023^20,出现在其他Sheet等价于1.040^20。



惯例
使用names的一般原因包括:

•一个workbook中可能多个地方出现的值设定文本名称。如:RATE = 0.015
•容易被错误复制的复杂公式设定文本名称。如:SALES_RESULTS = $A$10:$M$999
这里有个真实世界的案例:向总部报告。一个公司的总部制作了一个模版workbook。每个部门复制一份并填充内容。所有被提供的日期范围都定义了Names。当这些文件传回时,一个脚本用于验证这个部门是否损坏了这个workbook,这个Names用于获取数据来做进一步处理。使用names可以将这些范围解耦和,不管是总部设计模版的用户还是往模版里填充内容的部门用户 从这个脚本都只知道这些范围的names,而不知道具体的范围值。



在xlrd发布的examples目录中你会找到namesdemo.xls,有许多例子,大部分都是针对非苹果系统定义的names。也有个xlrdnamesAPIdemo.py文件展示了如何使用name查找字典,如何获取常数、引用和引用指向的数据。



格式化
我们已经看到open_workbook方法有个参数从Excel文件加载信息。当这步完成,所有格式化信息都是可获得的,但是它是怎么实现的细节不再本书的范围内。



如果你想要复制格式化后的数据到一个新Excel文件中,参看xlutils.copy和xlutils.filter。

如果你想要检测格式化信息,你需要参考下面类的属性:

xlrd.Book

colour_map         font_list                format_list        format_map
palette_record   style_name_map   xf_list



xlrd.sheet.Sheet

cell_xf_index       rowinfo_map        colinfo_map       computed_column_width
default_additional_space_above                              default_additional_space_below
default_row_height                                                  default_row_height_mismatch
default_row_hidden                                                 defcolwidth
gcw                                                                           merged_cells

standard_width



xlrd.sheet.Cell

xf_index



Other Classes

另外,下面类是只用于表示格式化的信息:
xlrd.sheet.Rowinfo
xlrd.sheet.Colinfo
xlrd.formatting.Font
xlrd.formatting.Format
xlrd.formatting.XF
xlrd.formatting.XFAlignment
xlrd.formatting.XFBackground
xlrd.formatting.XFBorder
xlrd.formatting.XFProtection



操作大的Excel文件
如果你在操作特别大的Excel文件,那么有两个你应该注意的xlrd特性:

•open_workbook方法的on_demand参数为True,被访问时会导致只往内存里加载worksheet。
•xlrd.Book对象有一个unload_sheet方法能通过指定sheet索引或sheet名称从内存中卸载worksheet。
下面的例子展示了一个大的workbook怎么去迭代被检查只匹配某一模式的sheet,并在内存中某个时间被卸载。

Python代码 
1.from xlrd import open_workbook  
2. 
3.book = open_workbook('simple.xls',on_demand=True)  
4. 
5.for name in book.sheet_names():  
6.    if name.endswith('2'):  
7.        sheet = book.sheet_by_name(name)  
8.        print sheet.cell_value(0,0)  
9.        book.unload_sheet(name) 
from xlrd import open_workbook

book = open_workbook('simple.xls',on_demand=True)

for name in book.sheet_names():
if name.endswith('2'):
sheet = book.sheet_by_name(name)
print sheet.cell_value(0,0)
book.unload_sheet(name)
用runxlrd.py揭秘Excel文件
xlrd源码发布包括runxlrd.py脚本,它是非常有用的,不用写单行Python就能揭秘Excel文件。



推荐运行教材提供的各种命令操作Excel文件。



下面是从runxlrd获得的一个预览,使用python runxlrd.py --help能得到:



Python代码 
1.runxlrd.py [options] command [input-file-patterns]  
2. 
3.Commands:  
4. 
5.2rows           Print the contents of first and last row in each sheet  
6.3rows           Print the contents of first, second and last row in each sheet  
7.bench           Same as "show", but doesn't print -- for profiling  
8.biff_count[1]   Print a count of each type of BIFF record in the file  
9.biff_dump[1]    Print a dump (char and hex) of the BIFF records in the file  
10.fonts           hdr + print a dump of all font objects  
11.hdr             Mini-overview of file (no per-sheet information)  
12.hotshot         Do a hotshot profile run e.g. ... -f1 hotshot bench bigfile*.xls  
13.labels          Dump of sheet.col_label_ranges and ...row... for each sheet  
14.name_dump       Dump of each object in book.name_obj_list  
15.names           Print brief information for each NAME record  
16.ov              Overview of file  
17.profile         Like "hotshot", but uses cProfile  
18.show            Print the contents of all rows in each sheet  
19.version[0]      Print versions of xlrd and Python and exit  
20.xfc             Print "XF counts" and cell-type counts -- see code for details  
21. 
22.[0] means no file arg  
23.[1] means only one file arg i.e. no glob.glob pattern  
24. 
25.Options:  
26.  -h, --help            show this help message and exit  
27.  -l LOGFILENAME, --logfilename=LOGFILENAME  
28.                        contains error messages  
29.  -v VERBOSITY, --verbosity=VERBOSITY  
30.                        level of information and diagnostics provided  
31.  -p PICKLEABLE, --pickleable=PICKLEABLE  
32.                        1: ensure Book object is pickleable (default); 0:  
33.                        don't bother  
34.  -m MMAP, --mmap=MMAP  1: use mmap; 0: don't use mmap; -1: accept heuristic  
35.  -e ENCODING, --encoding=ENCODING  
36.                        encoding override  
37.  -f FORMATTING, --formatting=FORMATTING  
38.                        0 (default): no fmt info 1: fmt info (all cells)  
39.  -g GC, --gc=GC        0: auto gc enabled; 1: auto gc disabled, manual  
40.                        collect after each file; 2: no gc  
41.  -s ONESHEET, --onesheet=ONESHEET  
42.                        restrict output to this sheet (name or index)  
43.  -u, --unnumbered      omit line numbers or offsets in biff_dump 
分享到:
评论

相关推荐

    Python Excel数据分析 Python源码

    Python Excel数据分析 Python源码Python Excel数据分析 Python源码Python Excel数据分析 Python源码Python Excel数据分析 Python源码Python Excel数据分析 Python源码Python Excel数据分析 Python源码Python Excel...

    python excel中替换字符串

    在Python编程中,处理Excel文件是一项常见的任务,特别是在数据分析、数据清洗或自动化报告等领域。标题“python excel中替换字符串”和描述所指的知识点主要涉及如何在Excel文件中使用Python库来查找并替换特定字符...

    pythonExcel数据分析师程序

    pythonExcel数据分析师程序pythonExcel数据分析师程序pythonExcel数据分析师程序pythonExcel数据分析师程序pythonExcel数据分析师程序pythonExcel数据分析师程序pythonExcel数据分析师程序pythonExcel数据分析师程序...

    Python excel不同sheet之间复制单元格含格式

    Python excel不同sheet之间复制粘贴单元格含格式。代码中行和列都用数字表示,例如A 即 1

    Python excel工具

    在IT行业中,Python作为一种强大的编程语言,被广泛用于各种数据处理任务,其中包括Excel文件的读取和写入。"Python excel工具"这个主题涉及到的是如何使用Python库来操作Excel文件,以便进行数据分析、数据清洗或者...

    python Excel win32 com

    Python在处理Excel文件时,经常会使用到`win32com`这个库,它是一个Python接口,可以与Windows的COM(Component Object Model)交互,从而控制像Microsoft Office这样的应用程序,包括Excel。`win32com`库是Python的...

    python Excel数据分析师程序源程序.rar

    Python在Excel数据分析领域扮演着重要角色,特别是在大数据处理、数据清洗、统计分析和可视化方面。这份"python Excel数据分析师程序源程序.rar"压缩包中包含了用于进行此类工作的源代码,帮助用户更高效地操作和...

    python excel处理实例(单工作簿拆分到多工作簿中(单表中))

    在Python编程领域,处理Excel文件是一项常见的任务,特别是在数据分析、自动化办公等场景中。本教程将专注于一个具体的实例——如何使用Python将一个包含多个工作表的单个工作簿拆分为多个独立的工作簿,每个工作簿...

    Python Excel Mini Cookbook

    本“Python Excel Mini Cookbook” 将介绍一些常用的操作Excel的技巧,通过自包含的Python示例程序来展示如何使用Python与Excel进行交互。 首先,我们需要了解Python通过“win32com”库来操作Excel应用程序。win32...

    python excel表格合并源代码(有界面程序(pyqt5)

    在Python编程领域,处理Excel数据是一项常见的任务,而“python excel表格合并源代码(有界面程序(pyqt5)”是一个实现这一功能的应用示例。这个项目利用Python的库和PyQt5 GUI工具包来创建一个用户友好的界面,让...

    xlrd_pythonsqlite_pythonexcel_

    本项目标题"xlrd_pythonsqlite_pythonexcel_"揭示了使用Python的两个关键库:`xlrd`用于读取Excel文件,`sqlite3`用于与SQLite数据库交互。以下是对这些知识点的详细说明: 1. **xlrd库**: - `xlrd`是Python的一...

    python 操作excel 插入字段 附件案例

    在Python编程中,处理Excel文件是一项常见的任务,特别是在数据分析、报告生成或自动化流程中。本案例将探讨如何使用Python操作Excel文档,特别是插入字段以及添加各种类型的附件,如Word、Excel、ZIP等。我们将主要...

    python读写excel文件

    python读写excel

    期末答案_pythonexcel_

    "期末答案_pythonexcel_"这个标题暗示了我们可能是在探讨如何利用Python的Pandas库来操作Excel文件,解决一些与考试相关的数据处理问题。描述中的“获取excel然后排序求和等”进一步指出了我们将关注读取Excel文件、...

    Excel_pythonexcel画图_pythonexcel_excel调用_python画图_

    在Python编程环境中,处理Excel数据是一项常见的任务,特别是在数据分析、报表生成或可视化中。Python提供了多个库来支持Excel文件的读取和写入,其中最常用的是`pandas`库和`matplotlib`库。本篇文章将详细介绍如何...

    pythonExcel转Json格式工具ExcelToJson.zip

    ExcelToJson 为 python 转换 excel 为 json 格式的工具, ExcelToJson 提供一个简单的界面(Tkinter),实现单个和批量转换的功能,其中批量转换使用多线程加快转换效率。批量转换制定文件夹自动获取文件夹下为 '....

    根据Excel模板,生成副本并添加数据,截取指定区域生成图片

    标题提到的"根据Excel模板,生成副本并添加数据,截取指定区域生成图片"是一种高效的工作流解决方案,它结合了Python编程语言和Microsoft Excel的特性。这个过程涉及到多个知识点,下面将详细解释。 首先,**Excel...

    pythonExcel数据分析师程序.rar

    本资源"pythonExcel数据分析师程序.rar"显然是一个针对数据分析师的项目,包含Python源代码和相关文档,可能是为毕业设计准备的。 1. **Python与Excel交互**:Python通过各种库如pandas可以直接读取和写入Excel文件...

    python Excel解析源码

    Python中的Excel解析主要涉及到对Excel文件的读取、写入和操作。在Python中,有多个库可以实现这一功能,其中最常用的两个是`pandas`和`openpyxl`,但在这个特定的情况下,我们关注的是`xlsxwriter`模块。`...

Global site tag (gtag.js) - Google Analytics