知识点涉及:
1,读取excel文档数据
2,数据编码格式处理
3,find与rfind函数区别
4,检索关键字符并截取
5,查找关键字符并替换
6,集合,差集
实现代码如下:
import xlrd l_p=[] l_q=[] l_q1=[] l_p1=[] #旧的一份文档 filenameold='Vaccine_patient.xlsx' #新的一份文档 filenamenew='vaccine-1.3.1.xlsx' date2=xlrd.open_workbook(filenameold) date1=xlrd.open_workbook(filenamenew) #根据标签名称找到目标页 sheet1=date2.sheet_by_name('Input') sheet2=date1.sheet_by_name('Sheet0') #定义文档中的数据行数 row_num1=sheet1.nrows row_num2=sheet2.nrows for i in range (1,row_num1): #读取指定位置数据内容,指定编码utf-8 value1=sheet1.cell_value(i,4).encode('utf-8') #定义temp标识,如果包含字符“?”,temp返回结果会大于-1,find函数用法自行百度,注意区别rfind与find的区别 temp=value1.find(b"?",0) if temp > -1: #如果包含“?”则截取找到的位置开始,到尾部截掉,解码成str tone=value1[0:temp].decode('ascii') #查找关键字符“/vaccine/api/”替换为空 value11=tone.replace('/vaccine/api/','') #格式化后的数据放入的l_p1集合中 l_p1.append(value11) else : value12=value1.decode('ascii').replace('/vaccine/api/','') l_p1.append(value12) for j in range (0,row_num2): value2=sheet2.cell_value(j,4).encode('utf-8') temp=value2.find(b"?",0) if temp >-1: tone2=value2[0:temp].decode('ascii') value22=tone2.replace('/api/','') l_q1.append(value22) else: value2=value2.decode('ascii').replace('/api/','') l_q1.append(value2) # rust=list(set(l_p).difference(set(l_q))) #拿l_q1去和l_p1去比较,得出差集,并打印出来 rust1=list(set(l_q1).difference(set(l_p1))) for ac in rust1: print(ac)
相关推荐
在Python编程中,处理XML和Excel文件是常见的任务,尤其在数据处理和分析领域。XML(eXtensible Markup Language)是一种结构化数据格式,常用于存储和交换数据,而Excel则是Microsoft Office套件中的一个应用程序,...
在这个项目中,"Excel实现Python数据分析项目数据和源码-用户价值.xlsx"文件很可能包含了原始数据集,可能包括用户ID、消费记录、活跃度等字段。你可以使用Excel进行初步的数据探索,如计算平均消费、用户活跃天数等...
本项目主要探讨如何利用Python来比较两个文件夹中的Excel文件内容,并记录下它们的差异。这在数据分析、审计或质量控制等场景中非常有用,能够帮助用户快速定位不同之处,提高工作效率。 首先,"compareExcelFile....
通过这种方式,我们能够利用Python和`openpyxl`库实现批量合并Excel文件,这对于处理大量数据和自动化工作流程非常有用。注意,这个例子假设所有Excel文件的结构相同,即所有工作表的列数和顺序都是一致的。如果存在...
在介绍Python实现Excel读写数据的知识点时,我们首先要明确Python与Excel数据处理之间的关系以及常用到的库。Python作为一门广泛用于数据分析、数据挖掘的语言,提供了多种库来帮助用户与Excel文件交互,其中最常用...
在处理分类变量时,`barplot`或`catplot`可以用来比较不同组间的差异。 在医疗数据分析中,我们还可以运用Python的其他库,如Scikit-learn进行机器学习,预测疾病发生、患者生存率等;或者使用Plotly和Bokeh进行...
在本项目中,我们将探讨如何使用Python来实现高校数据的可视化,从而深入理解我国高等教育的分布情况。数据可视化是将复杂的数据集转化为易理解和解读的图形或图像过程,它能够帮助我们快速洞察数据背后的模式、趋势...
《Excel多功能对比:PyQt+Python的高效解决方案》 Excel作为数据处理的常用工具,其功能强大,但在处理大量数据...对于需要处理大量Excel数据的用户,掌握这种工具的使用无疑会提升工作效率,实现数据管理的智能化。
在数据分析领域,Excel和Pandas都是广泛使用的工具,但它们在功能、性能和适用场景上存在显著差异。本文将深入探讨这两个工具在数据处理中的特点和优劣。 首先,Excel是一款由Microsoft开发的电子表格软件,它以...
易语言Excel数据对比修复程序源码是一个用于比较和修复Excel文件的应用程序,它可以帮助用户检查两个Excel文件之间的差异,并在发现问题后进行修复。这个程序源码对于那些需要处理大量Excel数据,尤其是数据一致性...
在Excel数据处理中,有时我们需要将多个工作簿或工作表中的数据合并到一起,特别是当这些数据有重叠部分时,我们希望保留相同部分而忽略差异。本教程将讲解如何使用编程方法,通过Python的pandas库来实现这一功能。...
在《Python数据可视化实战全书》的前8章中,它详细介绍了数据可视化的基础知识、常用工具以及Python中的实现方法。以下是本教程的主要知识点: 1. **数据与数据可视化**: - 数据是现实世界中信息的量化表示,可以...
2. **数据导入与处理**:Python中的Pandas库是处理数据的首选工具,它可以方便地读取各种格式的数据文件(如CSV、Excel等)。在本项目中,可能使用`pandas.read_csv()`函数将数据加载到DataFrame对象中,然后进行...
本项目旨在通过网络爬虫技术获取2018年全年北上广深的空气质量数据,并借助Python的绘图库对数据进行可视化处理,以便直观展示不同城市间的空气质量差异。 #### 设计任务内容 1. **网络爬虫**:网络爬虫是一种自动...
1. 数据处理:Python的pandas库是数据分析的强大工具,可以轻松读取、清洗、分析和操作各种格式的数据,如CSV、Excel、SQL数据库等。 2. 文件操作:Python的os、shutil和glob模块提供了丰富的文件和目录操作功能,...
描述中提到的“利用Python绘制不同区域的年尺度SPEI对比图”,暗示我们将重点放在数据的处理和可视化上,特别是使用Python的绘图库来展示多个地区SPEI12在年时间尺度上的差异和趋势。 标签“python”表明我们将使用...
在IT领域,将Excel数据导入SQL数据库是一种常见的数据迁移或整合操作。这通常涉及到数据清洗、格式转换以及数据传输的过程。下面将详细讲解这个过程的关键步骤、涉及的技术和可能遇到的问题。 首先,我们需要理解...
3. **编程语言与库**:实现Excel数据对比,通常会用到编程语言,如Python(pandas库)、Java(Apache POI库)或C#(Microsoft Office Interop库)。这些库能读取和操作Excel文件,便于进行数据处理和对比。 4. **...
如果是Python脚本,可能会使用`pandas.read_excel()`函数读取每个文件,然后使用`concat()`或`append()`函数将数据合并。 在实际开发中,需要注意数据的一致性和合并策略。例如,如果多个Excel文件有相同的列名,...
Python的开源工具PyLMDI是用于实现LMDI(Life Cycle Impact Assessment,生命周期影响评估)的一种强大且灵活的解决方案。LMDI是一种环境影响分解方法,它允许研究人员和分析师详细分析不同因素对产品或过程环境足迹...