`
scm002
  • 浏览: 316341 次
社区版块
存档分类
最新评论

python去除列表里的重复记录

 
阅读更多

python去除列表里的重复记录

方法1:将列表转换成字典,然后输出其keys
方法2:通过集合(sets)转换实现

 

#方法1:
>>> mylist = [3,5,8,5,3,12]
>>> print dict().fromkeys(mylist).keys()
[8, 3, 12, 5]
>>>
  
#方法2:
>>> mylist = [3,5,8,5,3,12]
>>> print list(set(mylist))
[8, 3, 12, 5]
>>>

 

Python 去除列表中重复的元素

 

比较容易记忆的是用内置的set

l1 = ['b','c','d','b','c','a','a']
l2 = list(set(l1))
print l2
 
还有一种据说速度更快的,没测试过两者的速度差别
l1 = ['b','c','d','b','c','a','a']
l2 = {}.fromkeys(l1).keys()
print l2
 
这两种都有个缺点,祛除重复元素后排序变了:
['a', 'c', 'b', 'd']
 
  
  
如果想要保持他们原来的排序:
 
用list类的sort方法
l1 = ['b','c','d','b','c','a','a']
l2 = list(set(l1))
l2.sort(key=l1.index)
print l2
也可以这样写
l1 = ['b','c','d','b','c','a','a']
l2 = sorted(set(l1),key=l1.index)
print l2
 
 
也可以用遍历
l1 = ['b','c','d','b','c','a','a']
l2 = []
for i in l1:
    if not i in l2:
        l2.append(i)
print l2
上面的代码也可以这样写
l1 = ['b','c','d','b','c','a','a']
l2 = []
[l2.append(i) for i in l1 if not i in l2]
print l2
 
 
这样就可以保证排序不变了:
['b', 'c', 'd', 'a']
分享到:
评论

相关推荐

    python去除文件中重复的行实例

    首先,去除文件中重复行的基本思想是在读取文件的每一行时,通过一个列表(res_list)来记录已经出现过的行。在读取每一行时,都会进行检查,判断该行是否已经存在于res_list中。如果不存在,就将该行添加到列表中,...

    python删除列表中重复记录的方法

    标题中提到的"python删除列表中重复记录的方法",实际上是指创建一个新的列表,该列表只包含原始列表中的不重复元素。这里介绍一个简洁且高效的实现方式,利用了Python的set(集合)特性和列表推导式: ```python ...

    Python实现去除列表中重复元素的方法总结【7种方法】

    `set`是Python中的一个无序不重复元素序列,将列表转换为`set`后再转换回列表即可去除重复元素。这种方法简单快捷,但会改变原列表的顺序。 ```python def func1(data_list): return list(set(data_list)) ``...

    文本文件去除重复记录

    最基础的去重方法是先对整个文本文件进行排序,然后通过比较相邻的行来找出并去除重复的记录。这个过程通常包括以下步骤: 1. 读取文件:逐行读取文本文件,将每一行作为一个元素存入列表或数组。 2. 排序:使用...

    过滤一些重复记录的方法

    1. **SQL查询**:在关系型数据库中,可以使用SQL的聚合函数`DISTINCT`来去除重复记录。例如,`SELECT DISTINCT 员工ID, 上班日期 FROM 考勤记录`会返回不重复的员工考勤组合。 2. **数据清洗工具**:许多数据清洗...

    Python3查找列表中重复元素的个数的3种方法详解

    这个方法首先将列表转换为集合(set),这样可以自动去除重复元素。然后遍历集合中的每个元素,利用`list.count()`函数计算该元素在原列表中出现的次数。这种方法简单直观,但当列表很大时,`count()`函数可能会有...

    Python库 | cosmicray-rocketchat-0.0.3.tar.gz

    这些库极大地提高了开发效率,减少了重复工作,是Python编程的重要组成部分。 在这个案例中,"cosmicray"库可能是一个专门为Rocket.Chat提供接口或工具的库,帮助开发者更轻松地与Rocket.Chat服务进行交互,例如...

    python列表练习-列表如何去重(不使用用set或者dict)(csdn)————程序.pdf

    在处理列表时,有时我们需要去除其中的重复元素。本篇将讨论一种不使用内置的set或dict数据结构来实现列表去重的方法。 标题提到的“python列表练习-列表如何去重(不使用set或者dict)”是一个编程练习,目的是锻炼...

    去除重复字符工具_字符_

    标题"去除重复字符工具_字符_"所暗示的是一款专门用于处理字符串中重复字符的工具。这款工具的主要功能是帮助用户快速有效地从输入的文字中去除重复的字符,使得输出的文本只包含唯一的字符。这一特性在很多情况下都...

    Python-python常用方法utils

    1. **字符串操作**:Python的字符串是不可变的,但提供了丰富的操作方法,如`len()`获取长度,`strip()`去除两端空白,`split()`按分隔符切片,`join()`将列表合并成字符串,`format()`格式化字符串等。 2. **列表...

    python函数学习记录1

    在Python编程语言中,函数是实现特定功能的代码块,可以重复使用,简化代码结构。在本篇"Python函数学习记录1"中,主要探讨了`strip()`函数以及与文件读写相关的操作。 首先,`strip()`函数是Python内建字符串方法...

    对比两个文件去掉另外一个的重复记录

    运行这个程序,根据提示输入两个待对比的文件路径,它应该能够自动执行去除重复记录的操作。使用这类第三方工具时,需注意文件安全性和程序的兼容性。 6. 性能优化:对于大文件,直接加载到内存可能会导致资源消耗...

    去除重复数据

    ### 去除重复数据 在数据分析领域,去除重复数据是一项基本且重要的任务。重复的数据不仅会占用不必要的存储空间,还可能导致分析结果失真。因此,有效地去除数据集中的重复记录是提高数据质量和准确性的关键步骤之...

    python去重,一个由dict组成的list的去重示例

    2. **去除重复:** 使用`drop_duplicates`方法基于`questions`列去除重复记录。 3. **返回结果:** 返回处理后的`items`列,即去重后的字典列表。 #### 方法二:使用Set和List 第二种方法是通过遍历列表并使用集合...

    Python点名器

    这可以通过跟踪上一次点到的名字来实现,或者使用`random.sample()`函数从列表中不重复地选取指定数量的元素。 考虑到程序的迭代更新,开发者可能会增加更多特性,比如声音播报、统计点名记录、设置点名规则(如按...

    python实现用户画像

    这可能涉及API接口的使用,以及数据清洗以去除无效或重复信息。 2. **特征工程**:通过统计分析和业务理解,提取有用的特征,如用户年龄、性别、消费频次、购物时间等。 3. **数据预处理**:对缺失值进行填充,...

    python数据分析参考案例

    我们需要使用Pandas库来检测并处理这些问题,例如用mean、median填充缺失值,删除异常值,以及利用drop_duplicates()去除重复记录。 其次,数据预处理是至关重要的,包括数据类型转换、标准化和归一化。例如,日期...

    python来分析一些财务报表数据

    例如,我们可以使用`df.drop_duplicates()`去除重复行,`df[df['销售额'] > 0]`筛选出销售额为正的记录。对于异常值,可能需要根据业务知识决定是剔除还是修正。 3. 数据分析: Python的NumPy提供了强大的统计功能...

    Python 进阶

    Python中的集合数据结构set是非常有用的,因为它提供了快速的成员检查功能以及自动去除重复元素的特性。而三元运算符是一种简洁的条件赋值语句,可以作为if-else语句的简写形式。 装饰器(decorators)是Python语言的...

Global site tag (gtag.js) - Google Analytics