`

Python Collections

阅读更多
Collections

High-performance container datatypes

   * nametuple()
   * deque
   * Counter
   * OrderedDict
   * defaultdict

一、Counter

dict subclass for counting hash able objects


Python 2.7.2 (default, Jun 20 2012, 16:23:33)

[GCC 4.2.1 Compatible Apple Clang 4.0 (tags/Apple/clang-418.0.60)] on darwin

Type "help", "copyright", "credits" or "license" for more information.

>>> from collections import Counter

>>> cnt = Counter()

>>> dir(cnt)

['__add__', '__and__', '__class__', '__cmp__', '__contains__', '__delattr__', '__delitem__', '__dict__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__missing__', '__module__', '__ne__', '__new__', '__or__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__weakref__', 'clear', 'copy', 'elements', 'fromkeys', 'get', 'has_key', 'items', 'iteritems', 'iterkeys', 'itervalues', 'keys', 'most_common', 'pop', 'popitem', 'setdefault', 'subtract', 'update', 'values', 'viewitems', 'viewkeys', 'viewvalues']



>>> for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:

...     cnt[word] += 1

...

>>> cnt

Counter({'blue': 6, 'red': 4, 'green': 2})




1、elements
>>> list(cnt.elements())
['blue', 'blue', 'blue', 'blue', 'blue', 'blue', 'green', 'green', 'red', 'red', 'red', 'red']




2、most_common([n])
>>> cnt.most_common(3);
[('blue', 6), ('red', 4), ('green', 2)]



3、subtract

>>> cnt2=Counter(blue=1,red=2)
>>> cnt.subtract(cnt2)
>>> cnt
Counter({'blue': 5, 'green': 2, 'red': 2, 'orange': 1})




4、fromkeys

not implemented.



5、update

>>> cnt.update({'orange'})

>>> cnt

Counter({'blue': 6, 'red': 4, 'green': 2, 'orange': 1})






二、deque



>>> from collections import deque
>>> dir(deque)
['__class__', '__copy__', '__delattr__', '__delitem__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'appendleft', 'clear', 'count', 'extend', 'extendleft', 'maxlen', 'pop', 'popleft', 'remove', 'reverse', 'rotate']




1、append

2、appendleft(x)

3、clear

4、count(x)

5、extend(iterable)

6、extendleft(iterable)

7、pop()

8、popleft()

9、remove(value)

10、reverse()

11、rotate(n)

12、maxlen



三、defaultdict



dict's subclass

使用defaultdict方法可以轻松定义一个树的数据结构



from collections import defaultdict

import simplejson as json

def tree():

     return defaultdict(tree)



def dicts(t):

     return {k: dicts(t[k]) for k in t}  if isinstance(t, defaultdict) else t



users = tree()

users['good']['username']='eric'

users['bad']['username']='ricky'

print (json.dumps(users))

print dicts(users)




{"bad": {"username": "ricky"}, "good": {"username": "eric"}}

{'bad': {'username': 'ricky'}, 'good': {'username': 'eric'}}





四、namedtuple

from collections import named tuple

Point = namedtuple('Point','x y',verbose=True)

point = Point(1,2)

print point



class Point(tuple):
        'Point(x, y)'

        __slots__ = ()

        _fields = ('x', 'y')

        def __new__(_cls, x, y):

            'Create new instance of Point(x, y)'

            return _tuple.__new__(_cls, (x, y))

        @classmethod

        def _make(cls, iterable, new=tuple.__new__, len=len):

            'Make a new Point object from a sequence or iterable'

            result = new(cls, iterable)

            if len(result) != 2:

                raise TypeError('Expected 2 arguments, got %d' % len(result))

            return result

        def __repr__(self):

            'Return a nicely formatted representation string'

            return 'Point(x=%r, y=%r)' % self

        def _asdict(self):

            'Return a new OrderedDict which maps field names to their values'

            return OrderedDict(zip(self._fields, self))

        def _replace(_self, **kwds):

            'Return a new Point object replacing specified fields with new values'

            result = _self._make(map(kwds.pop, ('x', 'y'), _self))

            if kwds:

                raise ValueError('Got unexpected field names: %r' % kwds.keys())

            return result

        def __getnewargs__(self):

            'Return self as a plain tuple.  Used by copy and pickle.'

            return tuple(self)

        x = _property(_itemgetter(0), doc='Alias for field number 0')

        y = _property(_itemgetter(1), doc='Alias for field number 1')




五、OrderedDict

In [15]: from collections import OrderedDict


In [16]: d = {'banana': 3, 'apple':4, 'pear': 1, 'orange': 2}



In [17]: OrderedDict(sorted(d.items(), key=lambda t: t[0]))

Out[17]: OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])



In [18]: OrderedDict(sorted(d.items(), key=lambda t: t[1]))

Out[18]: OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('apple', 4)])



In [19]: OrderedDict(sorted(d.items(), key=lambda t: len(t[0])))

Out[19]: OrderedDict([('pear', 1), ('apple', 4), ('orange', 2), ('banana', 3)])







参考资料:

http://docs.python.org/2/library/collections.html
分享到:
评论

相关推荐

    Python collections——容器数据类型.7z

    在Python编程语言中,`collections`模块是标准库的一部分,它提供了一些高级的数据结构,这些数据结构被称为容器数据类型,因为它们可以存储多个元素。这个模块扩展了Python内置的序列和映射类型,为开发者提供了更...

    详细分析Python collections工具库

    Python的collections工具库是Python标准库中的一部分,它提供了一系列高效且功能丰富的数据结构,用于增强内置的容器数据类型。collections模块包含多个容器类,它们分别解决了不同的编程问题,使得处理数据更加方便...

    Python collections.defaultdict模块用法详解

    Python的`collections`模块是Python标准库中的一部分,它提供了许多有用的数据结构,如`defaultdict`。`defaultdict`是内置的`dict`类的一个子类,它扩展了字典的功能,允许我们在尝试访问不存在的键时提供一个...

    python内置模块collections知识点总结

    在Python编程语言中,`collections`模块是一个内置的集合模块,它提供了许多实用的集合类,以增强标准的序列和映射数据类型。本篇文章将深入探讨`collections`模块中的四个关键知识点:`namedtuple`、`deque`、`...

    Python collections模块使用方法详解

    Python的`collections`模块是标准库中的一部分,它提供了一些高级的数据结构,这些结构在处理特定数据模式时能显著提高代码的效率和可读性。接下来我们将深入探讨四个主要的`collections`模块功能:`namedtuple`、`...

    Python collections中的双向队列deque简单介绍详解

    在Python的标准库collections模块中,提供了一个非常实用的数据结构:deque,也就是双端队列。deque支持从两端快速添加和删除元素,相比于列表(list),在处理两端需要频繁增删元素的场景时,性能更为优越。 在...

    python collections模块的使用

    Python的`collections`模块是标准库中一个非常实用的部分,它提供了一系列高级数据结构,用于扩展Python的默认八大数据类型。这些数据结构在处理特定类型的数据时,能提供更高的效率和便利性。以下是对`collections`...

    Python collections模块的使用方法

    collections模块 这个模块实现了特定目标的容器,以提供Python标准内建容器 dict、list、set、tuple 的替代选择。 Counter:字典的子类,提供了可哈希对象的计数功能 defaultdict:字典的子类,提供了一个工厂函数...

    Python collections.deque双边队列原理详解

    在Python文档中搜索队列(queue)会发现,Python标准库中包含了四种队列,分别是queue.Queue / asyncio.Queue / multiprocessing.Queue / collections.deque。 collections.deque deque是双端队列(double-ended ...

    Python标准库之collections包的使用教程

    Python标准库中的collections模块是为了解决Python内置的四种基本数据结构(list、tuple、dict、set)在特定场景下的局限性而设计的。collections模块提供了多种高效且功能丰富的集合类,如defaultdict、namedtuple...

    Python中内建模块collections如何使用

    在Python编程中,内建模块`collections`是一个非常实用的模块,它提供了一系列高级的集合数据结构,可以极大地增强我们处理数据的能力。本篇文章将详细介绍`collections`模块中的几个关键类:`namedtuple`、`deque`...

    Python库 | ml_collections-0.1.0-py3-none-any.whl

    资源分类:Python库 所属语言:Python 资源全名:ml_collections-0.1.0-py3-none-any.whl 资源来源:官方 安装方法:https://lanzao.blog.csdn.net/article/details/101784059

    扩展的collections:额外的Python Collections-包(多集),setlist(唯一列表索引集),RangeMap和IndexedDict

    为了满足这些需求,Python社区开发了一些扩展的collections模块,例如`collections-extended`包。这个包包含了对Python标准collections模块的补充,提供了多集、setlist、RangeMap和IndexedDict等数据结构。接下来,...

    详解Python的collections模块中的deque双端队列结构

    deque 是 double-ended queue的缩写,类似于 list,不过提供了在两端插入和删除的操作。 appendleft 在列表左侧插入 popleft 弹出列表左侧的值 extendleft 在左侧扩展 例如: queue = deque() ...

    Python库 | dask_cuda-0.20.0a210421-py3-none-any.whl

    Dask的核心组件包括Dask Array、Dask DataFrame和Dask Bag,分别对应于NumPy数组、Pandas DataFrame和Python collections。 **2. CUDA编程** CUDA(Compute Unified Device Architecture)是NVIDIA推出的一种并行...

Global site tag (gtag.js) - Google Analytics