`
lin_llx
  • 浏览: 127266 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Python中globals对象的回收顺序分析

阅读更多

先提示,本文需要一定的python源码基础。许多内容请参考《python源码剖析》。下面切入正题。

 

今天在群里有人问了一个问题。形如如下的一段程序。

 

   
class person:
    sum = 0
    def __init__(self,name):
        self.name=name
        person.sum += 1

    def __del__(self):
        person.sum -= 1
        print "%s is leaving" % self.name

a = person('a')
a2 = person('a2')

 

这段程序的预期的执行结果应该是"a is leaving"和"a2 is leaving"。但是实际上却出乎意料之外,实际的执行结果如下:

 

a is leaving
Exception exceptions.AttributeError: "'NoneType' object has no attribute 'sum'" in 
<bound method person.__del__ of <__main__.person instance at 0x4a18f0>> ignored
 

为什么引用的名字不同造成的结果会有这么大的差别呢?

 

分析表面的原因,是person这个引用被指向了None。那他是不是真的是None呢?

 

    def __del__(self):
        print globals()['person'] #1
        person.sum -= 1
        #print "%s is leaving" % self.name

 

加入红色这行代码,看看是不是真的变成了None。运行结果如下:

 

__main__.person
None
Exception exceptions.AttributeError: "'NoneType' object has no attribute 'sum'"
 in <bound method person.__del__ of <__main__.person instance at 0x4a18c8>> ignored
 

看来是真的变成了None了。

 

初步分析原因,应该是程序在执行结束以后,python虚拟机清理环境的时候将"person"这个符号先于"a2"清理了,所以导致在a2的析构函数中无法找到"person"这个符号了。

 

但是转念一想还是不对,如果是"person"符号找不到了,应该是提示“name 'person' is not defined”才对。说明"person"这个符号还在,那"person"指向的class_object对象还在吗?改变程序为以下格式:

 

class person:
    sum = 0
    def __init__(self,name):
        self.name=name
        person.sum += 1

    def __del__(self):
        #person.sum -= 1
        self.__class__.sum -= 1 #1
        #print "%s is leaving" % self.name

a = person('a')
a2 = person('a2')
 

红色代码就是修改部分,利用自身的__class__来操作。运行结果一切正常。

 

说明python虚拟机在回收的过程中,只是将"person"这个符号设置成None了。这个结论同时带来2个问题:第一,为什么会设置成None?第二:为什么"person"会先于"a2"而晚于"a"被回收?

 

先来分析第二个问题。第一反应是不是按照字母的顺序来回收?但是马上这个结论被推翻。"a"和"a2"都在"person"的前面。那么难道是根据globals()这个字典的key顺序来回收?执行一下globals().keys()方法,得到以下结果:

 

['a', '__builtins__', '__file__', 'person', 'a2', '__name__', '__doc__'] 

 

看来的确是这样。

 

但是为什么是这样?要得出这个结论,看来只有去python源码中找答案了。

 

大家都知道,python代码在运行的时候,会存在一个frameobject对象来表示运行时的环境。类似于c语言的栈帧,也有点像lisp的函数的生存空间,看起来答案要从frameobject.c这个文件中去找了。

 

在frameobject.c中发现了一个函数:static void frame_dealloc(PyFrameObject *f)。看来解决问题的关键就在眼前。

 

在frame_dealloc里面截取了以下一段代码:

 

Py_XDECREF(f->f_back);
Py_DECREF(f->f_builtins);
Py_DECREF(f->f_globals);
Py_CLEAR(f->f_locals);
Py_CLEAR(f->f_trace);
Py_CLEAR(f->f_exc_type);
Py_CLEAR(f->f_exc_value);
Py_CLEAR(f->f_exc_traceback);
 

原来减少了引用啊。。关于Py_DECREF这个宏,python源码里面的解释是这样的:

 

The macros Py_INCREF(op) and Py_DECREF(op) are used to increment or decrement
reference counts. Py_DECREF calls the object's deallocator function when
the refcount falls to 0;

 

这么说来,我们就要去找f_globals的析构函数了。f_globals是个什么呢?当然是PyDictObject了。证据么遍地都是啊,比如随手找了一个,在PyFrameObject * PyFrame_New(PyThreadState *tstate, PyCodeObject *code, PyObject *globals,PyObject *locals)这个函数里面有一段代码:

 

#ifdef Py_DEBUG
	if (code == NULL || globals == NULL || !PyDict_Check(globals) ||
	    (locals != NULL && !PyMapping_Check(locals))) {
		PyErr_BadInternalCall();
		return NULL;
	}
#endif
 

PyDict_Check。。。检查是否是Dict对象。好吧,此处略过,直接奔向dictobject.c看看里面的代码。

 

static void
dict_dealloc(register dictobject *mp)
{
	register dictentry *ep;
	Py_ssize_t fill = mp->ma_fill;
 	PyObject_GC_UnTrack(mp);
	Py_TRASHCAN_SAFE_BEGIN(mp)
	for (ep = mp->ma_table; fill > 0; ep++) {
		if (ep->me_key) {
			--fill;
			Py_DECREF(ep->me_key);  #
			Py_XDECREF(ep->me_value); #仅仅只是引用计数减一
		}
	}
以下略
 

哈哈哈。还真是按照key的顺序来一个一个清除的。

 

不过,怎么又回到了Py_DECREF啊?

 

看来最终解释这个问题要回到GC上面了。

 

其实从这个地方也可以看出第一个问题的答案了,为什么是None?

 

从上面代码可以看出,dictobject对象在析构的时候,仅仅只是将value的引用计数减一,至于这个对象什么时候被真正回收,其实是由GC决定而不确定的。也就是说为什么是None,是因为减一了以后,凑巧GC到了而已。

 

根据Python本身的文档。

 

Python 写道
Warning: Due to the precarious circumstances under which __del__() methods are invoked, exceptions that occur during their execution are ignored, and a warning is printed to sys.stderr instead. Also, when __del__() is invoked in response to a module being deleted (e.g., when execution of the program is done), other globals referenced by the __del__() method may already have been deleted. For this reason, __del__() methods should do the absolute minimum needed to maintain external invariants. Starting with version 1.5, Python guarantees that globals whose name begins with a single underscore are deleted from their module before other globals are deleted; if no other references to such globals exist, this may help in assuring that imported modules are still available at the time when the __del__() method is called.
 

Python不能保证__del__被调用的时候所有的引用都有,所以,尽量不要overried类的__del__方法。

 

到此结束。

1
0
分享到:
评论
5 楼 lin_llx 2010-08-28  
恬淡田园 写道
把python类之外的代码写到一个函数里面,貌似也就能正常运行了

class person: 
    sum = 0 
    def __init__(self,name): 
        self.name=name 
        person.sum += 1 
 
    def __del__(self): 
        person.sum -= 1 
        print "%s is leaving" % self.name 
 
def main():
    a = person('a')
    a2 = person('a2')
   
if __name__ == "__main__":
    main()


因为分析了么。是globals析构的问题。写到main里面就不是globals析构了。。直接main退出以后就析构了。
4 楼 恬淡田园 2010-08-28  
把python类之外的代码写到一个函数里面,貌似也就能正常运行了

class person: 
    sum = 0 
    def __init__(self,name): 
        self.name=name 
        person.sum += 1 
 
    def __del__(self): 
        person.sum -= 1 
        print "%s is leaving" % self.name 
 
def main():
    a = person('a')
    a2 = person('a2')
   
if __name__ == "__main__":
    main()
3 楼 lin_llx 2010-08-26  
HyryStudio 写道
如果person类已经销毁了,为什么self.__class__.sum还能用?

person类除了person参照它之外,还有a.__class__和a2.__class__参照它。在person变量被清除时,不会销毁person类。


这是引用的删除和引用指向对象的删除的问题。需要分清楚“person”这个引用和“person”引用指向的对象。。

其实上文中两个都没有删除,只不过是两个之间的关系被消除了。真正涉及到两个什么时候被消除那就是GC的事情了。无法控制。
2 楼 zhengyun_ustc 2010-08-25  
将__del__函数加上几个打印,如下所示:
    def __del__(self):       
        print globals().keys()
        print person
        print self.name+':-----__del__ begin----'
        person.sum -= 1 
        print "%s is leaving" % self.name
        print globals().keys()
        print person
        print self.name+':-----__del__ end----'
就会看到,a析构函数执行完毕,person还是有值的:__main__.person。
但当执行到a2的析构函数时,
['a', '__builtins__', '__package__', 'person', 'a2', '__name__', '__doc__']
None
a2:-----__del__ begin----
Exception AttributeError: "'NoneType' object has no attribute 'sum'" in <bound m
ethod person.__del__ of <__main__.person instance at 0x01B4C8C8>> ignored
person已经为None了。
1 楼 HyryStudio 2010-08-25  
如果person类已经销毁了,为什么self.__class__.sum还能用?

person类除了person参照它之外,还有a.__class__和a2.__class__参照它。在person变量被清除时,不会销毁person类。

相关推荐

    python globals函数

    Python 的 `globals()` 函数是内置的一个特殊函数,它用于获取当前执行上下文中的全局变量。这个函数在编程中有着重要的作用,特别是在处理模块、函数和类定义时,需要访问和操作全局变量的情况下。 一、`globals()...

    Python中常用的模块用法分析.docx

    这篇文章主要讨论了Python中的一些常用内置模块及其用法,包括与操作系统交互的相关功能。 首先,Python的内置模块提供了许多方便的功能,无需import即可直接使用。例如,`help(obj)`函数是一个非常实用的工具,它...

    Python内置函数locals和globals对比

    Python中的内置函数locals()和globals()是用于访问和操作程序中的变量空间的两个关键工具,它们可以帮助我们理解和调试代码。接下来我们将深入探讨这两个函数的工作原理和差异。 首先,Python使用名字空间来管理...

    Python-V8Py使用V8引擎从JavaScript中调用PythonAPI

    在Python中,我们可以定义一个函数或类,然后使用V8Py暴露这些API给JavaScript。下面是一个简单的例子: ```python import v8py def python_function(name): return f"Hello, {name}!" context = v8py.Context()...

    Python中常用的模块用法分析[借鉴].pdf

    在Python编程语言中,内置模块和与操作系统交互的模块是两个非常重要的部分,它们极大地丰富了Python的功能。本文将深入探讨这两个方面的常用模块及其用法。 首先,让我们来看一下Python的内置模块。这些模块无需...

    Python源码剖析

    10. **垃圾回收**:Python的垃圾回收机制是自动的,通过追踪引用计数和循环引用检测来回收不再使用的对象。源码解析能揭示这一过程的细节。 11. **动态特性**:Python的动态特性,如动态类型、鸭子类型和元类,都是...

    Python 内置函数globals()和locals()对比详解

    总结来说,`globals()`和`locals()`是Python中用于获取和操作变量的强大工具。`globals()`允许读写全局变量,而`locals()`则主要用于读取局部变量,虽然在函数内部可以创建新的局部变量。了解它们的使用可以帮助...

    python二级考试试题2.doc

    选项 D 中的 "eval 函数的定义为:eval(source, globals=None, locals=None, /)" 是正确的,eval 函数的定义为:eval(source, globals=None, locals=None, /)。 Python 语言特点 在 Python 语言特点问题中,选项 A...

    Python基础教程之内置函数locals()和globals()用法分析

    本文实例讲述了Python基础教程之内置函数locals()和globals()用法。分享给大家供大家参考,具体如下: 1. 这两个函数主要提供,基于字典的访问局部变量和全局变量的方式。 python 使用叫做名字空间的东西来记录变量...

    Python-pprofilematplotlib对Python程序进行分析形成一张热图

    `matplotlib` 是Python中最常用的绘图库之一,它提供了丰富的图形绘制功能,包括二维图表、直方图、散点图等。在本例中,`matplotlib` 被用于将`pprofile`的分析结果可视化,生成热图,直观地展示出各个函数的调用...

    Python2理论题库题库(363道).docx

    6. 析构函数:在Python中,`__del__`方法用于清理类的资源,当对象被垃圾回收时调用。正确答案是B。 7. 字典方法:`keys()`方法返回字典的键列表,`values()`返回值列表,`locals()`和`globals()`则与作用域有关,...

    Python中动态创建类实例的方法

    ### Python中动态创建类实例的方法 #### 背景与目的 在开发过程中,有时候我们需要在运行时根据类名来创建对应的对象实例。这种需求在Java中通常通过反射机制实现。而对于Python这样的动态语言,虽然没有传统的反射...

    Python 3 Reference Card (Python3语法快速查询卡片)

    在Python中,标识符是变量、函数、类、模块等的名称,由字母、数字和下划线组成,但不能以数字开头,推荐使用小写字母。变量赋值使用等号“=”操作符,并且支持链式赋值、序列解包赋值以及增量赋值等高级特性。 ...

    123_python_源码

    在Python中,调用C函数通常有两种主要方式: 1. **Cython**: Cython是一种Python的编译器,它能够将Python代码转换为接近C的语法,然后编译成C扩展模块。这使得Python可以更高效地调用C代码,减少运行时的性能损失。...

    python2.6库函数参考手册

    **内置常量**是Python中预定义的一些特殊值,这些值不能被重新赋值。 - **False**: 布尔假值。 - **None**: 表示没有值或者空值。 - **True**: 布尔真值。 - **__debug__**: 如果被定义,则表示调试模式开启。 - **...

    Python实训题目.pdf

    print() 函数是 Python 中最基本的输出函数,用于将对象输出到屏幕上。其基本语法为:print(*objects, sep=' ', end='\n', file=sys.stdout, flush=False)。其中,objects 是要输出的对象,sep 是分隔符,默认为空格...

    Python两个内置函数 locals 和globals(学习笔记)

    Python中的`locals()`和`globals()`是两个内置的函数,它们提供了访问当前作用域和全局作用域变量的能力。这两个函数返回的都是字典,其中包含了当前作用域内所有变量的名称及其对应的值。 首先,我们要了解Python...

Global site tag (gtag.js) - Google Analytics