首先提一点:大家遇到python模块的使用问题,尽可能去 python document去找答案。 但是关于weakref,官网上给的例子,并不能让我们理解这个弱引用。 于是在网上查了一些资料,也是比较模糊。 于是我还是从变量到垃圾回收再到若弱引用讲起这件事吧。因为他们是息息相关的,只有l理解了变量的引用和垃圾回收才会 更好的 理若引用的概念。 然后最后我再举2个例子,说明弱引用是怎么体现出来的。 变量是一个对象别名,可以理解成变量是贴在对象上的一个标签,所以当执行 my_list = [1,2,3,4] 其实就是在 [1,2,3,4]这个对象上贴了一个标签 my_list,我们可以通过这个标签来找到对象,进而可以操作对象。 那么我又执行: my_list2 = my_list 这个时候发生了什么呢,其实就是又给[1,2,3,4]这个对象添加了一个标签。当然,这种说法是只限于对可变对象的操作。我们可以参考下图:每个变量都有 标识 、类型 和 值。对象一旦创建,它的标识绝不会变;可以把标识理解为对象在内存中的地址。is 运算符比较两个对象的标识;id() 函数返回对象标识的整数表示。 因此当我们对上面执行 id(my_list1) 与 id(my_list) 他们返回的值是一样的,因为他们指向同一个对象,my_list与my_list1只是标签而已。 == 运算符比较两个对象的值(对象中保存的数据),而 is 比较对象的标识。 is 运算符比 == 速度快,因为它不能重载.接比较两个对象的 整数 ID。 a == b 是语法糖,等同于 a.__eq__(b)。 __eq__ 方法继承自 object, 比较两个对象的 ID,结果与 is 一样。但是多数内置类型使用更有意义的方式覆盖了 __eq__ 方法,会考虑对象属性的值。相等性测试可能涉及大量处理工作,例如,比较大型集合或嵌套层级深的结构时。 这里我们只讨论引用计数规则的垃圾回收机制 python中对象绝不会自行销毁;然而,无法得到对象时,可能会被当作垃圾回收。无法得到对象包括两种: ①没有人引用这个对象了,也就是说这个对象身上被贴的标签都没有了,这时候我们其实就找不到这个对象了; ②相互引用 del 语句删除名称(也就是我们说的标签),而不是对象。当我们把贴在对象身上的标签全部删除了,这时候python垃圾回收机制的引用计数(可以理解为贴标签计数)检测到引用此对象的次数为0,那么就触发了垃圾回收机制,销毁此对象。 因此del命令并不会删除对象,而是当del删除了对象的最后一个引用时,会触发垃圾回收机制,回收器将对象销毁。这个概念要搞清。(看例1的代码) 重新绑定也可能会导致对象的引用数量归零,导致对象被销毁。什么意思呢? 我们执行下面的代码: my_list = [1,2,3,4] my_list = [3,4,5,6] 这个时候,对象[1,2,3,4]就被销毁了,为什么? 因为my_list这个标签从对象[1,2,3,4]上被撕下来了,贴到了对象[3,4,5,6]上。这时候对象[1,2,3,4]的引用计数是不是就为0了,这时候就触发垃圾回收机制,将[1,2,3,4]这个对象给销毁了。 所以说,重新绑定也可能导致对象被销毁 (可以看例1的代码) # 代码示例1 >>> import weakref >>> s1 = {1,2,3} # 给对象{1,2,3}贴了一个标签s1 >>> def bye(): # 对象{1,2,3}被销毁时,调用这个函数 ... print("拜拜,你被销毁了") ... >>> ender = weakref.finalize(s1,bye) # 绑定回调函数 >>> ender.alive # 看对象{1,2,3}仍然存活 True >>> s1 = {4,5,6} # 当标签s1从{1,2,3}上撕下来,对象{1,2,3}被销毁了 拜拜,你被销毁了 >>> ender.alive False 如果两个对象相互引用(不懂相互引用的可以自行学习一下),当它们的引用只存在二者之间时,垃圾回收程序会判定它们都无法获取,进而把它们都销毁。 __del__ 特殊方法.不会销毁实例,不应该在代码中调用。即将销毁实例时,Python 解释器会调用 __del__ 方法,给实例最后的机会,释放外部资源。 参考标准库del特殊方法. 在 CPython 中,垃圾回收使用的主要算法是引用计数。 实际上,每个对象都会统计有多少引用指向自己. 当引用计数归零时,对象立即就被销毁:CPython 会在对象上调用 __del__ 方法(如果定义了),然后释放分配给对象的内存。 CPython 2.0 增加了分代垃圾回收算法,用于检测引用循环中涉及的对象组——如果一组对象之间全是相互引用,即使再出色的引用方式也会导致组中的对象不可获取。 Python 的其他实现有更复杂的垃圾回收程序,而且不依赖引用计数,这意味着,对象的引用数量为零时可能不会立即调用 del 方法。 # 代码示例2 # 使用 weakref.finalize 注册一个在销毁对象时调用的回调函数。 In [166]: import weakref In [167]: s1 = {1,2,3} In [168]: s2 = s1 # 指向同一个集合. In [169]: def bye(): # 回调函数一定不能是要销毁的对象的绑定方法(类方法),否则会有一个指向对象的引用。 ...: print("拜拜,你被销毁了") ...: In [170]: ender = weakref.finalize(s1,bye) # 注册回调, 并返回一个变量,判断是否销毁。 In [171]: ender.alive Out[171]: True In [172]: del s1 In [173]: ender.alive # 说明 del s1 是删除引用,而不是对象。 Out[173]: True In [174]: s2 = 'spam' # 重新绑定 s2 后,表示 {1,2,3} 无法获取 (引用计数为0),此时调用 bye 回调函数. 拜拜,你被销毁了 In [175]: ender.alive # ender 为 弱引用, 不在 计数 范围内. Out[175]: False 所以,每个引用就相当于一个标签,通过这个标签我们可以找到这个对象。一旦这些标签别撕没了,也就是对象的引用为0的时候,就出触发python的垃圾回收的机制。 这个时候可以引出我们心心念的弱引用了。 在上文,我们看到,当执行 my_list=[1,2,3,4]时,这时候就相当于给对象[1,2,3,4]加了一个强引用(标签)。再执行my_list1 = my_list时,那么对象[1,2,3,4]的强引用个数就变为了2,我们想要触发python的垃圾回收机制销毁对象[1,2,3,4]时,就必须把两个强引用my_list和my_list1都删除。 这时候,my_list2 = [1,2,3,4]这种方式,我不想使·my_list2·成为对象的强引用,那么我就可以把·my_list2·定义为一个弱引用,这时候,就当发生贴标签的操作时,就会是一个弱引用。而弱引用不会影响垃圾回收的计数。也就是说,一个对象,只要强引用个数为0,就会触发python的垃圾回收机制,而不管你有多少个弱引用,都是没关系的。 弱引用不会增加对象的引用数量。引用的目标对象称为 所指对象 (referent)。因此,弱引用不会妨碍所指对象被当作垃圾回收。 弱引用在缓存应用中很有用,因为不想仅因为被缓存引用着而始终保存缓存对象。 使用 weakref.ref 实例可以获取所指对象。如果对象存在,调用弱引用可以获取对象;否则返回 None 。 weakref.ref 类其实是低层接口,供高级用途使用,多数程序最好使用 weakref 工具集 和 finalize 。 weakref 工具集合: WeakKeyDictionary: WeakValueDictionary: 这是一种可变映射,里面的值是对象的弱引用。被引用的对象在程序中的其他地方被当作垃圾回收后,对应的键会自动从 WeakValueDictionary 中删除。因此,WeakValueDictionary 经常用于缓存。 WeakSet: 保存元素弱引用的集合类。元素没有强引用时,集合会把它删除。 finalize (内部使用弱引用) 如果一个类需要知道所有实例,一种好的方案是创建一个 WeakSet 类型的类属性,保存实例的引用。 如果使用常规的 set ,实例永远不会被垃圾回收,因为类中有实例的强引用,而类存在的时间与 Python 进程一样长,除非显式删除类。 弱引用局限: 基本的 list 和 dict 实例不能作为所指对象, 但是它们的子类可以作为弱引用所指对象. 基本的 int 、 list 、 tuple 、string 、dict 实例不能作为弱引用的目标。 但是 set 实例可以作为所指对象。 但是, str 、 dict 、list 的子类实例 和 用户自定义的类型实例 可以作为弱引用所指对象. 然而, int 、 tuple 的子类实例 也不能作为弱应用对象. 任何的数据结构都是可以弱引用的,我们要多利用weakref包中提供的工具类 # 前提: Python 控制台会自动把 _ 变量绑定到结果不为 None 的表达式结果上。 In [1]: import weakref In [2]: a_set = {0,1} In [3]: wref = weakref.ref(a_set) # 弱引用对象 wref In [4]: wref Out[4]: In [5]: wref() # 返回的是被引用的对象,{0, 1}。因为是控制台会话,所以 {0, 1} 会绑定给 _ 变量。 Out[5]: {0, 1} In [6]: a_set = {2, 3, 4} # a_set 不再指代 {0, 1} 集合,因此集合的引用数量减少了。但是 _ 变量仍然指代它。 In [7]: wref() Out[7]: {0, 1} In [8]: wref() is None # 计算这个表达式时,{0, 1} 存在,因此 wref() 不是 None。但是,随后 _ 绑定到结果值 False。现在 {0, 1} 没有强引用了。 Out[8]: False In [9]: wref() is None # 因为 {0, 1} 对象不存在了,所以 wref() 返回 None。 Out[9]: Ture WeakValueDictionary 示例: class Cheese: def __init__(self, kind): self.kind = kind def __repr__(self): return 'Cheese(%r)' % self.kind # 执行: In [2]: import weakref In [3]: stock = weakref.WeakValueDictionary() # 创建弱引用字典实例。 In [4]: catalog = [Cheese('Read Leicester'), Cheese('Tilsit'),Cheese('Brie'), Cheese('Parmesan')] In [6]: for cheese in catalog: ...: stock[cheese.kind] = cheese # 名称映射到实例. [弱引用] ...: In [7]: sorted(stock.keys()) Out[7]: ['Brie', 'Parmesan', 'Read Leicester', 'Tilsit'] In [8]: del catalog In [9]: sorted(stock.keys()) # 为什么还剩一个? 因为临时变量。 Out[9]: ['Parmesan'] In [10]: del cheese In [11]: sorted(stock.keys()) # 临时变量删除后,为空. Out[11]: [] 下面这个例子,是我自己编写的,大家要搞懂下面的这个例子,相信对弱引用,就有些理解了。 >>> import weakref >>> >>> class C: # 这里新建一个类,因为WeakValueDictionary() ... def __init__(self, value): # 要求value是一个obj ... self.value = value ... >>> def test_weak_value_dict(): ... d= weakref.WeakValueDictionary() ... k1 = 'test1' ... v1 = C(1) # 这时候C(1)是有一个强引用的:v1 ... d[k1] = v1 # 这个语句也就是字典赋值,但是由于我们用的 ... print(d[k1]) # WeakValueDictionary(),所以字典里的是弱引用 ... del v1 # 这时候删除了C(1)唯一的强引用 v1,因此 ... print(d[k1]) # WeakValueDictionary()里面 k1,v1 这个键值对消失了 ... >>> test_weak_value_dict() <__main__.C object at 0x000001793E545198> Traceback (most recent call last): File "", line 1, in File "", line 8, in test_weak_value_dict File "C:\Users\ASUS\Anaconda3\lib\weakref.py", line 137, in __getitem__ o = self.data[key]() KeyError: 'test1' >>> 我们如果使用dict代替WeakValueDictionary(),会发生什么呢? dict内部的引用都是强引用,因此我们删除了C(1)的强引用v1,还有dict里面对C(1)的强引用,因此c(1)不会被销毁 >>> import weakref >>> >>> class C: ... def __init__(self, value): ... self.value = value ... >>> def test_weak_value_dict(): ... d= dict() ... k1 = 'test1' ... v1 = C(1) ... d[k1] = v1 ... print(d[k1]) ... del v1 ... print(d[k1]) ... >>> test_weak_value_dict() <__main__.C object at 0x000001793E545390> <__main__.C object at 0x000001793E545390> 可以看到没有发生报错,就是因为dict里面的引用为强引用 再看下面一个例子,直接报错,搞明白原因了吗? >>> import weakref >>> >>> class C: ... def __init__(self, value): ... self.value = value ... >>> def test_weak_value_dict(): ... d= weakref.WeakValueDictionary() ... k1 = 'test1' ... d[k1] = C(1) ... print(d[k1]) ... >>> test_weak_value_dict() Traceback (most recent call last): File "", line 1, in File "", line 5, in test_weak_value_dict File "C:\Users\ASUS\Anaconda3\lib\weakref.py", line 137, in __getitem__ o = self.data[key]() KeyError: 'test1' 为什么报错:keyerror? 因为这条记录已经被删除了。为什么? 我们看对C(1)的引用有谁? 只有WeakValueDictionary()中的弱引用,根本没有强引用。 所以触发垃圾回收机制将C(1)销毁了,因此WeakValueDictionary()关于C(1)的记录也就删除了。 其实这两个只是使用上有稍微的区别,proxy()算是给用户提供一个更加简洁的接口,看下面的代码就懂了。 >>> >>> import weakref >>> class C: ... def __init__(self, value): ... self.value = value >>> c_obj = C(1) >>> ref = weakref.ref(c_obj) >>> ref() <__main__.C object at 0x000001793E5454A8> >>> ref().value 1 >>> >>> proxy = weakref.proxy(c_obj) >>> proxy >>> proxy.value 1 我们在使用weak.ref时,返回值ref,需要执行ref()才是弱引用的对象,ref() 相当于 c_obj 而weakref.proxy的返回值直接就是弱引用的对象,返回值proxy直接相当于c_obj