Python 中的 `__dict__` 与 `__slots__` 深度解析
一、对象属性存储的本质Python 是一门动态语言每个对象的属性默认存储在一个字典中——这就是__dict__。这种设计赋予了 Python 极大的灵活性但也带来了内存和性能上的代价。__slots__则是 Python 提供的一种优化机制用固定的描述符替代字典存储。二、__dict__详解2.1 工作原理每个普通 Python 对象都拥有一个__dict__属性它是一个标准字典存储实例的所有属性classUser:def__init__(self,name,age):self.namename self.ageage uUser(Alice,30)print(u.__dict__)# {name: Alice, age: 30}属性的读写本质上是字典操作u.emailaliceexample.com# 等价于 u.__dict__[email] ...print(u.__dict__)# {name: Alice, age: 30, email: aliceexample.com}2.2 类的__dict__vs 实例的__dict__classAnimal:speciesUnknown# 类属性存储在 Animal.__dict__def__init__(self,name):self.namename# 实例属性存储在 self.__dict__aAnimal(Cat)print(Animal.__dict__)# mappingproxy({species: Unknown, __init__: function ..., ...})print(a.__dict__)# {name: Cat}类的__dict__是一个mappingproxy只读视图存储类方法、类属性和描述符实例的__dict__是普通dict。2.3 属性查找链MRO当访问obj.attr时Python 按如下顺序查找type(obj).__mro__中各类的__dict__里是否有数据描述符定义了__get__和__set__obj.__dict__中是否有该属性type(obj).__mro__中各类的__dict__里是否有非数据描述符或普通属性2.4 内存开销每个实例的__dict__是一个完整的dict对象。在 CPython 3.3 中引入了Key-Sharing DictionaryPEP 412优化同一类的实例如果在__init__中以相同顺序创建相同属性则共享 key 数组仅存储 values 数组。即便如此每个dict对象本身仍有 ~56 字节的固定开销CPython 3.11 64位加上哈希表预分配的容量。当你有百万级实例时这非常可观。三、__slots__详解3.1 基本用法classPoint:__slots__(x,y)def__init__(self,x,y):self.xx self.yy pPoint(1,2)print(p.x)# 1p.z3# AttributeError: Point object has no attribute zprint(hasattr(p,__dict__))# False定义__slots__后实例不再拥有__dict__属性以固定偏移量存储在对象结构体中不能动态添加未声明的属性3.2 底层实现当类定义了__slots__Python 为每个 slot 名称在类上创建一个member descriptor类似propertyprint(Point.x)# member x of Point objectsprint(type(Point.x))# class member_descriptor这些描述符直接通过 C 级别的固定偏移量tp_members读写对象内存无需哈希计算速度比字典查找更快。3.3 内存对比importsysclassDictPoint:def__init__(self,x,y):self.xx self.yyclassSlotPoint:__slots__(x,y)def__init__(self,x,y):self.xx self.yy dDictPoint(1,2)sSlotPoint(1,2)print(sys.getsizeof(d)sys.getsizeof(d.__dict__))# ~152 bytes (CPython 3.11)print(sys.getsizeof(s))# ~48 bytes节省约 60-70% 的内存。对于大规模数据对象如 ORM 行、科学计算粒子效果显著。3.4 性能优势属性访问基准测试CPython 3.11, 100M 次读取操作__dict____slots__提升读取属性~45ns~35ns~22%写入属性~55ns~40ns~27%提升幅度取决于 CPython 版本和内联缓存优化程度。在 3.12 的 specializing interpreter 下差距缩小但 slots 仍有优势。四、__slots__的继承规则4.1 父类无 slots子类有 slotsclassBase:pass# 有 __dict__classChild(Base):__slots__(x,)cChild()c.x1# 使用 slotc.y2# 仍然可以因为继承了 __dict__print(c.__dict__)# {y: 2}陷阱只要继承链中任何一个类没有__slots__实例就会有__dict__内存优化效果大打折扣。4.2 多层 slots 继承classA:__slots__(a,)classB(A):__slots__(b,)# 不要重复声明 abB()b.a1# 来自 A 的 slotb.b2# 来自 B 的 slot规则子类的__slots__只需声明新增的属性。重复声明会导致多个同名 descriptor虽然不报错但浪费内存。4.3 多重继承限制classX:__slots__(x,)classY:__slots__(y,)classZ(X,Y):# OK: 多个非空 slots 父类且无冲突的内存布局__slots__(z,)但如果多个父类定义了非空__slots__且存在非平凡的 C 级布局冲突会抛出TypeError。实践中的安全规则多重继承时最多一个父类有非空__slots__。五、__slots__与__dict__共存可以在__slots__中显式包含__dict__classHybrid:__slots__(x,__dict__)def__init__(self,x):self.xx# 走 slothHybrid(1)h.y2# 走 __dict__print(h.__dict__)# {y: 2}这样x享受 slot 的性能优势同时保留动态属性能力。适合核心属性固定但允许扩展的场景。六、__slots__与__weakref__默认情况下slots 类实例不支持弱引用importweakrefclassNoWeak:__slots__(x,)weakref.ref(NoWeak())# TypeError: cannot create weak referenceclassWithWeak:__slots__(x,__weakref__)weakref.ref(WithWeak())# OK如果需要弱引用支持必须在__slots__中包含__weakref__。七、实战场景与最佳实践7.1 何时使用__slots__场景推荐大量同质实例10k 对象✅ 强烈推荐数据传输对象DTO/VO✅ 推荐ORM 模型行⚠️ 视框架支持需要动态添加属性❌ 不适合需要__dict__做序列化⚠️ 需额外处理Mixin / 抽象基类❌ 通常不适合7.2 与 dataclasses 配合fromdataclassesimportdataclassdataclassclassVector3D:__slots__(x,y,z)x:floaty:floatz:floatPython 3.10 的dataclass支持slotsTrue参数自动处理dataclass(slotsTrue)classVector3D:x:floaty:floatz:float7.3 与 Pydantic 配合frompydanticimportBaseModelclassConfig(BaseModel):model_config{frozen:True}# Pydantic v2 内部使用 __slots__ 优化host:strport:intPydantic v2 的BaseModel已经在内部使用 slots 优化核心字段存储。7.4 序列化注意事项pickle默认依赖__dict__。对 slots 类需要实现__getstate__/__setstate__classSlotObj:__slots__(a,b)def__getstate__(self):return{slot:getattr(self,slot)forslotinself.__slots__ifhasattr(self,slot)}def__setstate__(self,state):forslot,valueinstate.items():setattr(self,slot,value)八、CPython 内部视角8.1 对象内存布局┌────────────────────────────────────┐ │ PyObject_HEAD (ob_refcnt, ob_type)│ 16 bytes ├────────────────────────────────────┤ │ __dict__ pointer │ 8 bytes (无 slots 时) │ __weakref__ pointer │ 8 bytes (无 slots 时) ├────────────────────────────────────┤ │ slot_0 (PyObject*) │ 8 bytes (有 slots 时) │ slot_1 (PyObject*) │ 8 bytes │ ... │ └────────────────────────────────────┘使用__slots__时属性直接作为PyObject*指针紧凑排列在对象体内消除了字典的哈希表、key 数组和间接寻址开销。8.2 Key-Sharing Dict (PEP 412)CPython 3.3 对同一类型的实例__dict__做了优化Instance A.__dict__ ──┐ Instance B.__dict__ ──┼──► Shared Keys Array: [name, age, email] Instance C.__dict__ ──┘ Values A: [ptr, ptr, ptr] Values B: [ptr, ptr, ptr] Values C: [ptr, ptr, ptr]这减少了内存使用但仍无法与__slots__的紧凑布局相比因为每个实例仍需一个dict对象头和 values 数组。九、常见陷阱9.1 默认可变值classWrong:__slots__(items,)items[]# 类属性会与 slot descriptor 冲突# 正确做法在 __init__ 中赋值classRight:__slots__(items,)def__init__(self):self.items[]9.2 忘记在子类重声明__slots__classParent:__slots__(x,)classChild(Parent):pass# 没有 __slots__Child 实例会获得 __dict__失去优化9.3 与元类/装饰器冲突某些框架的元类会操作__dict__使用__slots__时需验证兼容性。例如早期 SQLAlchemy 的 declarative base 与__slots__不兼容。十、总结对比特性__dict____slots__内存占用较高~104-152 bytes/实例较低~48-64 bytes/实例属性访问速度哈希查找固定偏移量动态添加属性✅❌除非包含__dict__弱引用支持✅ 默认需显式声明__weakref__继承复杂度低高需每层声明序列化兼容✅ 天然支持需额外实现适用场景通用、灵活大量实例、性能敏感核心原则__dict__是 Python 动态性的基石适合绝大多数场景__slots__是有针对性的优化手段在明确需要节省内存或提升属性访问性能时启用。不要过早优化——先 profile再决定是否引入__slots__。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2590951.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!