老实说,单纯的研究语言细节,比较无趣且容易忘记。这次的研究,起源于一个业务场景的需求,跟着场景需求深入语言细节更容易理解和记忆。
我们有一个玩家的session字典集合,希望记录玩家的连接信息,大概伪代码是这样的:
# 创建玩家字典集合
player_session_dict = {}
# 设置玩家
player_session_dict["1000"]="playerA"
# 判断玩家连接
assert player_session_dict["1000"] == "playerA"
一般情况下使用 {} 没有问题 , 但是某些协议会把玩家的ID使用int型,获取session就报错了:
assert player_session_dict[1000] == "playerA" # error
要解决这个问题,希望实现一个数据结构来存储session,使用int/str均可以获取到玩家对应的session:
player_session_dict = SomeDict()
player_session_dict[1000]="playerA"
# 使用int作为key可以获取
assert player_session_dict[1000] == "playerA"
assert player_session_dict.get(1000) == "playerA"
# 使用string作为key也可以获取
assert player_session_dict["1000"] == "playerA"
assert player_session_dict.get("1000") == "playerA"
本文包括下面几个部分
首先从python的对象和字典入手,编写下面的测试用例:
>>> class A:
... pass
...
>>> a = A()
>>> class B(object):
... pass
...
>>> b = B()
>>> class C(dict):
... pass
...
>>> c = C()
A类是旧式写法,B类是新式写法,我习惯使用B类写法,感觉更明确
判断a,b,c三个对象的类型和继承关系:
>>> isinstance(a, object)
True
>>> isinstance(a, dict)
False
>>> isinstance(b, object)
True
>>> isinstance(b, dict)
False
>>> isinstance(c, object)
True
>>> isinstance(c, dict)
True
可以看到dict继承自对象object,这个符合常识。从源码 builtins.py
中也可以验证这一点:
class dict(object):
...
目前看来,我们的数据结构SomeDict即可以派生自object,也可以派生自dict。
并且通过测试可以发现,使用{}和dict()都是创建字典,使用上没有差异:
>>> a = {}
>>> b = dict()
>>> type(a)
<class 'dict'>
>>> type(b)
<class 'dict'>
>>> a == b
True
>>> a is b
False
内存占用也一样:
>>> import sys
>>>
>>> sys.getsizeof(a)
280
>>> b = dict()
>>> sys.getsizeof(b)
280
python中获取对象属性大概有下面几种方法:
.
点: 访问object的属性attribute,不存在会报AttributeError[]
方括号: 根据索引获取list/map对应的值,字典索引不存在会报KeyError(list索引不存在会报IndexError)get
get方法,同方括号,区别是索引不存在不会报错in
判断属性是否存在普通的对象可以使用 .
获取属性:
>>> class A(object):
... pass
...
>>> a = A()
>>> a.name = "aa"
>>> a.name
'aa'
同时普通类不可以使用 []
和 get
方法获取属性:
>>> a["name"]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'A' object does not support item assignment
>>> a.get("name")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'A' object has no attribute 'get'
>>> a
<__main__.A object at 0x10de4fad0>
普通的字典可以使用 []
获取属性:
>>> b = {}
>>> b["name"]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'name'
>>> b["name"] = "bb"
>>> b["name"]
'bb'
当属性不存在的时候会报KeyError的错误,可以使用get方法更安全,不存在的属性会返回none:
>>> b.get("age")
>>> print(b.get("age"))
None
也可以使用in对字典属性是否存在进行先行判断,确认存在后再进行获取:
>>> if "age" in b:
... print("age in b")
... print(b["age"])
...
普通的字典不可以使用 .
获取属性:
>>> b.name
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'dict' object has no attribute 'name'
如果一个类,派生自字典呢?先看代码:
>>> class C(dict):
... pass
...
>>>
>>> c = C()
>>> c.name = "cc"
>>> c.name
'cc'
>>> c["age"] = 10
>>> c["age"]
10
c对象即可使用.
获取属性, 也可以使用[]
获取属性,兼具object和dict的特性。但是需要注意的是不可以混搭使用:
>>> c["name"]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'name'
>>>
>>> c.age
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'B' object has no attribute 'age'
get
和in
的使用和[]
的表现一致:
>>> c.get("name")
>>> c.get("age")
10
>>> "name" in c
False
>>> "age" in c
True
查看get方法,可以找到相关定义:
class Mapping(_Collection[_KT], Generic[_KT, _VT_co]):
# TODO: We wish the key type could also be covariant, but that doesn't work,
# see discussion in https: //github.com/python/typing/pull/273.
@abstractmethod
def __getitem__(self, k: _KT) -> _VT_co:
...
# Mixin methods
@overload
def get(self, k: _KT) -> Optional[_VT_co]: ...
@overload
def get(self, k: _KT, default: Union[_VT_co, _T]) -> Union[_VT_co, _T]: ...
def items(self) -> AbstractSet[Tuple[_KT, _VT_co]]: ...
def keys(self) -> AbstractSet[_KT]: ...
def values(self) -> ValuesView[_VT_co]: ...
def __contains__(self, o: object) -> bool: ...
in 对应的就是 contains 方法。Mapping又mixin自Collection,所以也可以使用[]
要完全理解上面的c对象的使用差异,需要了解object的实现,其中主要就有 __dict__ 。先看代码:
>>> class C(dict):
... pass
...
>>> c = C()
>>> c.name = "cc"
>>>
>>> c["age"] = 10
>>>
>>> c
{'age': 10}
>>>
>>> c.__dict__
{'name': 'bb'}
可以看到c对象的表现分离出两个字典。一个是字典部分,从dict而来,可以使用 []
; 另一种是继承自对象的 __dict__, 可以使用 .
。
__dict__是自定义对象的隐藏属性,比如前面的a对象:
>>> a.__dict__
{'name': 'aa'}
甚至A类:
>>> A.__dict__
dict_proxy({'__dict__': <attribute '__dict__' of 'A' objects>, '__module__': '__main__', '__weakref__': <attribute '__weakref__' of 'A' objects>, '__doc__': None})
下面是官方文档中的相关解释:
自定义类(Custom classes):每个类都有通过一个字典对象实现的独立命名空间。类属性引用会被转化为在此字典中查找,例如 C.x 会被转化为 C.dict["x"]
类实例(Class instances): 每个类实例都有通过一个字典对象实现的独立命名空间,属性引用会首先在此字典中查找。当未在其中发现某个属性,而实例对应的类中有该属性时,会继续在类属性中查找。特殊属性: dict 为属性字典; class 为实例对应的类。
映射/字典(Mapping/Dictionary): 此类对象表示由任意索引集合所索引的对象的集合。通过下标 a[k] 可在映射 a 中选择索引为 k 的条目;这可以在表达式中使用,也可作为赋值或 del 语句的目标。内置函数 len() 可返回一个映射中的条目数。
这里的命名空间可以理解成作用域,比如:
name = "aaa"
def func():
name = "bbb"
pass
这里的name定义在不同的作用域可以是不同的值,global里是aaa,在func里是bbb。同样对于C对象的实例c1和c2,同样的属性名称name指向不同的 __dict__命名空间。
对于普通对象,我们可以这样定义和使用:
>>> class D(object):
... def __init__(self, name):
... self.name = name
...
>>>
>>> d = D("dd")
>>> d.name
'dd'
>>> d.__dict__
{'name': 'dd'}
定义了name,然后使用name,非常自然。但是也可以这样动态的赋值和使用age属性:
>>> d.age = 10
>>> d.age
10
>>> d.__dict__
{'name': 'dd', 'age': 10}
这样写的代码,就难以后期维护。可以使用__slots__来限制对象:
>>> class E(object):
... __slots__=("name")
... def __init__(self,name):
... self.name=name
...
>>> e = E("ee")
>>> e.name
'ee'
>>> e.age = 10
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'E' object has no attribute 'age'
slot是插槽的意思,E定义了一个叫name的插槽,这样只允许使用预先定义的name属性,其它属性会报错。使用slots后,对象的__dict__也被优化了:
>>> b.__dict__
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'B' object has no attribute '__dict__'
了解了上面这么多基础知识后,我们可以实现满足需求的SomeDict了。要表现的和 {}
一样,这样才不影响业务使用。
class SomeDict(dict):
def __getitem__(self, item):
# []
return super(SomeDict, self).__getitem__(str(item))
def __setitem__(self, key, value):
super(SomeDict, self).__setitem__(str(key), value)
def __delitem__(self, key):
super(SomeDict, self).__delitem__(str(key))
def get(self, item):
# get
return super(SomeDict, self).get(str(item))
def __contains__(self, item):
# in
return super(SomeDict, self).__contains__(str(item))
下面是测试用例:
def test_some_dict():
session_clients = SomeDict()
session_clients["1000"] = "1000"
assert session_clients["1000"] == "1000"
assert session_clients[1000] == "1000"
assert session_clients.get("1000") == "1000"
assert session_clients.get(1000) == "1000"
assert session_clients.get("non_key") is None
try:
session_clients["non_key"]
except KeyError as e:
pass
assert "1000" in session_clients
assert 1000 in session_clients
assert "non_key" not in session_clients
assert 10001 not in session_clients
del session_clients[1000]
assert 1000 not in session_clients
print("success")
我们深入了python语言的对象和字典的细节实现,比较了使用 . 和 [] 两种取值方式的差异,实现了一个仅字符串作为key的字典。简单总结起来就是:
关于字典还有下面2个性能优化的小技巧。
使用timeit测试一下使用 {} 和 dict() 创建对象的速度:
$ python3 -m timeit 'x={}'
20000000 loops, best of 5: 18.1 nsec per loop
$ python3 -m timeit 'x=dict()'
5000000 loops, best of 5: 93.6 nsec per loop
可以发现使用{}语法要快很多。我们编写下面测试用例:
a = {}
b = dict()
这是测试用例编译后的结果:
1 0 BUILD_MAP 0
2 STORE_NAME 0 (a)
3 4 LOAD_NAME 1 (dict)
6 CALL_FUNCTION 0
8 STORE_NAME 2 (b)
10 LOAD_CONST 0 (None)
12 RETURN_VALUE
可以看到前者就是一个BUILD_MAP语句,后者还包括调用构造函数等,所以前者要快,性能更好。
同样可以使用timeit对slot进行测试:
# python3 -m timeit -s 'class A(object):pass' -- "A()"
# 5000000 loops, best of 5: 67.2 nsec per loop
# python3 -m timeit -s 'class A(object): __slots__ = ("x",) ' -- "A()"
# 5000000 loops, best of 5: 63.1 nsec per loop
很容易发现使用slot后,创建对象速度也会变快。
本文由哈喽比特于3年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/9kvAyROnqDgQKCkMaBZHrg
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。