坚持思考,就会很酷
并发编程中,原子更新多个字段是常见的需求。
举个例子,有一个 struct Person
的结构体,里面有两个字段。我们先更新 Person.name
,再更新 Person.age
,这是两个步骤,但我们必须保证原子性。
有童鞋可能奇怪了,为什么要保证原子性?
我们以一个示例程序开端,公用内存简化成一个全局变量,开 10 个并发协程去更新。你猜最后的结果是啥?
package main
import (
"fmt"
"sync"
"time"
)
type Person struct {
name string
age int
}
// 全局变量(简单处理)
var p Person
func update(name string, age int) {
// 更新第一个字段
p.name = name
// 加点随机性
time.Sleep(time.Millisecond*200)
// 更新第二个字段
p.age = age
}
func main() {
wg := sync.WaitGroup{}
wg.Add(10)
// 10 个协程并发更新
for i := 0; i < 10; i++ {
name, age := fmt.Sprintf("nobody:%v", i), i
go func() {
defer wg.Done()
update(name, age)
}()
}
wg.Wait()
// 结果是啥?你能猜到吗?
fmt.Printf("p.name=%s\np.age=%v\n", p.name, p.age)
}
打印结果是啥?你能猜到吗?
可能是这样的:
p.name=nobody:2
p.age=3
也可能是:
p.name=nobody:8
p.age=7
按照排列组合来算,一共有 10*10 种结果。
那我们想要什么结果?我们想要 name 和 age 一定要是匹配的,不能牛头不对马嘴。换句话说,name 和 age 的更新一定要原子操作,不能出现未定义的状态。
我们想要的是 ( nobody:i,i ),正确的结果只能在以下预定的 10 种结果出现:
( nobody:0, 0 )
( nobody:1, 1 )
( nobody:2, 2 )
( nobody:3, 3 )
...
( nobody:9, 9 )
这仅仅是一个简单的示例,童鞋们思考下自己现实的需求,应该是非常常见的。
现在有两个问题:
第一个问题:这个 demo 观察下运行时间,用 time 来观察,时间大概是 200 ms 左右,为什么?
root@ubuntu:~/code/gopher/src/atomic_test# time ./atomic_test
p.name=nobody:8
p.age=7
real 0m0.203s
user 0m0.000s
sys 0m0.000s
如上就是 203 毫秒。划重点:这个时间大家请先记住了,对我们分析下面的例子有帮助。
这个 200 毫秒是因为奇伢在 update
函数中故意加入了一点点时延,这样可以让程序估计跑慢一点。
每个协程跑 update
的时候至少需要 200 毫秒,10 个协程并发跑,没有任何互斥,时间重叠,所以整个程序的时间也是差不都 200 毫秒左右。
第二个问题:怎么解决这个正确性的问题。
大概两个办法:
下面详细分析下异同和优劣。
在并发的上下文,用锁来互斥,这是最常见的思路。 锁能形成一个临界区,锁内的一系列操作任何时刻都只会有一个人更新,如此就能确保更新不会混乱,从而保证多步操作的原子性。
首先配合变量,对应一把互斥锁:
// 全局变量(简单处理)
var p Person
// 互斥锁,保护变量更新
var mu sync.Mutex
更新的逻辑在锁内:
func update(name string, age int) {
// 更新:加锁,逻辑串行化
mu.Lock()
defer mu.Unlock()
// 以下逻辑不变
}
大家按照上面的把程序改了之后,逻辑是不是就正确了。一定是 ( nobody:i,i )配套更新的。
但你注意到另一个可怕的问题吗?
程序运行变的好慢!!!!
同样用 time
命令统计下程序运行时间,竟然耗费 2 秒!!!,10 倍的时延增长,每次都是这样。
root@ubuntu:~/code/gopher/src/atomic_test# time ./atomic_test
p.name=nobody:8
p.age=8
real 0m2.017s
user 0m0.000s
sys 0m0.000s
不禁要问自己,为啥?
还记得上面我提到过,一个 update 固定要 200 毫秒。
加锁之后的 update
函数逻辑全部在锁内,10 个协程并发跑 update
函数,但由于锁的互斥性,抢锁不到就阻塞等待,保证 update
内部逻辑的串行化。
第 1 个协程加上锁了,后面 9 个都要等待,依次类推。最长的等待时间应该是 1.8 秒。
换句话说,程序串行执行了 10 次 update
函数,时间是累加的。程序 2 秒的运行时延就这样来的。
加锁不怕,抢锁等待才可怕。在大量并发的时候,由于锁的互斥特性,这里的性能可能堪忧。
还有就是抢锁失败的话,是要把调度权让出去的,直到下一次被唤醒。这里还增加了协程调度的开销,一来一回可能性能就更慢了下来。
思考:用锁之后正确性是保证了,某些场景性能可能堪忧。那咋吧?
在本次的例子,下一步的进化就是:原子化操作。
温馨提示:
怕童鞋误会,声明一下:锁不是不能用,是要区分场景,不分场景的性能优化措施是没有意义的哈。大部分的场景,用锁没啥问题。且锁是可以细化的,比如读锁和写锁,更新加写锁,只读操作加读锁。这样确实能带来较大的性能提升,特别是在写少读多的时候。
其实我们再深究下,这里本质上是想要保证更新 name 和 age 的原子性,要保证他们配套。其实可以先在局部环境设置好 Person 结构体,然后一把原子赋值给全局变量即可。Go 提供了 atomic.Value
这个类型。
怎么改造?
首先把并发更新的目标设置为 atomic.Value
类型:
// 全局变量(简单处理)
var p atomic.Value
然后 update
函数改造成先局部构造,再原子赋值的方式:
func update(name string, age int) {
lp := &Person{}
// 更新第一个字段
lp.name = name
// 加点随机性
time.Sleep(time.Millisecond * 200)
// 更新第二个字段
lp.age = age
// 原子设置到全局变量
p.Store(lp)
}
最后 main
函数读取全局变量打印的地方,需要使用原子 Load
方式:
// 结果是啥?你能猜到吗?
_p := p.Load().(*Person)
fmt.Printf("p.name=%s\np.age=%v\n", _p.name, _p.age)
这样就解决并发更新的正确性问题啦。感兴趣的童鞋可以运行下,结果都是正确的 ( nobody:i,i )。
下面再看一下程序的运行时间:
root@ubuntu:~/code/gopher/src/atomic_test# time ./atomic_test
p.name=nobody:7
p.age=7
real 0m0.202s
user 0m0.000s
sys 0m0.000s
竟然是 200 毫秒作用,比锁的实现时延少 10 倍,并且保证了正确性。
为什么会这样?
因为这 10 个协程还是并发的,没有类似于锁阻塞等待的操作,只有最后 p.Store(lp)
调用内才有做状态的同步,而这个时间微乎其微,所以 10 个协程的运行时间是重叠起来的,自然整个程序就只有 200 毫秒左右。
锁和原子变量都能保证正确的逻辑。在我们这个简要的场景里,我相信你已经感受到性能的差距了。
当然了,还是那句话,具体用那个实现要看具体场景,不能一概而论。而且,锁有自己无可替代的作用,它能保证多个步骤的原子性,而不仅仅是字段的赋值。
相信你已经非常好奇 atomic.Value
了,下面简要的分析下原理,是否真的很神秘呢?
原理可能要大跌眼镜。
趁现在我们还不懂内部原理,先思考个问题(不然待会一下子看懂了就没意思了)?
Value.Store
和 Value.Load
是用来赋值和取值的。我的问题是,这两个函数里面有没有用户数据拷贝?Store
和 Load
是否是保证了多字段拷贝的原子性?
提前透露下:并非如此。
1 atomic.Value 结构体atomic.Value
定义于文件 src/sync/atomic/value.go
,结构本身非常简单,就是一个空接口:
type Value struct {
v interface{}
}
在之前文章中,奇伢有分享过 Go 的空接口类型( interface {}
)在 Go 内部实现是一个叫做 eface
的结构体( src/runtime/iface.go
):
type eface struct {
_type *_type
data unsafe.Pointer
}
interface {}
是给程序猿用的,eface
是 Go 内部自己用的,位于不同层面的同一个东西,这个请先记住了,因为 atomic.Value
就利用了这个特性,在 value.go
定义了一个 ifaceWords
的结构体。
划重点:interface {}
,eface
,ifaceWords
这三个结构体内存布局完全一致,只是用的地方不同而已,本质无差别。这给类型的强制转化创造了前提。
2 Value.Store 方法看一下简要的代码,这是一个简单的 for 循环:
func (v *Value) Store(x interface{}) {
// 强制转化类型,转变成 ifaceWords (三种类型,相同的内存布局,这是前提)
vp := (*ifaceWords)(unsafe.Pointer(v))
xp := (*ifaceWords)(unsafe.Pointer(&x))
for {
// 获取数据类型
typ := LoadPointer(&vp.typ)
// 第一个判断:atomic.Value 初始的时候是 nil 值,那么就是走这里进去的;
if typ == nil {
runtime_procPin()
if !CompareAndSwapPointer(&vp.typ, nil, unsafe.Pointer(^uintptr(0))) {
runtime_procUnpin()
continue
}
// 初始赋值
StorePointer(&vp.data, xp.data)
StorePointer(&vp.typ, xp.typ)
runtime_procUnpin()
return
}
// 第二个判断:这个也是初始的时候,这是一个中间状态;
if uintptr(typ) == ^uintptr(0) {
continue
}
// 第三个判断:类型校验,通过这里就能看出来,Value 里面的类型不能变,否则会 panic;
if typ != xp.typ {
panic("sync/atomic: store of inconsistently typed value into Value")
}
// 划重点啦:只要过了初始化赋值阶段,基本上就是直接跑到这行代码啦
StorePointer(&vp.data, xp.data)
return
}
}
有几个点稍微解释下:
atomic.Value
使用 ^uintptr(0)
作为第一次存取的标志位,这个标识位是设置在 type 字段里,这是一个中间状态;CompareAndSwapPointer
来确保 ^uintptr(0)
只能被一个执行体抢到,其他没抢到的走 continue ,再循环一次;atomic.Value
第一次写入数据时,将当前协程设置为不可抢占,当存储完毕后,即可解除不可抢占;这里有没有大跌眼镜?
Store
内部并不是保证多字段的原子拷贝!!!!Store
里面处理的是个结构体指针。 只通过了 StorePointer
保证了指针的原子赋值操作。
我的天?是这样的吗?那何来的原子操作。
核心在于:**Value.Store()
的参数必须是个局部变量(或者说是一块全新的内存)。**
这里就回答了上面的问题:Store,Load 是否有数据拷贝?
划重点:没有!没动数据
原来你是这样子的 atomic.Value
!
回忆一下我上面的 update
函数,真的是局部变量,全新的内存块:
func update(name string, age int) {
// 注意哦,局部变量哦
lp := &Person{}
// 更新字段 。。。。
// 设置的是全新的内存地址给全局的 atomic.Value 变量
p.Store(lp)
}
又有个问题,你可能会想了,如果 p.Store( /* */ )
传入的不是指针,而是一个结构体呢?
事情会是这样的:
runtime.convT2E
函数把结构体赋值转化成 eface
(注意,这里会涉及到结构体数据的拷贝);Value.Store
方法,所以就 Store
方法而言,行为还是不变;再思考一个问题:既然是指针的操作,为什么还要有个 for 循环,还要有个 CompareAndSwapPointer
?
这是因为 ifaceWords
是两个字段的结构体,初始赋值的时候,要赋值类型和数据指针两部分。
atomic.Value
是服务所有类型,此类需求的,通用封装。
3 Value.Load 方法有写就有读嘛,看一下读的简要的实现:
func (v *Value) Load() (x interface{}) {
vp := (*ifaceWords)(unsafe.Pointer(v))
typ := LoadPointer(&vp.typ)
// 初始赋值还未完成
if typ == nil || uintptr(typ) == ^uintptr(0) {
return nil
}
// 划重点啦:只要过了初始化赋值阶段,原子读的时候基本上就直接跑到这行代码啦;
data := LoadPointer(&vp.data)
xp := (*ifaceWords)(unsafe.Pointer(&x))
// 赋值类型,和数据结构体的地址
xp.typ = typ
xp.data = data
return
}
哇,太简单了。处理做了一下初始赋值的判断(返回 nil ),后续基本就只靠 LoadPointer
函数来个原子读指针值而已。
interface {}
,eface
,ifaceWords
本质是一个东西,同一种内存的三种类型解释,用在不同层面和场景。它们可以通过强制类型转化进行切换;atomic.Value
使用 cas 操作只在初始赋值的时候,一旦赋值过,后续赋值的原子操作更简单,依赖于 StorePointer
,指针值得原子赋值;atomic.Value
的 Store
和 Load
方法都不涉及到数据拷贝,只涉及到指针操作;atomic.Value
的神奇的核心在于:每次 Store 的时候用的是全新的内存块 !!! 且 Load
和 Store
都是以完整结构体的地址进行操作,所以才有原子操作的效果。atomic.Value
实现多字段原子赋值的原理千万不要以为是并发操作同一块多字段内存,还能保证原子性;说实话,原理让我大跌眼镜,当然也让我们避免踩坑,就怕你以为 atomic.Value 是万能的, Store 进去了一个会并发操作的内存块,那就尴了个尬了。
本文由哈喽比特于3年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/M8SvYHccO3gI1ifYKGZDUA
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。