一文告诉你哪些map element类型支持就地更新

一文告诉你哪些map element类型支持就地更新
年初，我代表团队和人民邮电出版社签订了翻译《Go Fundamentals》[1]一书的合同，本月底便是四分之一进度的交稿时间点，近期闲时我们都在忙着做交叉review。上周末我review小伙伴翻译 2023-4-3 12:3:42 Author: Go语言中文网(查看原文) 阅读量:37 收藏

年初，我代表团队和人民邮电出版社签订了翻译《Go Fundamentals》^[1]一书的合同，本月底便是四分之一进度的交稿时间点，近期闲时我们都在忙着做交叉review。

上周末我review小伙伴翻译的有关map类型的章节时，看到了书中对map element就地更新的讲解。Mark Bates^[2]和Cory LaNou^[3]的这本书属于入门级Go语言书，只是举例说明了一些支持就地更新的map element类型以及不能就地更新的典型类型，但对不能更新的原因并未做深入说明。我觉得这个知识点不错，借这篇文章系统梳理一下。

一. 什么是map element的就地更新(in-place update)

我们知道Go中的map类型是一种无序的键值对集合，它的内部实现是基于哈希表的，支持高效地进行插入、查找和删除操作。map的key必须是可以进行相等比较的类型，比如整数、字符串、指针等，而element(也称为value)则可以是任意类型。并且，map是引用类型，它的零值为nil，使用前需要先使用内置函数make或map类型字面值进行空间分配。此外，在使用map时还需要注意并发安全问题，可以使用sync包提供的同步原语中来实现map的并发安全。

下面我们就来声明一个简单的map类型变量：

m := map[string]int

m是一个键为string类型、element为int类型的map。我们可以通过下面代码向map中插入一个键值对：

m["boy"] = 0

我们可以将其想象为一个统计班里男孩子数量的计数器：每数到一个男孩，我们就可以将其加1：

n := m["boy"]
n++
m["boy"] = n

你可以看到上述代码更新了键"boy"对应的element值(+1)。不过这种方法比较繁琐，要更新键"boy"对应的element值，我们还有下面这个更为简洁的方法：

m["boy"]++

我们看到和前面一种方法相比，这种方法没有引入额外的变量(比如前面的变量n)，而是直接在map element上进行了更新的操作，这种方法就称为map element的“就地更新”。

下面还有一些支持“就地更新”的map element类型的例子，比如：string、切片等：

m["boy"] += 1// element类型为string
m1 := map[int]string{
    1 : "hello",
    2 : "bye",
} // map[1:hello 2:bye]
m1[1] += ", world" // map[1:hello, world 2:bye]
// element类型为切片
m2 := map[string][]int{
 "k1": {1, 2},
 "k2": {3, 4},
} // map[k1:[1 2] k2:[3 4]]
m2["k1"][0] = 11 // map[k1:[11 2] k2:[3 4]]

不过并非所有类型都支持“就地更新”，比如下面的数组与结构体作为map element类型时就会导致编译错误：

m3 := map[int][10]int{
    1 : {1,2,3,4,5,6,7,8,9,10},
}
m3[1][0] = 11 // 编译错误：cannot assign to m3[1][0] (value of type int)type P struct {
    a int
    b float64
}
m4 := map[int]P {
    1 : {1, 3.14},
    2 : {2, 6.28},
}
m4[1].a = 11 // 编译错误：cannot assign to struct field m4[1].a in map

注：Go issue 3117^[5]一直跟踪着上述结构体类型作为map element时不能就地更新的问题。该issue并没有close，说明也许未来Go针对这样的行为的处理可能会发生变化。

那么为什么会这样呢？为什么同样作为map element，有的类型可以就地更新，有的类型就不支持呢？我们继续向下看。

二. element类型支持就地更新的本质

实际上，这种支持element类型就地更新其实是一种“语法糖”，比如我们以上面的m变量为例：

m := map[string]int{
 "boy" : 0,
}

当我们执行下面的就地更新语句时：

m["boy"]++

上面的语句就等价于：

a := m["boy"]
a++
m["boy"] = a

我们再来看下面element为字符串类型的例子：

m1 := map[int]string{
    1 : "hello",
    2 : "bye",
} m[1] += "world"

上述字符串连接语句等价于：

s := m[1]
s += "world"
m[1] = s

到这里小伙伴们可能会问：为什么Go不针对类型为struct和array的element提供这种语法糖呢？我们假设struct的字段更新也支持就地更新，那么会发生什么呢？

type P struct {
    a int
    b float64
}m4 := map[int]P {
    1 : {1, 3.14},
    2 : {2, 6.28},
}
m4[1].a = 11

上面的m4[1].a = 11将等价于如下代码：

t := &(m4[1])
t.a = 11

我们看到与element类型为int或string不同，由于要更新struct内部的字段，我们这次必须获取element的地址。一旦可以获取地址，问题就来了！这个地址是map在runtime层维护的内存地址，一旦暴露出来至少会有如下两个问题：

并发访问时会导致该element数据的竞争问题；
map自动扩容后，element地址会变更，通过上述代码获取的地址可能变为无效。

当然第二点更为重要，也正是因为这个原因，Go决定不支持对map的element取地址。

到这里有些小伙伴可能会问：针对struct和array类型的element，为什么不提供下面这样的“语法糖”呢？以struct为例：

m4[1].a = 11 <=>
t := m4[1]
t.a = 11
m4[1] = t

即将struct和array作为一个整体，从map中获取副本，然后在临时变量中更新后，再重新覆盖map中的element。

go为什么不提供这种“语法糖”呢？我猜是因为这么做的性能开销较大！struct可以聚合很多字段，array的size也可能很可观，这样的两次copy的开销可能是Go开发者比较顾忌的。

那么目前的替代方案是什么呢? 其实很简单，那就是element类型使用指针类型，比如下面element类型为结构体指针类型的代码：

type P struct {
    a int
    b float64
}m := map[int]*P{
    1: {1, 3.14},
    2: {2, 6.28},
}
fmt.Println(m[1]) // &{1 3.14}
m[1].a = 11
fmt.Println(m[1]) // &{11 3.14}

再比如element类型为数组指针类型的代码：

m1 := map[int]*[10]int{
    1: {1, 2, 3},
}
fmt.Println(m1[1]) // &[1 2 3 0 0 0 0 0 0 0]
m1[1][0] = 11
fmt.Println(m1[1]) // &[11 2 3 0 0 0 0 0 0 0]

对map element“就地更新”的限制也会影响到是否能调用element类型的相关方法，我们再来看下面例子：

type P struct {
    a int
    b float64
}func (P) normalFunc() {
}
func (p *P) updateInPlace(a int) {
    p.a = a
}
func main() {
    m1 := map[int]P{
        1: {1, 3.14},
        2: {2, 6.28},
    }
    m1[1].normalFunc()
    m1[1].updateInPlace(11) // 编译错误：cannot call pointer method updateInPlace on P
    m2 := map[int]*P{
        1: {1, 3.14},
        2: {2, 6.28},
    }
    fmt.Println(m2[1].a) // 1
    m2[1].normalFunc() 
    m2[1].updateInPlace(11)
    fmt.Println(m2[1].a) // 11
}

我们看到当element类型为P时，我们无法通过语法糖来调用会对结构体字段进行修改的updateInPlace方法，但可以调用normalFunc。而当element类型为P指针类型时，则无此限制。

那么，我们究竟如何判断哪些类型支持就地更新，哪些不支持呢？我们接下来就来说说。

三. element类型是否支持就地更新的判断方法

我们先来梳理一下Go的主要类型是否支持就地更新。

不涉及就地更新的类型

当element类型为布尔类型、函数类型时，我没找出针对这些map element就地更新的写法。

注：函数在Go中是一等公民。

Go原生的基本类型，比如整型、浮点型、complex类型、string类型等

当这些类型作为map element类型时，虽然它们保存在map数据结构管理的内存中，但根据前面的讲解，我们知道Go针对这些element type提供的“就地更新”语法实际上是一个语法糖，Go实际做的依然是整体替换：

// 整型 
m1 := map[int]int{
    1: 1,
}   
m1[1]++
fmt.Println(m1[1]) // 2// 浮点型
m3 := map[int]float64{
    1: 3.14,
}   
m3[1]++
fmt.Println(m3[1]) // 4.140000000000001
// complex类型
m4 := map[int]complex128{
    1: complex(2, 3), // 2+3i
}   
m4[1]++
fmt.Println(m4[1]) // 3+3i
// string类型
m5 := map[int]string{
    1: "hello",
}   
m5[1] += " world"
fmt.Println(m5[1]) // hello world

对于指针、map、channel等类型

通过前面的讲解，我们知道使用指针作为map element类型是支持就地更新的，这里就不重复举例了。

map类型自身在Go运行时表示中也是一个指针，它也是支持就地更新的：

m := map[int]map[int]string{
    1: {1: "hello"},
}
m[1][1] += " world"
fmt.Println(m[1][1]) // hello world

关于channel类型，如果将向channel写入数据当作“就地更新”的话，那么channel也勉强算是支持：

// channel
m1 := map[int]chan int{
    1: make(chan int),
}
go func() {
    m1[1] <- 11
}()fmt.Println(<-m1[1]) // 11

对于切片、接口类型

通过前面的讲解，我们知道使用切片作为map element类型是支持就地更新的，这里就不重复举例了。

而对于接口类型，我理解的就地更新场景有两种，一种是通过接口值调用动态类型的方法，一种则是通过type assert来修改某些值。下面这两个场景的示例代码：

type MyInterface interface {
    normalFunc()
    updateInPlace(a int)
}type P struct {
    a int
    b float64
}
func (P) normalFunc() {
}
func (p *P) updateInPlace(a int) {
    p.a = a
}
func main() {
    // interface
    m1 := map[int]MyInterface{
        1: &P{1, 3.14},
    }
    m1[1].updateInPlace(11) // 场景1：调用就地更新的方法
    p := m1[1].(*P)
    fmt.Println(p.a) // 11
    (m1[1].(*P)).a = 21     // 场景2：通过type assert设置值
    p = m1[1].(*P)
    fmt.Println(p.a) // 21
}

对于数组、struct类型

通过前面的讲解，我们知道使用数组和struct类型作为map element类型是不支持就地更新的，这里就不重复举例了。

通过对上面诸多类型的示例与理解，不知道你是否发现了支持“就地更新”的map element类型的一些共同特点。

除了语法糖之外（比如int、string、float64等），其余支持“就地更新”的map element类型(比如指针、切片、接口等)有一个共同的特点，那就是我们要就地更新的值对应的内存并不在map的管辖范围内。

以切片为例，如下图：

我们知道切片在运行时的表示为包含三个字段的结构体，因此map[int][]int实际上是一个map[int]SliceHeader。而这个map的element的就地修改：m[1][0] = 11实际上并未修改SliceHeader中的任何值，修改的是SliceHeader中data指针指向的切片底层数组的元素。

更多关于切片的基础知识与运行时表示原理，可以阅读极客专栏《Go语言第一课》的第15讲^[6]。

这就是为什么切片类型的map element支持就地修改的原因。由此来看指针、接口等类型，都是同样的道理，即element自身值并未有被修改，而是element指向的map结构之外的内存区域被修改了！

一句话：只要修改的位置不在map管辖的内存中，那这个map element类型就支持就地更新。

参考资料

[1]

《Go Fundamentals》: https://gopherguides.com/golang-fundamentals-book

[2]

Mark Bates: https://github.com/markbates

[3]

Cory LaNou: https://github.com/corylanou

[4]

《Go语言第一课》的第16讲: http://gk.link/a/10AVZ

[5]

Go issue 3117: https://github.com/golang/go/issues/3117

推荐阅读

Go语言爱好者周刊：第 183 期 —— Go1 正式发布 11 周年

福利

我为大家整理了一份从入门到进阶的Go学习资料礼包，包含学习建议：入门看什么，进阶看什么。关注公众号「polarisxu」，回复 ebook 获取；还可以回复「进群」，和数万 Gopher 交流学习。

文章来源: http://mp.weixin.qq.com/s?__biz=MzAxMTA4Njc0OQ==&mid=2651454231&idx=1&sn=0839d391e1dc8fd10f96315a24efebe8&chksm=80bb25e5b7ccacf38fc6b91cc5a9cea1fa6c7af05683ded44786ce2115cec824722aa7ca2212#rd
如有侵权请联系:admin#unsafe.sh