Go-For Range 性能研究

文章转载地址:https://www.flysnow.org/2018/10/20/golang-for-range-slice-map.html

如果我们要遍历某个数组,Map 集合、Slice 切片等,Go 语言(Golang) 为我们提供了比较好的 For Range 方式。

range 是一个关键字, 表示范围,和 for 配合使用可以迭代 数组、Map、Slice等集合,用法比较简洁,那么,这种

迭代方式和 for i=0;i<N;i++ 对比,性能怎么样呢?下面通过 Go 的基准测试对比一下两者的性能

For-Range 的基本使用

for range 的使用非常简单,这里演示两种集合类型的使用

package main

import "fmt"

func main() {
        ages := []string{"10","20","30"}

        for i,age := range ages {
                fmt.Println(i,age)
        }
}

  这里是针对 Slice 切片的迭代使用,使用 range 关键字返回两个变量 i,age ,第一个是 Slice 切片的索引,第二个

是 Slice 切片的内容,打印结果如下:

0 10
1 20
2 30

  下面再看看 Map 的 for range 使用示例:

package main

import "fmt"

func main() {
        ages:=map[string]int{"张三":15,"李四":20,"王武":36}

        for name,age:=range ages{
                fmt.Println(name,age)
        }
}

  在使用for range迭代map的时候,返回的第一个变量是key,第二个变量是value,也就是我们例子中对应的name和ages

。我们运行程序看看输出结果:

张三 15
李四 20
王五 36

  常规 For 循环对比

比如对于 Slice 切片,我们有两种迭代方式:一种是常规的for i:=0;i<N;i++的方式;一种是for range的方式,如下示例:

package main_test

import "testing"

const N  = 1000

// 常规 for 迭代 slice
func ForSlice(s []string) {
        len := len(s)
        for i := 0; i < len; i++ {
                _, _ = i,s[i]
        }
}

// for range 迭代 slice
func RangeForSlice(s []string) {
        for i, v := range s {
                _, _ = i, v
        }
}

// 初始化 slice
func initSlice() []string{
        s := make([]string,N)

        for i := 0;i < N;i++ {
                s[i] = "www.flysnow.org"
        }
        return s
}

// 基准测试函数
func BenchmarkForSlice(b *testing.B) {
        s := initSlice()

        b.ResetTimer()
        for i := 0;i < b.N;i++ {
                ForSlice(s)
        }
}

func BenchmarkRangeForSlice(b *testing.B) {
        s := initSlice()

        b.ResetTimer()
        for i := 0;i < b.N;i++  {
                RangeForSlice(s)
        }
}

  输出结果如下:

goos: windows
goarch: amd64
BenchmarkForSlice-8              5000000               303 ns/op
BenchmarkRangeForSlice-8         3000000               512 ns/op
PASS
ok      _/E_/GoProject/development/src  4.692s

  从上面的输出结果可以看到,常规的 For 循环的性能更高。主要是因为 for range 是每次对循环元素的拷贝,而

for 循环,它获取集合内元素是通过 s[i],这种索引指针引用的方式,要比拷贝性能高得多

那么既然是元素拷贝的问题,我们在使用 range 方式迭代 slice 时候的目的也是为了获取元素,现在换一种方式实现 for range:

// for range 迭代 slice
func RangeForSlice(s []string) {
        for i, _ := range s {
                _, _ = i, s[i]
        }
}

  输出结果:

goos: windows
goarch: amd64
BenchmarkForSlice-8              5000000               303 ns/op
BenchmarkRangeForSlice-8         5000000               308 ns/op
PASS
ok      _/E_/GoProject/development/src  4.218s

  结果和常规的 for 循环一样。原因是我们通过 _ 舍弃了元素的复制,然后通过 s[i] 方式获取迭代的元素

Map 遍历

对于 map 来说,我们并不能使用 for i=0;i<N;i++ 的方式,大部分我们使用 for range 的方式:

package main_test

import (
        "fmt"
        "testing"
)

const N  = 1000

// for range For map
func RangeForMap1(m map[int]string) {
        for k, v := range m{
                _,_ = k,v
        }
}

// 初始化 map
func initMap() map[int]string  {
        m := make(map[int]string,N)

        for i := 0;i < N;i++ {
                m[i] = fmt.Sprint("www.flysnow.org",i)
        }

        return m
}

func BenchmarkRangeForMap1(b *testing.B) {
        m := initMap()

        b.ResetTimer()
        for i := 0; i < b.N; i++ {
                RangeForMap1(m)
        }
}

  运行结果如下:

goos: windows
goarch: amd64
BenchmarkRangeForMap1-8           100000             14535 ns/op
PASS
ok      _/E_/GoProject/development/src  2.333s

  相比较 slice,Map 遍历的性能更差。现在,我们使用上面优化遍历 slice 的方式优化遍历 map,减少值拷贝,如下示例:

func RangeForMap2(m map[int]string) {
        for k, _ := range m{
                _,_ = k,m[k]
        }
}

func BenchmarkRangeForMap2(b *testing.B) {
        m := initMap()

        b.ResetTimer()
        for i := 0; i < b.N; i++ {
                RangeForMap2(m)
        }
}

  运行结果如下:

goos: windows
goarch: amd64
BenchmarkRangeForMap1-8           100000             14290 ns/op
BenchmarkRangeForMap2-8           100000             22240 ns/op
PASS
ok      _/E_/GoProject/development/src  4.929s

  我们看到,优化后的结果性能明显下降了,这和我们上面测试 slice 不一样,这次没有提升反而下降了

For Range 原理

range for slice:

  // The loop we generate:
  //   len_temp := len(range)
  //   range_temp := range
  //   for index_temp = 0; index_temp < len_temp; index_temp++ {
  //           value_temp = range_temp[index_temp]
  //           index = index_temp
  //           value = value_temp
  //           original body
  //   }

  遍历 slice 前先是对要遍历的 slice 做一个拷贝,然后获取 slice 的长度作为循环次数,循环体中每次循环

会先获取元素值,我们还可以看到遍历过程中每次迭代都会对 index 和 value 进行赋值,如果数据量比较大或

者 value 为 string 时,对 value 的赋值操作可能是多余的,所以在上面我们使用 range 遍历 slice 的时候,可以

忽略 value,使用 slice[index] 的方式提升性能

range for map:

// The loop we generate:
  //   var hiter map_iteration_struct
  //   for mapiterinit(type, range, &hiter); hiter.key != nil; mapiternext(&hiter) {
  //           index_temp = *hiter.key
  //           value_temp = *hiter.val
  //           index = index_temp
  //           value = value_temp
  //           original body
  //   }

  看上面的实现方式,结合我们使用 for range slice 的 _ 优化方式,我们可以看到看似减少了一次赋值操作,但

是通过 key 查找 value 的性能消耗高于赋值消耗,这就是为什么优化没有起到作用