19.3.md 3.7 KB

版本 1 - 数据结构和前端界面

第 1 个版本的代码 goto_v1goto_v1

19.3 数据结构

(本节代码见 goto_v1/store.go。)

当程序运行在生产环境时,会收到很多短网址的请求,同时会有一些将长 URL 转换成端 URL 的请求。我们的程序要以什么样的结构存储这些数据呢?19.2 节中 (A) 和 (B) 两种 URL 都是字符串,此外,它们相互关联:给定键 (B) 能获取到值 (A),他们互相*映射*(map)。要将数据存储在内存中,我们需要这种结构,它们几乎存在于所有的编程语言中,只是名称有所不同,例如“哈希表”或“字典”等。

Go 语言就有这种内建的映射(map):map[string]string

键的类型写在 [] 之间,紧接着是值的类型。有关映射的所有知识详见 8 章。为特定类型指定一个别名在严谨的程序中非常实用。Go 语言中通过关键字 type 来定义,因此有定义:

type URLStore map[string]string

它从短 URL 映射到长 URL,两者都是字符串。

要创建那种类型的变量,并命名为 m,使用:

m := make(URLStore)

假设 http://goto/a 映射到 http://google.com/ ,我们要把它们存储到 m 中,可以用如下语句:

m["a"] = "http://google.com/"

(键只是 http://goto/ 的后缀,其前缀总是不变的。)

要获得给定 "a" 对应的长 URL,可以这么写:

url := m["a"]

此时 url 的值等于 http://google.com/

注意,使用了 := 就不需要指明 url 的类型为 string,编译器会从右侧的值中推断出来。

使程序线程安全

这里,变量 URLStore 是中心化的内存存储。当收到网络流量时,会有很多 Redirect 服务的请求。这些请求其实只涉及读操作:以给定的短 URL 作为键,返回对应的长 URL 的值。然而,对 Add 服务的请求则大不相同,它们会更改 URLStore,添加新的键值对。当在瞬间收到大量更新请求时,可能会产生如下问题:添加操作可能被另一个相同请求打断,写入的长 URL 结果可能不是最新的值;另外,读取和更改同时进行,导致可能读到脏数据。代码中的 map 并不保证当开始更新数据时,会彻底阻止另一个更新操作的启动。也就是说,map 不是线程安全的,goto 会并发地为很多请求提供服务。因此必须使 URLStore 是线程安全的,以便可以从不同的线程访问它。最简单和经典的方法是为其增加一个锁,它是 Go 标准库 sync 包中的 Mutex 类型,必须导入到我们的代码中(关于锁详见 9.3 节)。

现在,我们把 URLStore 类型的定义更改为一个结构体(就是字段的集合,类似 C 或 Java ,10 章 介绍了结构体),它含有两个字段:mapsync 包的 RWMutex

import "sync"
type URLStore struct {
	urls map[string]string		// map from short to long URLs
	mu sync.RWMutex
}

RWMutex 有两种锁:分别对应读和写。多个客户端可以同时设置读锁,但只有一个客户端可以设置写锁(以排除所有的读锁),有效地串行化变更,使他们按顺序生效。

我们将在 Get 函数中实现 Redirect 服务的读请求,在 Set 函数中实现 Add 服务的写请求。Get 函数类似下面这样:

func (s *URLStore) Get(key string) string {
	s.mu.RLock()
	url := s.urls[key]
	s.mu.RUnlock()
	return url
}

链接