• Go语言middleware:Web中间件

    本节将对现在流行的 Web 框架中的中间件 (middleware) 技术原理进行分析,并介绍如何使用中间件技术将业务和非业务代码功能进行解耦。

    为什么使用中间件

    先来看一段代码:

    // middleware/hello.go
    package main
    func hello(wr http.ResponseWriter, r *http.Request) {
        wr.Write([]byte("hello"))
    }
    func main() {
        http.HandleFunc("/", hello)
        err := http.ListenAndServe(":8080", nil)
        ...
    }

    这是一个典型的 Web 服务,挂载了一个简单的路由。我们的线上服务一般也是从这样简单的服务开始逐渐拓展开去的。

    现在突然来了一个新的需求,我们想要统计之前写的 hello 服务的处理耗时,需求很简单,我们对上面的程序进行少量修改:

    // middleware/hello_with_time_elapse.go
    var logger = log.New(os.Stdout, "", 0)
    func hello(wr http.ResponseWriter, r *http.Request) {
        timeStart := time.Now()
        wr.Write([]byte("hello"))
        timeElapsed := time.Since(timeStart)
        logger.Println(timeElapsed)
    }

    这样便可以在每次接收到 http 请求时,打印出当前请求所消耗的时间。

    完成了这个需求之后,我们继续进行业务开发,提供的 API 逐渐增加,现在我们的路由看起来是这个样子:

    // middleware/hello_with_more_routes.go
    // 省略了一些相同的代码
    package main
    func helloHandler(wr http.ResponseWriter, r *http.Request) {
        // ...
    }
    func showInfoHandler(wr http.ResponseWriter, r *http.Request) {
        // ...
    }
    func showEmailHandler(wr http.ResponseWriter, r *http.Request) {
        // ...
    }
    func showFriendsHandler(wr http.ResponseWriter, r *http.Request) {
        timeStart := time.Now()
        wr.Write([]byte("your friends is tom and alex"))
        timeElapsed := time.Since(timeStart)
        logger.Println(timeElapsed)
    }
    func main() {
        http.HandleFunc("/", helloHandler)
        http.HandleFunc("/info/show", showInfoHandler)
        http.HandleFunc("/email/show", showEmailHandler)
        http.HandleFunc("/friends/show", showFriendsHandler)
        // ...
    }

    每一个 handler 里都有之前提到的记录运行时间的代码,每次增加新的路由我们也同样需要把这些看起来长得差不多的代码拷贝到我们需要的地方去。因为代码不太多,所以实施起来也没有遇到什么大问题。

    渐渐的我们的系统增加到了 30 个路由和 handler 函数,每次增加新的 handler,我们的第一件工作就是把之前写的所有和业务逻辑无关的周边代码先拷贝过来。

    接下来系统安稳地运行了一段时间,突然有一天,老板找到你,我们最近找人新开发了监控系统,为了系统运行可以更加可控,需要把每个接口运行的耗时数据主动上报到我们的监控系统里。给监控系统起个名字吧,叫 metrics。现在需要修改代码并把耗时通过 HTTP Post 的方式发给 metrics 系统了。我们来修改一下 helloHandler():

    func helloHandler(wr http.ResponseWriter, r *http.Request) {
        timeStart := time.Now()
        wr.Write([]byte("hello"))
        timeElapsed := time.Since(timeStart)
        logger.Println(timeElapsed)
        // 新增耗时上报
        metrics.Upload("timeHandler", timeElapsed)
    }

    修改到这里,本能地发现我们的开发工作开始陷入了泥潭。无论未来对我们的这个 Web 系统有任何其它的非功能或统计需求,我们的修改必然牵一发而动全身。只要增加一个非常简单的非业务统计,我们就需要去几十个 handler 里增加这些业务无关的代码。虽然一开始我们似乎并没有做错,但是显然随着业务的发展,我们的行事方式让我们陷入了代码的泥潭。

    使用中间件剥离非业务逻辑

    我们来分析一下,一开始在哪里做错了呢?我们只是一步一步地满足需求,把我们需要的逻辑按照流程写下去呀?

    实际上,我们犯的最大的错误是把业务代码和非业务代码揉在了一起。对于大多数的场景来讲,非业务的需求都是在 http 请求处理前做一些事情,并且在响应完成之后做一些事情。我们有没有办法使用一些重构思路把这些公共的非业务功能代码剥离出去呢?

    回到刚开头的例子,我们需要给我们的 helloHandler() 增加超时时间统计,我们可以使用一种叫 function adapter 的方法来对 helloHandler() 进行包装:

    func hello(wr http.ResponseWriter, r *http.Request) {
        wr.Write([]byte("hello"))
    }
    func timeMiddleware(next http.Handler) http.Handler {
        return http.HandlerFunc(func(wr http.ResponseWriter, r *http.Request) {
            timeStart := time.Now()
            // next handler
            next.ServeHTTP(wr, r)
            timeElapsed := time.Since(timeStart)
            logger.Println(timeElapsed)
        })
    }
    func main() {
        http.Handle("/", timeMiddleware(http.HandlerFunc(hello)))
        err := http.ListenAndServe(":8080", nil)
        ...
    }

    这样就非常轻松地实现了业务与非业务之间的剥离,魔法就在于这个 timeMiddleware 。可以从代码中看到,我们的 timeMiddleware() 也是一个函数,其参数为 http.Handler,http.Handler 的定义在 net/http 包中:

    type Handler interface {
        ServeHTTP(ResponseWriter, *Request)
    }

    任何方法实现了 ServeHTTP ,即是一个合法的 http.Handler,读到这里大家可能会有一些混乱,我们先来梳理一下 http 库的 Handler,HandlerFunc 和 ServeHTTP 的关系:

    type Handler interface {
        ServeHTTP(ResponseWriter, *Request)
    }
    type HandlerFunc func(ResponseWriter, *Request)
    func (f HandlerFunc) ServeHTTP(w ResponseWriter, r *Request) {
        f(w, r)
    }

    实际上只要你的 handler 函数签名是:

    func (ResponseWriter, *Request)

    那么这个 handler 和 http.HandlerFunc() 就有了一致的函数签名,可以将该 handler() 函数进行类型转换,转为 http.HandlerFunc。

    而 http.HandlerFunc 实现了 http.Handler 这个接口。在 http 库需要调用的 handler 函数来处理 http 请求时,会调用 HandlerFunc() 的 ServeHTTP() 函数,可见一个请求的基本调用链是这样的:

    h = getHandler() => h.ServeHTTP(w, r) => h(w, r)

    上面提到的把自定义 handler 转换为 http.HandlerFunc() 这个过程是必须的,因为我们的 handler 没有直接实现 ServeHTTP 这个接口。上面的代码中我们看到的 HandleFunc( 注意 HandlerFunc 和 HandleFunc 的区别 ) 里也可以看到这个强制转换过程:

    func HandleFunc(pattern string, handler func(ResponseWriter, *Request)) {
        DefaultServeMux.HandleFunc(pattern, handler)
    }
    // 调用
    func (mux *ServeMux) HandleFunc(pattern string, handler func(ResponseWriter, *Request)) {
        mux.Handle(pattern, HandlerFunc(handler))
    }

    知道 handler 是怎么一回事,我们的中间件通过包装 handler,再返回一个新的 handler 就好理解了。

    总结一下,我们的中间件要做的事情就是通过一个或多个函数对 handler 进行包装,返回一个包括了各个中间件逻辑的函数链。我们把上面的包装再做得复杂一些:

    customizedHandler = logger(timeout(ratelimit(helloHandler)))

    这个函数链在执行过程中的上下文可以用下图来表示。

    请求处理过程
    图:请求处理过程

更多...

加载中...