Go BIO/NIO探讨(1):Gin框架中如何处理HTTP请求
2023-1-7 22:4:56 Author: Go语言中文网(查看原文) 阅读量:24 收藏

最近看到字节跳动开源了Go语言的Hertz,声称使用了 Non-blocking IO 网络库 Netpoll,所以性能非常强大,并给出了Echo的性能测试数据。

相对于目前业界流行的 gin 框架,QPS提升超过100%,而且单次请求的数据包越大,性能提升越明显。

熟悉Java的朋友看到 NIO 这个词,应该会有莫名的亲切感。值得庆幸的是,现在终于有人用Go翻译一波netty了。

在这之前,为了更好地理解Blocking IO,我们从 Web 框架入手,看 Go 内置的 net/http 是如何工作的。

下面这段代码展示了Gin框架中如何定义一个路由,并启动Server。代码来自于 Github:gin-gonic/gin,我们从这段代码入手,了解 http 的运行机制。

package main

import (
"net/http"
"github.com/gin-gonic/gin"
)

func main() {
r := gin.Default()
r.GET("/ping", func(c *gin.Context) {
c.JSON(http.StatusOK, gin.H{
"message": "pong",
})
})
r.Run() // 监听8080端口
}

在这段代码中,r 是一个 *gin.Engine 对象,它实现了 net/http下的Handler 接口:

type Handler interface {
ServeHTTP(ResponseWriter, *Request)
}

第二步是设置路由和对应的处理函数,*gin.Engine 对象嵌入了 struct RouterGroup,实现路由功能。Web开发中,这是所有业务逻辑的入口。

第三步是运行服务,基本流程是三个tcp系统调用 socket, bind, listen,然后在 for 循环里调用 accept 接收新的tcp连接(更多细节参考Unix网络编程卷一第四章)。

// 来源于Go源码 net/http/server.go struct Server
func (srv *Server) ListenAndServe() error {
if srv.shuttingDown() {
return ErrServerClosed
}
addr := srv.Addr
if addr == "" {
addr = ":http"
}
ln, err := net.Listen("tcp", addr)
if err != nil {
return err
}
return srv.Serve(ln)
}

func (srv *Server) Serve(l net.Listener) error {
// ... 省略一部分代码

origListener := l
l = &onceCloseListener{Listener: l}
defer l.Close()

if err := srv.setupHTTP2_Serve(); err != nil {
return err
}

// ... 省略一部分代码

ctx := context.WithValue(baseCtx, ServerContextKey, srv)
for {
rw, err := l.Accept()
// ... 省略一部分代码
c := srv.newConn(rw)
c.setState(c.rwc, StateNew, runHooks) // before Serve can return
go c.serve(connCtx)
}
}

到这里,HTTP还没有登场,因为HTTP是应用层协议,而TCP是传输层协议。我们拿到 tcp connection 以后,HTTP协议体现在对数据包的处理上。

HTTP/1 仍然是一个超文本协议,HTTP/2 是一个基于帧的二进制协议,并且支持了server端主动推送。由于 HTTP/1 仍然是主流,我们这里先说 HTTP/1,它的报文分三部分:

  1. 起始行

  2. Headers 消息头,以一个空行结束

  3. Body 消息体

应用程序可以方便地解析HTTP 请求和响应。HTTP/1.1 已经支持复用TCP连接,也就是说多个HTTP请求可以在同一个tcp conn上传输,那么client端如何把request和response 对应起来呢?会有什么问题?HTTP/2中又是怎么做的?这里先挖个坑。

继续看 net/http 的代码,了解HTTP 如何在tcp conn之上工作的。主要逻辑如下:

// Serve a new connection.
func (c *conn) serve(ctx context.Context) {
c.remoteAddr = c.rwc.RemoteAddr().String()
ctx = context.WithValue(ctx, LocalAddrContextKey, c.rwc.LocalAddr())
var inFlightResponse *response
defer func() {... // cleanup

if tlsConn, ok := c.rwc.(*tls.Conn); ok {
// ... 省略部分代码
}

// HTTP/1.x from here on.
ctx, cancelCtx := context.WithCancel(ctx)
c.cancelCtx = cancelCtx
defer cancelCtx()

c.r = &connReader{conn: c}
c.bufr = newBufioReader(c.r)
c.bufw = newBufioWriterSize(checkConnErrorWriter{c}, 4<<10)

for {
w, err := c.readRequest(ctx)
// ... 省略部分代码
serverHandler{c.server}.ServeHTTP(w, w.req)
// ... 省略一部分代码
w.finishRequest()
// ... 省略一部分代码
}

这段代码的前半部分是设置cleanup逻辑、初始化conn相关的变量,后半部分是在 for 循环里处理 HTTP 请求,体现为:

  1. 读取 tcp conn上的数据,并解析&组装成一个请求,存储到一个http.response对象里;

  2. 通过 ServeHTTP 调用业务逻辑(路由转发到特定处理函数),获取响应;

  3. 把响应报文写入 tcp conn;

关于Gin框架和net/http 的逻辑到这里就介绍完了,大的流程参考下面这个思维导图 (点击原文查看链接):

当我们聊到 Blocking IO 和 Non-blocking IO,通常是指一个线程调用 read 或 write 时,是否被阻塞:

  • BIO: 线程被阻塞直到读到数据或写入完成;

  • NIO: 线程不被阻塞,可以去做其他事情,但是有数据到来或者写入完成时,线程会接收到通知;

这里我们限定到网络IO的情况,Go net/http 里BIO体现在两个地方:

  • case 1: listener 在for循环里等待接收新的tcp conn

  • case 2: conn 等待读取新的 request

// case 1
for {
rw, err := l.Accept()
// ... 省略一部分代码
c := srv.newConn(rw)
c.setState(c.rwc, StateNew, runHooks) // before Serve can return
go c.serve(connCtx)
}

// case 2
for {
w, err := c.readRequest(ctx)
// ... 省略部分代码
serverHandler{c.server}.ServeHTTP(w, w.req)
// ... 省略一部分代码
w.finishRequest()
// ... 省略一部分代码
}

如果把 goroutine 当成操作系统线程,我们可以把这种模式当作BIO。由于在网络IO上 Go语言对 goroutine 的特殊实现,在细节上可能会有点争议,有兴趣的同学可以自己研究下。

要做到 NIO,典型的方式是通过 reactor 模式,替换上面的两个for循环。在后面的文章中,我们介绍 hertz 框架的时候,会详细聊一下这个方案。


推荐阅读

福利
我为大家整理了一份从入门到进阶的Go学习资料礼包,包含学习建议:入门看什么,进阶看什么。关注公众号 「polarisxu」,回复 ebook 获取;还可以回复「进群」,和数万 Gopher 交流学习。


文章来源: http://mp.weixin.qq.com/s?__biz=MzAxMTA4Njc0OQ==&mid=2651453950&idx=1&sn=1cb70938803a6c23bdfc957a0e5ff385&chksm=80bb270cb7ccae1a8438bccf21a43ba500c70b482013b52597732f4ade9e66dd3c421cd5451b#rd
如有侵权请联系:admin#unsafe.sh