从输入url到显示页面发生了什么

当我们在浏览器的地址栏输入访问的 URL,然后回车,到浏览器显示对应的页面。这期间,到底发生了什么?

以下,我大概按如这几部分来探索关于浏览器是怎么呈现出我们想要的页面:

  • 输入 url
  • 解析域名
  • 建立连接
  • 发起请求
  • 响应请求
  • 渲染页面
  • 断开连接

输入 url

在一个网络中,不同计算机拥有的 ip 地址都是唯一的。提供网页的服务器也是一台计算机,所以同样拥有唯一的一个 ip。

比如百度的某一台服务器 ip 为 111.13.101.208,你完全可以通过 111.13.101.208:80 去访问百度的首页。但如果你还想访问腾讯、淘宝等其他网站呢?

显然以 ip 方式去访问一个网站是很费劲的。就像我们说天安门在哪的时候不会说天安门在经纬多少多少度一样,而是以人话说在北京哪哪哪。

所以,我们同样以别名的方式去记住每一个网站。而这就是 DNS 服务器干的活。

我们在浏览器输入的是一个,人能够轻松记住的域名网址。当我们回车的时候 DNS 服务器就会去找该域名网址在网络中对应的 ip 地址,称之为解析域名。

解析域名

一般来说,浏览器会先从本地的 hosts 文件中查找该域名对应的 ip 地址。

没有的话再从网络运营商的 DNS 服务器中请求解析,如果没有就再以递归的方式往下不断请求 DNS 解析。找到之后,再一层层返回到你的电脑。

建立连接

浏览器拿到 ip 地址之后,会以一个随机端口(1024-65535)向服务器 web 程序的 80/443 端口发起 TCP 连接请求,即所谓的三次握手,如下图所示:
PNG

发起请求

TCP 连接建立完成之后,浏览器就会向服务器发起 http request header 请求。

一般为 GET 和 POST 两种请求。

一个简单的 GET 请求的 request header 包含:

  • 请求行:HTTP/1.1 / GET
  • 请求头:’User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0’, …
  • 请求体:?key1=value1&key2=value2…

请求头和请求体的最后一行之间有两个 ‘\r\n’,用于告诉服务器没有其他请求头了。(POST 方式的请求信息一般不放在请求体,而是通过表单提交)

响应请求

服务器接收到浏览器的请求之后,根据其响应内容会给浏览器相应的响应,服务器的 HTTP 响应同样也分为,响应行、响应头、响应体。

渲染页面

浏览器拿到服务器返回的响应数据后,根据其内容在把它渲染出来。

断开连接

当我们在浏览器关闭正在访问的页面的时候,浏览器会发送断开连接的请求,及四次挥手过程,如下图所示:
PNG

以上基本就是一个简单的从输入 url 到浏览器显示最终页面,期间所发生的一些事。