浏览器的进程模型
何为进程
程序运行需要有它自己专属的内存空间,可以把这块内存空间简单的理解为进程
- 每一个应用至少有一个进程, 进程之间互相独立, 即使通信, 也需要双方同意
何为线程
有了进程后,就可以运行程序的代码了。运行代码的「人」称之为「线程」。
一个进程至少有一个线程,所以在进程开启后会自动创建一个线程来运行代码,该线程称之为主线程
如果程序需要同时执行多块代码,主线程就会启动更多的线程来执行代码,所以一个进程中可以包含多个线程。
浏览器的进程和线程
浏览器是一个多进程多线程的应用程序
浏览器内部工作极其复杂。为了避免相互影响,为了减少连环崩溃的几率,当启动浏览器后,它会自动启动多个进程。
可以在浏览器的任务管理器中查看当前的所有进程,
其中, 主要的进程有:
- 浏览器进程
主要负责界面显示, 用户交互, 子进程管理等. 浏览器进程内部会启动多个线程处理不同的任务
- 网络进程
负责加载网络资源. 网络进程内部会启动多个线程来处理不同的网络任务
- 渲染进程(本节重点)
渲染进程启动后, 会开启一个渲染主线程, 主线程负责执行 HTML, CSS, JS代码
默认情况下, 浏览器会为每个标签页开启一个新的渲染进行, 以保证不同的标签页之间互不影响
渲染主线程是如何工作的
渲染主线程是浏览器中最繁忙的线程,需要它处理的任务包括但不限于
- 解析 HTML
- 解析 CSS
- 计算样式
- 布局
- 处理图层
- 每秒把页面画 60 次
- 执行全局 JS 代码
- 执行事件处理函数
- 执行计时器的回调函数
- ... ...
思考题: 为什么渲染进程不适用多个线程来处理这些事情?
- 浏览器渲染线程采用单线程设计的主要原因涉及**安全性**、**简化复杂性**和**保持一致性**。以下是具体解释
- 避免多线程并发操作的复杂性:
- DOM 的不可并行性: DOM(文档对象模型)是网页结构的核心表示,如果允许多个线程同时修改 DOM(例如一个线程删除元素,另一个线程修改其样式),会导致竞态条件(Race Conditions),需要复杂的锁机制来协调,增加实现难度和性能开销。
- 渲染流程的依赖性: 渲染过程是分阶段的(如布局计算、绘制、合成),后续阶段依赖前阶段的完成。多线程并行处理可能破坏这种依赖关系,导致染错误(如布局未完成就尝试绘制)。
- 保证渲染结果的一致性:
- 用户交互与视觉反馈: 浏览器需要快速响应用户操作(如滚动、点击),单线程能确保事件按顺序处理,避免多线程同时更新界面导致的视觉撕裂或状态不一致(例如动
- CSS 和 JavaScript 的联动: JavaScript 可能读取或修改 CSS 属性(如`element.sty画卡顿或元素位置错乱)。e.width”),而 CSSOM(CSS 对象模型)的更新也雲要与 DOM 操作同步。单线程能保证这些操作按预期顺序执行。
- 历史与兼容性:
- JavaScript 的单线程传统: JavaScript 最初设计为单线程语言(如事件循环模型)与浏览器渲染紧密耦合。即使现代浏览器引入了 Web Worker 多线程技术,Worker 线程也无法直接操作 DOM,主线程仍负责协调所有渲染任务。
- 现有生态的依赖: 大量网页代码假设渲染是单线程的,强行改为多线程可能导致旧网站行为异常。
- 性能权衡
- 单线程的轻量性: 虽然多线程可能利用多核 CPU,但线程间通信(如共享数据同步)的开销可能抵消性能收益。单线程结合*异步非阻塞**模式(如 requestAnimationFrame、事件循环)已能高效处理大多数场景
- 分阶段优化: 浏览器通过将渲染流程分解为异步任务(如样式计算、布局、分层、绘制、合成),并利用 GPU 加速部分任务(如合成层),间接实现了“并行化”效果,而无需多线程渲染。
要处理这么多的任务,主线程遇到了一个前所未有的难题: 如何调度任务?
比如:
- 我正在执行一个 JS 函数,执行到一半的时候用户点击了按钮,我该立即去执行点击事件的处理函数吗?
- 我正在执行一个 JS 函数,执行到一半的时候某个计时器到达了时间,我该立即去执行它的回调吗?
- 浏览器进程通知我“用户点击了按钮”,与此同时,某个计时器也到达了时间,我应该处理哪一个呢?
- ... ...
渲染主线程想出了一个绝妙的主意来处理这个问题: 排队
- 最开始的时候, 渲染主线程会进入一个无限循环
- 每一次循环会检查消息队列中是否有任务存在. 如果有, 就取出第一个任务执行, 执行完一个后进入下一次循环; 如果没有, 则进入休眠状态
- 其他所有线程(包括其他进程的线程)可以随时向消息队列添加任务。新任务会加到消息队列的未尾。在添加新任务时,如果主线程是休眠状态,则会将其唤醒以继续循环拿取任务
这样一来,就可以让每个任务有条不紊的、持续的进行下去了。整个过程,被称之为事件循环(消息循环)
若干解释
何为异步
代码在执行过程中,会遇到一些无法立即处理的任务,比如:
- 计时完成后需要执行的任务 -- setTimeout、setInterval
- 网络通信完成后需要执行的任务 -- XHR、Fetch
- 用户操作后需要执行的任务 -- addEventListener
如果让渲染主线程等待这些任务的时机达到,就会导致主线程长期处于「阻塞」的状态,从而导致浏览器「卡死」
渲染主线程承担着极其重要的工作,无论如何都不能阻塞!
因此,浏览器选择导步来解决这个问题
使用异步的方式,渲染主线程永不阻塞
面试题: 如何理解 JS 的异步?
参考答案:
- JS是一门单线程的语言,这是因为它运行在浏览器的渲染主线程中,而渲染主线程只有一个。
- 而渲染主线程承担着诸多的工作,渲染页面、执行 JS 都在其中运行。
- 如果使用同步的方式,就极有可能导致主线程产生阻塞,从而导致消息队列中的很多其他任务无法得到执行。
- 这样一来,一方面会导致繁忙的主线程白白的消耗时间,另一方面导致页面无法及时更新,给用户造成卡死现象。
- 所以浏览器采用异步的方式来避免。具体做法是当某些任务发生时,比如计时器、网络、事件监听,主线程将任务交给其他线程去处理,自身立即结束任务的执行,转而执行后续代码。当其他线程完成时,将事先传递的回调函数包装成任务,加入到消息队列的末尾排队,等待主线程调度执行,在这种异步模式下,浏览器永不阻塞,从而最大限度的保证了单线程的流畅运行。
JS为什么会阻碍渲染
先看代码
执行代码, 点击按钮, 页面卡顿3秒后, 页面内容修改为"我是赵本山"
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Document</title>
</head>
<body>
<h1>猜猜我是谁</h1>
<button>查看答案</button>
</body>
<script>
let h1 = document.querySelector('h1');
let btn = document.querySelector('button');
function delay(duration) {
let start = Date.now();
while (Date.now() - start < duration) {
}
}
btn.onclick = function () {
h1.innerHTML = '我是赵本山';
delay(3000);
}
</script>
</html>
分析流程:
- 代码执行之后, 渲染主线程启动, 执行JS代码
- JS代码从上往下执行, 先拿到DOM元素, 然后通知交互线程, 监听按钮得点击事件
- JS执行完毕, 消息队列中也没有任务, 渲染线程进入休眠
- 点击按钮后, 修改文本内容, 然后通知绘制线程更新页面, 绘制线程把绘制任务加入到消息队列. 等待执行
- 程序继续执行 delay() 方法, 渲染线程阻塞3秒, 然后事件回调函数执行完毕
- 渲染进程检查消息队列, 执行绘制任务, 页面更新, 之后主线程进入休眠
任务有优先级吗
任务没有优先级,在消息队列中先进先出
但消息队列是有优先级的
根据 W3C 的最新解释:
- 每个任务都有一个任务类型,同一个类型的任务必须在一个队列,不同类型的任务可以分属于不同的队列。 在一次事件循环中,浏览器可以根据实际情况从不同的队列中取出任务执行。
- 浏览器必须准备好一个微队列,微队列中的任务优先所有其他任务执行
- 官网: https://html.spec.whatwg.org/multipage/webappapis.html#perform-a-microtask-checkpoint
随着浏览器的复杂度急剧提升,W3C 不再使用宏队列的说法
在目前 chrome 的实现中,至少包含了下面的队列:
- 延时队列: 用于存放计时器到达后的回调任务,优先级「中」。
- 交互队列:用于存放用户操作后产生的事件处理任务,优先级「高」
- 微队列: 用户存放需要最快执行的任务,优先级「最高」
添加任务到微队列的主要方式主要是使用 Promise、Mutation0bserver
//立即把一个函数添加到微队列
Promise.resolve().then(函数)
浏览器还有很多其他的队列,由于和我们开发关系不大,不作考虑
笔试题
<script>
setTimeout(function () {
console.log(1);
}, 0)
console.log(2);
</script>
// 答案: 2 1
<script>
setTimeout(function () {
console.log(1);
}, 0)
Promise.resolve().then(function () {
console.log(2);
})
console.log(3);
</script>
// 答案: 3 2 1
<script>
function a() {
console.log(1);
Promise.resolve().then(function () {
console.log(2);
})
}
setTimeout(function () {
console.log(3);
}, 0)
Promise.resolve().then(a)
console.log(5);
</script>
// 答案: 5 1 2 3
<script>
function delay(duration) {
let start = Date.now();
while (Date.now() - start < duration) { }
}
setTimeout(function () {
console.log(1);
}, 0)
delay(1000);
console.log(2);
</script>
// 答案: 等待1s 打印 2 1
面试题: 阐述一下 JS 的事件循环*
参考答案:
事件循环又叫做消息循环,是浏览器渲染主线程的工作方式。
在 Chrome 的源码中,它开启一个不会结束的 for 循环,每次循环从消息队列中取出第一个任务执行,而其他线程只需要在合适的时候将任务加入到队列未尾即可。
过去把消息队列简单分为宏队列和微队列,这种说法目前已无法满足复杂的浏览器环境,取而代之的是一种更加灵活多变的处理方式。
根据 W3C 官方的解释,每个任务有不同的类型,同类型的任务必须在同一个队列,不同的任务可以属于不同的队列。不同任务队列有不同的优先级,在一次事件循环中,由浏览器自行决定取哪一个队列的任务。但浏览器必须有一个微队列,微队列的任务一定具有最高的优先级,必须优先调度执行。
单线程是异步产生的原因, 事件循环是异步的实现方式
面试题: JS 中的计时器能做到精确计时吗?为什么?
参考答案: 不行,因为:
- 计算机硬件没有原子钟,无法做到精确计时
- 操作系统的计时函数本身就有少量偏差,由于JS 的计时器最终调用的是操作系统的函数,也就携带了这些偏差
- 按照 W3C 的标准,浏览器实现计时器时,如果嵌套层级超过5层,则会带有 4 毫秒的最少时间,这样在计时时间少于 4 毫秒时又带来了偏
<script>
setTimeout(function () {
setTimeout(function () {
setTimeout(function () {
setTimeout(function () {
setTimeout(function () {
// 这一层的计时器, 最小执行间隔是4, 写0也是4
}, 4)
}, 0)
}, 0)
}, 0)
}, 0)
</script>
4. 受事件循环的影响,计时器的回调函数只能在主线程空闲时运行,因此又带来了偏差