分类导航

node.js|vue.js|jquery|angularjs|React|json|js教程|

服务器之家 - 编程语言 - JavaScript - 让 Node.js 变“懒”的 COW 技术

让 Node.js 变“懒”的 COW 技术

2021-08-24 22:55神光的编程秘籍神说要有光 JavaScript

COW 不是奶牛，是 Copy-On-Write 的缩写，这是一种是复制但也不完全是复制的技术。本文我们来探究下 Copy-On-Write 在 Node.js 的进程创建和文件复制的应用。

让 Node.js 变“懒”的 COW 技术

COW 不是奶牛，是 Copy-On-Write 的缩写，这是一种是复制但也不完全是复制的技术。

一般来说复制就是创建出完全相同的两份，两份是独立的：

让 Node.js 变“懒”的 COW 技术

但是，有的时候复制这件事没多大必要，完全可以复用之前的，这时候可以只是引用之前的那份，在写内容的时候才去复制对应的一部分内容。这样如果内容用于读的话，就免去了复制，而如果需要写，才会真正复制部分内容来做修改。

让 Node.js 变“懒”的 COW 技术

这就叫做“写时复制”，也就是 Copy-On-Write。

原理很简单，但是在操作系统的内存管理和文件系统中却很常见，Node.js 里面也因为这种技术变“懒”了。

本文我们来探究下 Copy-On-Write 在 Node.js 的进程创建和文件复制的应用：

文件复制

文件复制这件事最常见的思路就是完全写一份相同的文件内容到另一个位置，但是这样有两个问题：

完全写一份相同的内容，如果同样的文件复制了几百次，那么也创建相同的内容几百次么?太浪费硬盘空间了
如果写到一半断电了怎么办?覆盖的内容如何恢复?

怎么办呢?这时候操作系统设计者就想到了 COW 技术。

用 COW 技术实现文件复制以后完美解决了上面两个问题：

复制只是添加一个引用到之前的内容，如果不修改并不会真正复制，只有到第一次修改内容的时候才去真正复制对应的数据块，这样就避免了大量硬盘空间的浪费。
写文件时会先在另一个空闲磁盘块做修改，等修改完之后才会复制到目标位置，这样就不会有断电无法回滚的问题

在 Node.js 的 fs.copyFile 的 api 就可以使用 Copy-On-Write 模式：

默认情况下，copyFile 会写入目标文件，覆盖原内容

const fsPromises = require('fs').promises;
(async function() {
try {
await fsPromises.copyFile('source.txt', 'destination.txt');
} catch(e) {
console.log(e.message);
}
})();

但是可以通过第三个参数指定复制的策略：

const fs = require('fs');
const fsPromises = fs.promises;
const { COPYFILE_EXCL, COPYFILE_FICLONE, COPYFILE_FICLONE_FORCE} = fs.constants;
(async function() {
try {
await fsPromises.copyFile('source.txt', 'destination.txt', COPYFILE_FICLONE);
} catch(e) {
console.log(e.message);
}
})();

支持的 flag 有 3 个：

COPYFILE_EXCL: 如果目标文件已存在，会报错(默认是覆盖)
COPYFILE_FICLONE: 以 copy-on-write 模式复制，如果操作系统不支持就转为真正的复制(默认是直接复制)
COPYFILE_FICLONE_FORCE：以 copy-on-write 模式复制，如果操作系统不支持就报错

这3个常量分别是 1，2，4，可以通过按位或把它们合并之后传入：

const flags = COPYFILE_FICLONE | COPYFILE_EXCL;
fsPromises.copyFile('source.txt', 'destination.txt', flags);

Node.js 支持操作系统的 copy-on-write 技术，在一些场景下可以提升性能，建议使用 COPYFILE_FICLONE 的方式，会比默认的方式好一些。

进程创建

fork 是常见的创建进程的方式，而它的实现就是一种 copy-on-write 技术。

我们知道，进程在内存中分为代码段、数据段、堆栈段这 3 部分：

代码段：存放要执行的代码
数据段：存放一些全局数据
堆栈段：存放执行的状态

如果基于该进程创建一个新的进程，那么要复制这 3 部分内存。而如果这三部分内存是一样的内容，那就浪费了内存空间。

所以 fork 并不会真正的复制内存，而是创建一个新的进程，引用父进程的内存，当做数据的修改的时候，才会真正复制该部分的内存。

让 Node.js 变“懒”的 COW 技术

这也是为什么把进程创建叫做 fork，也就是分叉，因为不完全是独立的，只是某部分做了分叉，成了两份，但是大部分还是一样的。

但如果要执行的代码不一样怎么办呢，这时候就要用 exec 了，它会创建新的代码段、数据段、堆栈段、执行新的代码。

Node.js 里面同样可以用 fork 和 exec 的 api：

fork:

const cluster = require('cluster');
if (cluster.isMaster) {
console.log('I am master');
cluster.fork();
cluster.fork();
} else if (cluster.isWorker) {
console.log(`I am worker #${cluster.worker.id}`);
}

exec:

const { exec } = require('child_process');
exec('my.bat', (err, stdout, stderr) => {
if (err) {
console.error(err);
return;
}
console.log(stdout);
});

fork 是 linux 进程创建的基础，由此可见 copy-on-write 技术多么重要了。

总结

复制同样的内容多份无疑比较浪费空间，所以操作系统在做文件复制、进程创建时的内存复制的时候都采用了 Copy-On-Write 技术，只有真正修改的时候才会去做复制。

Node.js 支持了 fs.copyFile 的 flags 的设置，可以指定 COPYFILE_FICLONE 来使用 Copy-On-Write 的方式做文件复制，也建议大家使用这种方式来节省硬盘空间，提高文件复制的性能。

进程的 fork 也是 Copy-On-Write 的实现，并不会直接复制进程的代码段、数据段、堆栈段到新的内容，而是引用之前的，只有在修改的时候才会做真正的内存复制。

除此以外，Copy-On-Write 在 Immutable 的实现，在分布式的读写分离等领域都有很多应用。

COW 让 Node.js 变“懒”了，但性能却更高了。

原文链接：https://mp.weixin.qq.com/s/nQ6wHZ4H7ULcvN-rwLP-GA

延伸 · 阅读

2022-03-10Node.js之http模块的用法
2022-03-10搞懂什么是Node.js原来这么简单
2022-03-07Deno ：它比 Node.js 更好吗？
2022-03-02node.js 全局变量的具体使用
2022-02-27node.js利用express自动搭建项目的全过程
2022-02-25用Babel和Nodemon搭建一个功能齐全的Nodejs开发环境

精彩推荐

node.js

一文秒懂nodejs中的异步编程

这篇文章主要介绍了深入理解nodejs中的异步编程,本文给大家介绍的非常想详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下...

flydean程序那些事8142022-01-10
JavaScript

vue Cli 环境删除与重装教程 - 版本文档

这篇文章主要介绍了vue Cli 环境删除与重装教程 - 版本文档，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

草巾冒小子12742021-09-27
JavaScript

jQuery中before()方法用法实例

这篇文章主要介绍了jQuery中before()方法用法,以实例形式分析了before()方法的功能、定义与具体使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下...

jQuery教程网10202021-06-02
JavaScript

JavaScript中的ubound函数使用实例

这篇文章主要介绍了JavaScript中的ubound函数使用实例,本文先是讲解了ubound函数的语法,然后给出了用法代码实例,需要的朋友可以参考下...

JavaScript教程网7552021-04-13
JavaScript

基于jQuery的JavaScript模版引擎JsRender使用指南

这篇文章主要介绍了基于jQuery的JavaScript模版引擎JsRender使用指南,需要的朋友可以参考下...

jQuery教程网7202021-06-09
js教程

微信小程序实现导航功能的操作步骤

这篇文章主要给大家介绍了关于微信小程序实现导航功能的操作步骤，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值...

远航_20012022-02-15
JavaScript

js获取会话框prompt的返回值的方法

这篇文章主要介绍了js获取会话框prompt的返回值的方法,通过一个简单的密码判断实例分析了js获取会话框prompt返回值的使用技巧,非常具有实用价值,需要的朋...

JS教程网12132021-06-28
JavaScript

javascript 弹出窗口中是否显示地址栏的实现代码

程序中通过点击一个“发货提醒”链接弹出另一个窗口，使用的方法是用javascript 的openUrl()方法。...

JavaScript教程网10052021-01-28