前端实现多文件编译器

智能合
• 阅读 1102

简介:在前端工程中,有时我们需要在浏览器编译并执行一些代码,这种需求常见于低代码场景中。例如我们在搭建时需自定义一部分代码,这些代码需要在渲染时执行。为了方便起见,我们写的代码一定是 ES6 语法,如果要在浏览器执行,那么就必须经过编译。下面是前端编译 JS 代码的一些实践。

前端实现多文件编译器

作者 | 景遇
来源 | 阿里技术公众号

一 概要

在前端工程中,有时我们需要在浏览器编译并执行一些代码,这种需求常见于低代码场景中。例如我们在搭建时需自定义一部分代码,这些代码需要在渲染时执行。为了方便起见,我们写的代码一定是 ES6 语法,如果要在浏览器执行,那么就必须经过编译。下面是前端编译 JS 代码的一些实践。

二 需求描述

  • 低码搭建时需要自定义一部分代码
  • 希望代码是以多文件形式组织的
  • 可以使用 ESModule 形式导入/导出

三 需求分析

1、在浏览器编译代码必然需要使用 babel 完成;

2、如果只有一个 JS 文件,那么可以直接使用 babel 的 transform 函数编译;

3、如果存在多文件,则文件内的变量必须相互隔离,且文件之间能够通过某种形式相互引用,并且需要考虑文件之间的依赖关系;

四 核心设计

流程

前端实现多文件编译器

1 变量隔离

由于我们的需求是多文件编辑,各个文件内的变量应该相互隔离。最简单的办法是将每个文的内容转成一个闭包,再通过固定的接口将每个文件连接起来。

假设有 a.js,内容如下:

const a = 1;
const b = 2;

function sum () {
  return a + b'
}

sum();

可以将其转为如下形式:

(function() {
    const a = 1;
  const b = 2;

  function sum () {
    return a + b'
  }

  sum();
})();

转成这种形式之后,每个文件内的变量就只会存在于各自的闭包之内,互不影响。

五 文件引用

文件之间的相互引用可以通过定义一种接口规则实现:

  • 所有文件的引用都将通过全局变量 module 进行;
  • 每个文件都将对应到 module 上的一个对象,key 根据文件名而定。

1 导出

原文件:

`// a.js
export const a = 1;`

编译后:

(function() {
  __filename = 'a.js';
     const a = 1;
  var mod = {};
  mod.a = a;
    module[__filename] =  mod;
})()

2 导入

源文件

// b.js
import { hello } from './a'

hello();

编译后

(function() {
  __filename = 'b.js';
  var $$a = module['a.js'];
  $$a.hello();
  var mod = {};
    module[__filename] =  mod;
})()

六 依赖树解析

假设有一堆文件,我们通过解析(babel 或正则)后得到他们之间的关系如下:

他们之间存在循环依赖

前端实现多文件编译器

根据这个依赖图可以梳理出几条依赖路线:

A -> B -> D -> C -> F -> 循环依赖B
A -> B -> E -> F -> 循环依赖 B
A -> C -> F -> B -> E -> 循环依赖 F
A -> C -> G

从开始出现的第一个循环依赖截断依赖路线,分别统计统计每个节点的深度,按深度依次放入队列中。

如果两个节点深度相同,则分析两个节点的依赖关系,被依赖的先进队列,故最终形成的队列如下:

F E B C D G A

为什么要得到一个编译顺序呢?

以上得出的编译顺序是为了尽可能解决如下的引用情况,但也不能解决所有:

// a.js
export const a = 2

// b.js
import { a } from 'a.js';
console.log(a + 2);

这时候,假设执行 b 的时候,a 还没被执行,那么 b 内部拿到的 a 实际上是 undefined,显然不是我们所希望的。所以此时必须保证 a 先于 b 执行。

但这种使用方式在存在循环引用时无法解决,只能调整文件组织形式。

事实上,假设存在循环依赖时,下面的在函数内或在类内引用方式是没有问题的,有问题的只是直接使用:

// a.js
export const a = 2

// b.js
import { a } from 'a.js';
export function test () {
    return a + 1;
}

这样,即使 b 有依赖 a,test 只要不是立即执行函数也不会产生影响。

七 编译

1 ESModule 转换

此过程可以通过自定义一个 Babel 插件完成,在语法编译时将文件编译成一个闭包,同时处理好 ESModule 语法。

该 Babel 插件很简单,在此就不展开去写了。

2 文件队列编译

对单个文件的编译可封装成一个方法,假设函数名为:compileFile

按照上面解析到的文件队列按照顺序逐个调用 compileFile 进行编译,并将结果直接拼接起来,形成一个巨大的字符串,该字符串的样子应该是如下的格式:

(function() {
  __filename = 'b.js';
  var $$a = module['a.js'];
  // ...
  var mod = {};
    module[__filename] =  mod;
})();

(function() {
  __filename = 'a.js';
  var $$b = module['b.js'];
  // ...
  var mod = {};
    module[__filename] =  mod;
})();

// ...

3 JS 执行

最后一步,执行上面得到的编译结果即可,此步骤可直接使用 new Function 的方式完成,例如:

(假设以上的字符串内容保存在 compiledScript 中)

const exec = new Functioon(`
    var module = {};
  ${compiledScript};
  return module;
`);

const module = exec();

module['a.js'] // a.js 的导出内容
module['b.js'] // b.js 的导出内容

八 总结

至此,一个前端可执行的小型打包工具就已实现,可以直接在前端进行多文件的编辑和执行。

实时上,此过程仅适用于不方便借助服务器的场景,如果有条件允许可以借助服务器,那么编译过程最好在服务端完成,甚至还可以借助 webpack 或 rollup 等打包工具实现更好的编译效果。

参考

目前我们在 ali-lowcode-engine 之上的源码插件(@ali/lowcode-plugin-code-editor)内部实现了多文件的支持,目前仅做了最简单的实现:模块引用直接采用了 UMD 规范,暂时也没有考虑循环依赖和执行顺序。

后续会严格按照以上步骤进行优化。

原文链接
本文为阿里云原创内容,未经允许不得转载。

点赞
收藏
评论区
推荐文章
代码哈士奇 代码哈士奇
3年前
webpack5学习笔记
我的前端之路笔记cdn资源webpack笔记解决作用域问题快速执行函数;(function().....)解决代码拆分问题nodecommonjs模块化解决浏览器支持问题requirejs想要主js调用别的js要在主js前引入hello.jsexporthello()main.jshello()importhello.jsimportmain.j
APICloud平台常用技术点汇总详解
APICloud移动低代码开发平台介绍:使用APICloud可以开发移动APP、小程序、html5网页应用。如果要实现编写一套代码编译为多端应用(移动APP、小程序、html5),需使用avm.js框架进行开发。如果只开发APP,则可以使用前端技术(HTML5、Vue、react等)、avm.js进行开发,还可以使用模块商店大量的原生
Wesley13 Wesley13
3年前
VSCode 运行go test显示打印日志
在VSCode中运行gotest,在代码中写的fmt.Printf("TestB\n")这些语句均不打印,只显示最终的结果PASSokgithub.com/B0.034sSuccess:Testspassed.经查,需要在执行gotest时添加v参数,而默认不添加,需要在VSCo
Stella981 Stella981
3年前
Redis的锁
分布式与集群什么是锁在单进程的系统中,当存在多个线程可以同时改变某个变量(可变共享变量)时,就需要对变量或代码块做同步,使其在修改这种变量时能够线性执行消除并发修改变量。而同步的本质是通过锁来实现的。为了实现多个线程在一个时刻同一个代码块只能有一个线程可执行,那么需要在某个地方做个标记,这个标记必须
Stella981 Stella981
3年前
JS中注入eval, Function等系统函数截获动态代码
正文现在很多网站都上了各种前端反爬手段,无论手段如何,最重要的是要把包含反爬手段的前端javascript代码加密隐藏起来,然后在运行时实时解密动态执行。动态执行js代码无非两种方法,即eval和Function。那么,不管网站加密代码写的多牛,我们只要将这两个方法hook住,即可获取到解密后的可执行js代码。注意,有些网站会检测eval和Functi
Stella981 Stella981
3年前
Babel总结
什么是babel?babel是一个JavaScript编译器。Babel是一个工具链,主要用于将ECMAScript2015代码转换为向后兼容的旧浏览器或环境中JavaScript版本。注解:传统的编译是指转化成可执行的代码,也就是二进制代码。但是对于前端来说,因为JS是解释性语言,对于浏览器或者Node来说就是可执行的代码。
Wesley13 Wesley13
3年前
Java字节码详解
也许你写了无数行的代码,也许你能非常溜的使用高级语言,但是你未必了解那些高级语言的执行过程。例如大行其道的Java。Java号称是一门“一次编译到处运行”的语言,但是我们对这句话的理解深度又有多少呢?从我们写的java文件到通过编译器编译成java字节码文件(也就是.class文件),这个过程是java编译过程;而我们的java虚拟机执行的就是字节码文件
Stella981 Stella981
3年前
Babel中的stage
大家知道,将ES6代码编译为ES5时,我们常用到Babel这个编译工具。大家参考一些网上的文章或者官方文档,里面常会建议大家在.babelrc中输入如下代码:{"presets":"es2015","react","stage0",
Stella981 Stella981
3年前
JVM即时编译器
1.为何HotSpot虚拟机要使用解释器与编译器并存的架构?2.为何HotSpot虚拟机要实现两个不同的即时编译器?3.程序何时使用解释器执行?何时使用编译器执行?4.哪些程序代码会被编译为本地代码?如何编译为本地代码?5.如何从外部观察即时编译器的编译过程和编译结果?解释器与编译器两者各有优势:当_程序需要迅速启动和执行
Wesley13 Wesley13
3年前
Java分布式锁看这篇就够了
\什么是锁?在单进程的系统中,当存在多个线程可以同时改变某个变量(可变共享变量)时,就需要对变量或代码块做同步,使其在修改这种变量时能够线性执行消除并发修改变量。而同步的本质是通过锁来实现的。为了实现多个线程在一个时刻同一个代码块只能有一个线程可执行,那么需要在某个地方做个标记,这个标记必须每个线程都能看到
实现“代码可视化”需要了解的前置知识-编译器中端
1.前言前文介绍了编译器前端知识并附带了小练习,本文将继续介绍编译器中端相关的知识,还是概念练习的学习方式。中间代码是用来进行程序分析和实现代码可视化的关键数据,了解其生成和优化方式能更好的帮助我们理解程序的执行逻辑,希望大家阅读本文后有所收获。2.编译
智能合
智能合
Lv1
近城远山,都是人间。
文章
4
粉丝
0
获赞
0