Hi 游客

更多精彩,请登录!

比特池塘 区块链前沿 正文
本文是x86虚拟机系列文档,供Qtum量子链团队成员以及所有感兴趣的用户阅读。
. R( W9 a; p+ e1 b 1 ?0 c3 {- }  u9 Y* ^
与EVM不同的是,在x86架构中内存使用是不连续的,内存中可能存在空白段。例如,访问0x1000处的内存可能会导致错误,因为该段内存没有被分配,但是在0x2000处可能有一些有用的内容。实际上,大多数虚拟机和CPU架构都把这作为其优势,所以EVM的内存使用方式是比较少见的。在1Mb内存还不常见的时代,8086曾规定的大多数内存都从0开始,而只读BIOS内存位于0xF0000,有时一部分内存实际上被连接到外部设备而不是RAM。
8 Y3 K; N* P( F1 F6 } : R8 Z; Y, j9 y: L) G
Qtum x86 虚拟机设计也运用了这个特性,以便实现某些内存区域可以共享的特性。& A. ?) l. D) ]  a' |$ {) m) d. `
) U/ K  L/ c# t0 E2 t

$ X. _! z5 w6 F+ ?- ]# }# n6 p, p& n以下是Qtum Core的内存映射(稍后详细解释):& W8 |" N4 O( Z) s5 B3 G
l  应急堆栈- 0x100,长度64,读写$ v$ h: F4 J  j/ n; a4 X
l  合约代码- 0x1000,长度0x10000 (max),只读7 G0 m' [0 K. H4 {4 C% b: E2 Q% p
l  合约数据- 0x100000,长度0x10000 (max),读写3 j3 i9 a. {7 g( a" ~. \
l  堆栈内存- 0x200000,长度8196,读写
$ M: _# u: r0 A1 |9 C6 ul  执行数据- 0xD0000000,长度待定,只读
' A+ H1 C9 q) y+ j4 J) Q- u- gl  交易数据- 0xD1000000,长度可动态调整,只读/ c9 h4 H0 Z  O, \  I' j
l  区块链数据- 0xD2000000,长度待定,只读1 ]% g. p5 y! H' ~+ v2 E7 J

: L. H. J3 M$ u. |* R7 T 注意,各内存块可以在第一次读取时再进行初始化。即在合约需要读取数据之前,没有必要为某个内存块构造数据。首次访问类似的内存区域可能还需要额外的gas费用。
2 ~2 L1 O7 ?" P0 J
0 J0 D/ F7 [3 W. n2 a  s2 H' s01
. E9 A4 F" b3 l7 @$ W& R! T* X7 _  S应急堆栈(Emergency stack)
2 C& ~# {( C0 D" \" a发生double-fault 异常时使用的应急堆栈。暂不使用,因为异常处理暂未支持。. @! ~( @& v2 v; d" V, X
/ k2 C+ _0 W3 ^& _
02
4 {* G/ d, W) h+ t6 R2 ?- k合约代码(Contract Code)8 C7 C- O  j9 W% s& o4 b
实际加载合约代码的内存区域。出于安全性和后续优化考虑,该内存区域设置为只读。实际的大小取决于加载的合约代码大小。超出实际大小的内存只能读取不能写入,且值恒为0。- C6 }& `0 L' _. K) w% ]

' O5 T7 b$ a* P8 {5 K% F2 i5 `030 V7 K; E: ^) _
合约数据(Contract Data)/ e! s' K) n# |
加载合约数据的内存区域。与EVM不同的是,对于变量, 无需CPU代码指定预留内存并将其设置为该变量的值。x86中的变量只是一个指向内存地址的简单指针。加载器(loader,在普通的操作系统中对应解析器和加载器,在Qtum中,对应虚拟机的初始化进程)通过这一地址获取变量值。这在实际中非常有用,因为我们可以使用高效的原生代码 (如“memcpy”)一次性完成所有变量的初始化。变量指针最终指向该内存区域。其实际大小暂定为1Mb,但在x86虚拟机原型发布之后有可能进行调整。
: W3 G$ q: L+ H- V8 @4 x : t, W0 p6 T5 n
请注意,只读数据(取决于链接器配置)存储在代码区域。普通程序中的只读数据包括字符串、常量等。
! |5 D/ L- Z5 i+ p! J
* k: V4 A4 Z! J4 ]8 s9 Z0 P04
- r! m) o. M' N/ c5 _栈内存(Stack Memory) - L' H( B5 `* }4 K' A  G: k4 a
为x86调用栈保留的内存区域。调用栈用于向函数传递参数、存储返回地址、本地变量等。之所以将其他数据和栈数据进行隔离,是因为该内存区域前后都是无效内存。也就是说,一旦栈发送溢出,将很容易被检测到,因为这将导致抛出错误。显式的抛出错误在大多数情况下都比带着错误继续运行要好得多。# b# `4 C4 q- H  }6 L4 {7 L
0 X! E$ _3 R# q, |7 @
050 a! f1 ~3 i2 U& M/ f- T1 e, R
调用数据(Execution Data); \: {  C, ]% X  `' N5 L1 c# N
只读数据,且对于每个合约调用都是特定的。这意味着当在合约中调用合约时,数据将是不同的。这些数据包括发送者地址(发起合约调用的地址)、gas limit和其他数据等。
1 h3 V4 S% e8 M  r  y
) k; `9 R% W( \6 e  p06! Q  V. G, F6 B3 Q- v  P4 w
交易数据(Transaction Data)
7 m0 G. B8 U9 `6 v2 | 动态长度数据,编码了触发此次合约调用的完整交易数据(包括交易的所有输入输出)。其中既包含了原始脚本的访问,也包含了诸如“发送了100 token到A地址”这样方便使用的数据。关于脚本的解析,qtum-x86会提供相关的辅助库函数。2 c$ a- {& r0 ~$ V) c
1 {) n9 ^& u% M
07
- r% ~( I- U- y5 @4 f" N区块链数据(Blockchain Data)
9 T; a, e# H3 N只读的全局区块链数据,对于当前区块中的所有合约为常量。包括区块的gas limit,当前区块高度,之前区块的哈希值,当前挖矿难度等数据。% [# T, i5 u# A1 H5 K
9 Z6 [1 i# e9 u' ?
设计初衷
1 D- e  ]: j8 ]$ o  v7 ]3 T# g之所以令上述数据可直接从内存获取,而不是通过系统调用(syscall),其主要原因有两个:" T: g5 t7 @) Y
l  系统调用都有不可忽视的安全风险4 S  d7 w2 }" Z* X' c- x
l  系统调用在合约代码大小、合约代码gas消耗以及虚拟机实现速度等方面,开销都比较大;
9 f7 i4 F! B+ x# Q, @: T2 B 5 ?* {3 n* H6 L8 L, N" m# ^
每个系统调用都是一个暴露合约代码的接口,大多数操作系统内核安全漏洞来自系统调用中的bug。因此,应尽量少地将系统调用暴露给虚拟机 ,减少安全风险。  F1 b6 a9 i7 R; Q1 I3 A
- \8 o# O0 _2 f# Q
系统调用过程总体开销较大,主要体现在以下几个方面。首先,代码虽然不大,但不可忽略。用C语言进行一次系统调用至少需要30字节,其他语言也需要或多或少的消耗内存。其次,系统调用过程中开销最大的部分在于需要在系统调用和标准C接口间进行翻译,这涉及调用帮助函数,预留寄存器,从堆栈中获取数据并将它们存储在寄存器中,执行系统调用,以及最终恢复寄存器等一系列过程。上面提到的30字节只包含帮助函数部分。实际执行的总字节数明显更多,但并没有表现在合约代码尺寸中,因为该代码只编写一次,并用于每个系统调用。
! ^/ [2 X3 z. b0 ^, R: }
: b5 T5 G1 r8 ^8 I6 ]1 g6 E& ^最后,除合约本身的效率问题外,每个系统调用都有可能影响虚拟机的性能。在JIT工作流中,虽然硬件CPU可以快速地缓存JIT代码和JIT编译过的合约代码,但是在离开该内存区域去运行另一段代码时,通常必须至少先清除一部分缓存,为新代码腾出空间。在一个真正使用硬件支持的虚拟化工作流中,这类操作的开销会更大,因为它可能涉及上下文切换和硬件级系统调用。这是大多数需要在虚拟机中运行的语言遇到的常见问题,包括Webassembly(据本人了解,最近Webassembly团队才在某种程度上做了一些重大改进),Javascript/V8等等。; k0 B0 M( C5 a. y: N% m
, ~0 ?0 l( z* O- \' b$ L7 R. k* A1 ]  N
x86虚拟机原型5 J. g8 N& O& U7 v. b( z) Y* b
0 m1 y1 m. j; y5 x( y; ^
Qtum x86仍处在原型开发中,故本文所述的内存映射设计与最终版本可能有出入。感兴趣的读者请持续关注包括本文在内的x86系列设计文档。
BitMere.com 比特池塘系信息发布平台,比特池塘仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表比特池塘立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

成为第一个吐槽的人

李凯908 初中生
  • 粉丝

    0

  • 关注

    0

  • 主题

    24