Meltdown

Meltdown漏洞，是一个处理器硬件级别的漏洞，谷歌的Zero Project团队、密歇根大学的Kocher在2018年的一篇顶会论文中介绍了这个漏洞。该漏洞被命名为“熔断”，有种高温岩浆熔断围墙的感觉，突破用户空间和内核空间的边界限制。它和Spectre系列漏洞有一定关系，也可以被称为Spectre V3，不过目前的学术界将两者清晰的划分为不同种类：乱序执行类、预测执行类。本文将从论文内容、漏洞利用过程两个方面进行介绍。

论文内容介绍

论文的标题为：《Meltdown: Reading Kernel Memory from User Space》，获取链接，因为是会议论文，所以作者在youtube上也发布了一个讲说视频。论文的主要内容分布在Meltdown章节，将漏洞利用过程分为3个环节，给出一些漏洞优化建议，分析现有防御措施的效果。

摘要

计算机系统的安全性建立在内存隔离的基础上。比如：用户进程无法访问内核地址，用户进程A无法访问用户进程B的内存地址。

本文提出的Meltdown，利用现代处理器普遍具有的乱序执行功能，读取内存的任意地址，可以轻松窃取个人数据和密码等隐私信息。

Meltdown要求攻击者具备攻击程序的执行权限，不依赖某个操作系统，也不依赖某个软件漏洞，打破了地址空间隔离以及半虚拟化环境提供的所有安全机制。

研究表明，针对KASLR的KAISER防御机制，对Meldown攻击有着防护作用。因此，我们建议大家部署KAISER，防御Meltdown攻击。

相信大家看到这里，会对以下名词产生好奇，不要慌，在Background部分有相关介绍，比如什么是“乱序执行”？什么是KASLR？什么是KAISER防御机制？为什么内核被映射到进程的虚拟地址空间？如何映射？

Intro

操作系统的核心安全特征是内存隔离，必须确保用户A不能访问其他用户的内存和操作系统内核部分。否则，很多强大的功能就会变得非常危险，比如：一台个人设备同时运行多个应用程序，云上同时执行多个用户的进程。

处理器使用一个超级位来实现用户进程和内核进程的隔离，该超级位（CPU内部某个寄存器的某个比特位）告知处理器当前进程的权限信息，这也是“用户态”和“内核态”的区分。用户进程没有权限对超级位进行修改。

为了提高效率，操作系统将内核进程的地址空间映射到用户进程的地址空间。这样的话，如果需要临时从用户态转换为内核态（比如处理中断），处理器就可以不切换上下文，直接执行相应的内核代码。

本文提出的Meltdown，能够帮助用户进程访问机器的内核地址，无视内存隔离。它不依赖于任何软件漏洞，可以在所有主流操作系统上实现，利用了大多数现代处理器的侧信道信息，例如自2010年以来的现代英特尔微体系结构，以及其他供应商的其他CPU上的潜在信息。

通常来说，侧信道攻击的实施，需要攻击者对受害者程序的实现细节了如指掌，针对泄露的信息而定制。但是，Meltdown攻击较为简单，只要用户程序能够在处理器上运行代码，即可dump出完整的 kernel 地址空间，完整的物理内存。该攻击的强大、便利，根源在于现代处理器的“无序执行”特性。

注：linux等操作系统为了方便内核程序直接操作，将完整的物理内存也映射到了内核进程的地址空间。用户地址空间包含 kernel地址空间，kernel地址空间包含完整的物理内存。这么说来，用户进程也有可能观察到完整的物理内存，ahahaha。

无序执行，是当前处理器的一个非常重要的特性，它可以减少繁忙执行单元（就是一直需要执行）的等待时间。比方说，当一个单元需要等待内存中的数据时，处理器没有和它一起停下来，等待数据从内存中传进来，而是将该后续操作安排到core 的空闲执行单元中。处理器继续执行下一个，也就是“向前看”，或者说无序执行。这提高了效率，但也带来了不好的地方，比如说，时序差可能会从顺序执行和无序执行中泄漏信息（计时攻击）。

从安全的角度来看，这其中有一点很重要。处理器允许非特权进程（用户态程序）执行下列数据加载操作：从特权地址（kernel地址或某个物理地址）到临时的CPU寄存器中，CPU基于该寄存器的值进行下一步计算（比如说，基于该寄存器的值访问某个数组）。如果之后，处理器发现这条指令本不应该被执行，那么，简单地丢弃查找出的某块内存的内容（通过修改该寄存器的状态），就可以确保程序的正确执行。从架构的角度来看，这种方法没有任何安全问题。

但是，我们观察到无序的内存查找过程，会影响到 cache，通过cache侧信道可以检测到这种影响。因此，通过无序执行流读取特权内存，攻击者能够dump出完整的kernel内存，并且通过微架构隐蔽信道（如Flush+Reload）将数据传输到外界。在隐蔽信道的接收端，攻击者能够恢复出该寄存器的值。因此，在微架构水平（也就是硬件实现），存在可利用的安全问题。

Meltdown打破了基于处理器内存隔离功能的所有安全保障。我们评估了针对PC、笔记本和云端服务器的攻击效果，Meltdown攻击能够帮助非特权进程（用户态进程）读取kernel地址空间（映射）的所有数据，包括Linux、Android和OS X上的完整物理内存，Windows上的大部分物理内存。其中包括kernel、其他进程的内容，以及半虚拟化下（Docker）的内存。虽然，攻击效果很大程度上取决于机器性能，比如处理器速度等，但是，实验中，我们dump任意内存的速度dadao3.2KB/s~503KB/s。大量系统会受到该攻击的影响。

KAISER本来是针对KASLR侧信道攻击的防御措施，本实验中发现，它对Meltdown有不错的防御效果。因此，我们强烈建议所有系统部署KAISER。幸运的是，在一个负责任的窗口期（估计是论文发表前），WIndows、Linux和OS X基于KAISER，开发了对应的补丁。

Meltdown和幽灵攻击（Spectre）不同，具体来说，等我看了下篇论文再说吧。

贡献：

将无序执行流，描述为一个新的、强大的和基于软件的侧信道。
展示了无序执行和微架构隐蔽信道的结合，将数据秘密传输出去。
将无序执行和异常处理程序（或TSX）结合，提出一种端到端攻击。在PC、笔记本、移动电话和云主机上无需特权读取任意物理内存。
评估了Meltdown的性能，和KAISER的防御效果。

Background

无序执行

无序执行，本身是一种优化技术，用于提高处理器的利用率。处理器不是严格按照程序指令的顺序执行，如果当前指令要求的操作单元被占用了，就先运行其他的执行单元。一般来说，只要指令执行的结果符合架构上的定义，处理器就可以并行处理这些指令。

实际上，支持无序执行功能的处理器，推测性地进行操作。也就是说，一定程度上，在处理器确认某个指令需要执行并且完整提交之前，支持无序执行的处理器会先执行该指令。关于“推测执行”，就是在原有指令顺序的基础上增加分支。

1967年，Tomasulo开发了一个算法来实现指令的动态调度、无序执行。他提出一个统一的“保留站”的概念，使得处理器在计算出一个数据值后可以直接使用它，而不必将其存储到寄存器或内存，再次读取。保留站，通过重命名寄存器，从而？？？，最后得到的效果是解决了写后读、读后写、写后写危害。此外，保留站通过一条数据总线（CDB）连接所有执行单元。如果操作数未获得，保留站会侦听该数据总线（CDB），直到操作数到达，就可以直接执行指令。

Intel架构中，流水线由前端、执行引擎（后端）和内存子系统组成，x86指令由前端从内存中获取，解码为微操作，然后传输给执行引擎。执行引擎中实现“无序执行”。Reorder buffer负责寄存器分配、寄存器重命名和丢弃，同时负责 move elimination和zero idioms的识别。Scheduler（统一的保留站）接收传来的微指令，重新排序，然后传递给Execution Units。Excution Units中的每一个执行单元执行不同的任务，比如ALU、AES、AGU和内存的加载、存储。其中，AGU和内存的加载、存储单元，和内存子系统直接连接。

CPU通常不运行线性指令流，其中包含分支预测单元，对下一条指令是否应该执行生成预测。分支预测单元尝试在指令确定可以执行前，预测出结果。其中，分支上没有任何依赖关系的指令可以提前被执行，这样的话，一旦该指令确实应该被执行，处理器就可以直接使用其结果；否则，就通过清除Reorder buffer和初始化统一的保留站，来回滚到正常状态。

分支预测的实现，有很多种方法。比如静态分支预测，基于指令本身对结果进行预测；动态分支预测，在运行时收集统计数据，预测结果；一级分支预测，使用1位或2位的计数器来记录分支的最终结果；现代处理器通常使用两级自适应预测，保留最后n个结果，可以预测定期重复的一些模式；神经分支预测，也是最近被采纳的新方法。

地址空间

虚拟地址空间的实现，是通过一个multi-level page translation table，它定义了虚拟地址到物理地址的映射，提供了一些特权检查的保护措施，包括的特权有：可读、可写、可执行、可访问的用户。当前使用的转化表保存在CPU的一个特殊的寄存器内。

通过系统在table中的可访问权限设置，可以避免应用程序直接访问地址空间中的kernel部分。

完整的物理内存会被映射到kernel中，不同的操作系统使用不同的映射方式：

Linux和OS X中，采用直接的物理映射
Windows中，设置了paged pools、non-pages pools和system cache。三者映射物理内存的不同部分。

一般来说，利用内存错误的漏洞，都需要提前猜测到特定数据所在的地址。现有的ASLR、金丝雀，或者设置栈中不可执行的安全措施可以一定程度防范此类漏洞。但是，近些年也出现了一些对应的攻击手段，比如侧信道攻击、利用JavaScript使ASLR失效。

缓存攻击

对于经常使用的数据，CPU和内存间设置了多级缓存，其中，地址空间转换表也会被缓存在这里。

缓存攻击关注因为引入缓存机制造成的时间上的差异，有很多例子。比如Flush+Reload缓存攻击，通过clflush指令刷新目标内存位置，测量重新加载数据所需要的时间，具体细节省略。

侧信道攻击的另一个特殊用例是隐蔽通道。

一个简易例子

本节，介绍一个简单的代码片段，来说明无序执行改变微架构状态的行为会泄露信息。

1
2
3


raise_exception();
// the line below is never reached
access(probe_array[data * 4096]);

该代码，首先引发一个异常，再访问一个数组。

关于操作系统对“异常”的处理，引发后，控制流不会继续执行异常后的代码，而是跳转到操作系统的异常处理程序。因此，理论上，该代码中的访问数组操作不会被执行。但是，因为处理器的无序执行特性，CPU可能已经执行了该指令，因为它不依赖于“触发异常”的那条指令。

宏观来看，处理器的无序执行不会产生任何不好的影响，毕竟处理器会根据异常处理之后，再决定无序执行的指令的操作结果是否保留。但是，微架构层次来看，本代码中的数组已经被加载到了cache中。这样的话，我们就可以通过侧信道攻击获取缓冲中的信息，比如通过Flush+Reload来检测一个特定的内存是否被缓存了。并且，进一步展开攻击。

具体来说，

1
2


char data = *(char*)0xFFFF8E19;
printf("%c\n", data);

构建攻击模块

运行 transient 指令

上面提到的例子中，“异常”之后的指令，被称为 transient 指令。它具有两个特点：1. 无序执行，2. 处理器去处理“异常”了，因此对于 transient指令的副作用，攻击者可以处理并利用。

transient指令，瞬态指令，因为它虽然暂时被执行了，但是处理器反应过来之后，回对其进行处理。

访问用户不可访问的页面，会触发“异常”。攻击者对“异常”的处理，一般来说，有两种方案：

异常处理
异常抑制

建立隐蔽信道

隐蔽信道，就是读取 transient 指令执行造成的处理器“微架构”状态改变，从状态中推断出秘密信息，然后传送出去。

隐蔽信道的发送方，是上面的transient指令，它利用内存中的某个用户程序可访问的地址。该地址被缓存，就相当于发出“1”。隐蔽信道的接收方，试图访问这个位置，可以通过访问时间（Flush+Reload），确定此时该地址是否被缓存。如果发现其被“缓存”，则相当于接收到了“1”这个隐蔽信息。

Meltdown

首先，我们讨论攻击设置以强调这种攻击的广泛适用性。

其次，我们提供了攻击概述，展示了 Meltdown 如何同时安装在个人计算机的 Windows 和 Linux 上、手机上的 Android 系统以及云中。

最后，我们讨论了 Meltdown 的具体实现，允许以 3.2 KB/s 到 503 KB/s 的速度转储任意内核内存。

攻击设置

攻击环境包括云上的个人计算机和虚拟机

攻击者拥有普通用户权限，执行非特权代码

假定系统具有现阶段所有最先进的防御措施，比如ASLR KALSR SMAP SMEP NX PXN

假定系统没有任何bug，没有任何可利用的软件漏洞

攻击者的目标是秘密用户数据

攻击描述

Meltdown攻击的核心：

;rcx = kernel address, rbx = probe array
xor rax rax
retry:
mov al, byte [rcx]
shl rax, 0xc
jz retry
mov rbx, qword [rbx + rax]

三个步骤

加载攻击者无法访问的内存位置的内容（秘密）到寄存器
transient指令根据寄存器中加载的“秘密”，访问高速缓存，相当于发送“秘密”
攻击者使用Flush+Reload来访问高速缓存，接收秘密信息

步骤1：读取秘密

为了从内存中的特权位置，读取秘密到寄存器，用户程序使用虚拟地址来引用内存中的数据。

每一个kernel的虚拟地址，通过转换都会指向一个实际的物理地址。

虚拟地址转换为物理地址的同时，处理器还会检查虚拟地址的权限位，确定该地址是用户可访问的，还是只有kernel能够访问。

用户程序访问kernel地址空间，会引发异常。但是，Meltdown利用处理器的乱序执行，在非法内存访问和引发异常之间的小时间窗口内执行命令。

步骤2：传输秘密

在内存中分配一个探测数组，并确保该数组的任何部分都没有被缓存。

为了传输秘密，transient指令序列对基于secret值计算的地址，进行间接地址访问。

shl rax, 0xc

左移12位，也就是将secret值乘以4 KB(4096 B)，乘以页面大小。从而防止相邻的内存位置被加载时，影响结果。

在这里，我们一次读取一个字节，也就是0~255的数。因此，探测数组需要满足256 x 4096B的大小。

对 0 的噪声优化。

secret -> L1 cache -> L3 cache

transient微指令的操作被权限检查操作优先了
处理器对权限检查的结果的猜测值，可能是1，也可能是0，而且从现有处理器的软硬件配置来说，0的可能性更高。也就是权限不允许。

因此，在secret值为0的时候，我们的Meltdown攻击会执行一定次数的重复，避免上述两个原因导致的偏差。

我们发现，KAISER最初提出的对抗KASLR侧信道攻击的对策，无意中也阻碍了Meltdown。

我们强调，KAISER需要部署在每个操作系统上，作为一种短期的解决方案，直到Meltdown在硬件上得到修复，以防止Meltdon攻击的大规模出现。

Meltdown

论文内容介绍

摘要

Intro

Background

无序执行

地址空间

缓存攻击

一个简易例子

构建攻击模块

运行 transient 指令

建立隐蔽信道

Meltdown

攻击描述

步骤1：读取秘密

步骤2：传输秘密

步骤3：接收秘密

Dump出完整的物理内存

优化和限制

对 0 的固有偏差

对 0 误差的优化

单比特传输

使用Intel TSX的异常抑制

突破KASLR

Evaluation

对策

讨论

结论

Meltdown in Practice

Real-world Meltdown Exploit

漏洞利用过程

Meltdown

相关文章：