一篇文章让你明白CPU缓存一致性协议MESI

阅读量：385 次

发布时间：2019-03-05

本文共 2149 字，大约阅读时间需要 7 分钟。

CPU高速缓存（Cache Memory）

随着技术的发展，计算机的性能提升越来越依赖于CPU的性能，而CPU的发展速度远超内存和存储设备。为了弥补这两个速度的差距，CPU厂商在每个CPU中内置了高速缓存，解决I/O速度与CPU运算速度之间的不匹配问题。

为什么CPU需要高速缓存

在深入理解高速缓存之前，我们需要了解CPU的发展趋势和内存存储的限制。根据Moore定律，CPU每18个月翻一番，但内存和硬盘的发展速度却相差甚远。这导致高性能内存和硬盘价格昂贵，而CPU对数据的快速访问需求却无法满足。

为了解决这一矛盾，CPU厂商引入了高速缓存。高速缓存的核心作用是缓解CPU与内存之间的速度差距。它通过暂存常用数据和指令，减少对主内存的访问次数，从而提升整体系统性能。

局部性原理与缓存优化

在CPU访问存储设备时，数据和指令的访问呈现出一定的局部性原理。无论是读取数据还是执行指令，CPU往往会连续地访问内存中的相邻区域。这种现象可以分为两种局部性：

时间局部性（Temporal Locality）

如果一个信息项正在被访问，它在近期内有很大概率会被再次访问。例如，在循环、递归或方法反复调用时，某些数据或指令会被频繁使用。

空间局部性（Spatial Locality）

如果一个存储器位置被引用，其附近的位置也会被频繁引用。例如，在顺序执行的代码中，不同的变量或数组会连续存储在内存中。

这些特性使得高速缓存成为一种高效的解决方案。

高速缓存的执行流程

带有高速缓存的CPU执行计算时，数据的流程是：

程序和数据加载到主内存

运行的程序和需要处理的数据首先被加载到主内存中。

指令和数据加载到CPU缓存

CPU从主内存中读取指令和数据，并将它们加载到高速缓存中。

CPU执行指令并写入结果

CPU执行指令，计算结果并将数据写入高速缓存。

高速缓存数据写回主内存

当高速缓存中的数据需要持久化保存时，会将其写回主内存。

多级缓存结构的引入

随着CPU性能的提升，单级缓存无法满足高性能需求。为了进一步提升系统性能，CPU厂商引入了多级缓存结构。多级缓存可以分为以下几种：

L1缓存（一级缓存）

位于CPU核心附近，访问速度最快，通常用于存储程序指令和常用数据。

L2缓存（二级缓存）

位于CPU和主内存之间，缓存更大范围的数据，主要用于降低L1缓存的压力。

L3缓存（三级缓存）

位于主内存和其他设备之间，用于缓解主内存的瓶颈，适用于多核或多线程环境。

多级缓存结构的引入显著提升了系统的整体性能，但也带来了缓存一致性问题。

多核CPU下的缓存一致性协议MESI

在多核环境下，每个CPU都有自己的一级缓存，如何保证缓存数据的一致性成为关键问题。为了解决这一问题，MESI协议被引入。

MESI协议缓存状态

MESI是四种状态的首字母，用于表示缓存行的状态。每个缓存行可以通过2个bit表示状态。具体如下：

M（Modified）

缓存行被修改过，并在其他缓存中可能有共享副本。

E（Exclusive）

缓存行是唯一的副本，其他缓存没有该数据副本。

S（Shared）

缓存行是共享副本，其他缓存也有该数据副本。

I（Invalid）

缓存行无效，可以被丢弃。

状态转换

缓存状态的转换涉及多个步骤，确保数据的一致性。以下是状态转换的示意图：

读取操作：当一个CPU试图从缓存读取数据时，根据当前缓存状态决定下一步操作。

写入操作：当一个CPU试图修改缓存数据时，同样根据当前状态决定操作。

失效操作：当缓存行被修改或丢弃时，其他缓存需要更新其状态。

多核缓存协同操作

在多核环境下，缓存协同操作至关重要。以下是几个关键场景：

单核读取

当一个CPU从主内存读取数据时，数据会被加载到其本地缓存，设置为E状态（独享）。

双核读取

当多个CPU同时读取同一数据时，缓存行会被设置为S状态（共享），确保数据一致性。

数据修改

当一个CPU修改数据时，其他CPU的缓存需要被失效，以保持数据一致性。

数据同步

在数据修改后，修改后的数据需要被同步到其他CPU的缓存中，并设置为S状态。

MESI优化与问题

MESI协议虽然有效地解决了多核缓存一致性问题，但也引入了一些优化和问题。例如：

优化

E状态是一种投机性优化，可以减少总线事务的数量。

问题

状态转换可能导致缓存失效的延迟和性能问题。

存储缓存的风险与解决方案

为了应对这些问题，存储缓存（Store Buffers）被引入。它们允许处理器在等待失效确认时继续执行其他操作，但也带来一些风险：

前置风险

处理器可能会尝试从存储缓存中读取数据，但该数据尚未被提交。

无确定性

存储缓存的提交时间无法保证，这可能导致数据不一致。

硬件内存模型

为了管理失效队列和存储缓存，硬件内存模型引入了失效队列和内存屏障（Memory Barriers）。失效队列用于处理失效请求，而内存屏障用于确保失效操作在特定时机执行。

最后

通过以上讨论，我们可以看出高速缓存在现代计算机中的核心作用。它不仅提升了系统性能，还为多核和分布式计算提供了基础支持。希望本文对您对CPU高速缓存的理解有所帮助。如果您对技术细节或相关协议有更多问题，欢迎随时留言交流！

转载地址：http://lqvg.baihongyu.com/

你可能感兴趣的文章

OpenCV与AI深度学习 | 基于PyTorch实现Faster RCNN目标检测

查看>>

opencv图像分割2-GMM

查看>>

OpenMCU(一)：STM32F407 FreeRTOS移植

查看>>

OpenMMLab | 【全网首发】Llama 3 微调项目实践与教程（XTuner 版）

查看>>

OpenMMLab | 面向多样应用需求，书生·浦语2.5开源超轻量、高性能多种参数版本

查看>>

OpenPPL PPQ量化(5)：执行引擎源码剖析

查看>>

Openresty框架入门详解

查看>>

OpenResty（2）：OpenResty开发环境搭建

查看>>

openshift搭建Istio企业级实战

查看>>

Openstack(两控制节点+四计算节点)-1

查看>>

Openstack企业级云计算实战第二、三期培训即将开始

openstack虚拟机迁移live-migration中libvirt配置

查看>>

ORACEL学习--理解over()函数

查看>>

ORACLE Bug 4431215 引发的血案—原因分析篇

查看>>

oracle dblink结合同义词的用法 PLS-00352:无法访问另一数据库

查看>>

Oracle dbms_job.submit参数错误导致问题(ora-12011 无法执行1作业)

查看>>

Oracle GoldenGate Director安装和配置（无图）

查看>>