存储系统与随机存储器

存储系统与随机存储器

2

存储器的角色

在现代计算机中，主存储器处于全机中心地位当前计算机正在执行的程序和数据均存放在存储器

中。 CPU 直接从存储器取指令或存取数据。计算机系统中输入输出设备数量增多，数据传送速

度加快，因此采用了直接存储器存取 (DMA) 技术和输入输出通道技术，在存储器与输入输出系统之间直接传送数据。

共享存储器的多处理机的出现，利用存储器存放共享数据，并实现处理机之间的通信，更加强了存储器作为全机中心的作用。

3

存储器的挑战

Memory Wall

4

存储系统——系统的解决方案

存储系统与存储器存储器：提供存储能力的物理实体存储系统：各类物理存储器组成的层次化体

系（ Memory Hierarchy ）高速缓存 Cache主存外存

5

存储器的主要技术指标存储器有三个基本参数：

容量、速度、成本（价格 / 位）

存储容量：以字或字节为单位来表示主存储器存储单元的总数。常用字节数或单元数 × 位数两种方法来描述。

6

存储器的主要技术指标存储器速度

存取时间：一次存取操作所需的时间带宽 BM （最大数据传送速率，单位：位 / 秒）

MM T

wB w—— 数据存储总线宽度

内存平均访问时间 ns 级SRAM Cache1~5nsSDRAM 内存 7~15nsEDO 内存 60~80nsEPROM 存储器 100~400ns

外存平均访问时间 ms 级硬盘 9~10ms光盘 80~120ms

7

存储器的主要技术指标存储器价格

硬盘： 600~700 元 /TB内存： 200 元 /GBSRAM ： 400 元 /256KB

8

存储系统

CACHE

主存（内存）

辅存（外存）

根据各种存储器的存储容量、存取速度和价格比的不同，将它们按照一定的体系结构组织起来，使所放的程序和数据按照一定的层次分布在各种存储器中。

9

存储器的分类

按存储介质划分：半导体、磁性按存取方式划分：随机、顺序按存储器的读写功能划分：只读、读写按信息的可保存性划分：永久性、非永久

性记忆按作用划分：主存储器、辅助存储器、高

速缓冲存储器、控制存储器等

10

随机读写存储器 (RAM)

随机读写（存取）：当存储器中的消息被读取或写入时，所需要的时间与这段信息所在的位置无关。相对的，读取或写入顺序访问存储设备中的信息时，其所需要的时间与位置就会有关系（如磁带）。

静态存储器 SRAM 利用触发器实现无需动态刷新速度快、集成度低、功耗大

动态存储器 DRAM 利用 MOS 电容保存数据需要动态刷新速度慢、集成度高、功耗小

存储单元的机理不同

存储矩阵

/读写

控制器

地址译码器

地址码输

片选

/读写控制

/输入输出

¡¤¡¤

¡¤

¡¤

¡¤¡¤

11

SRAM 的基本存储单元

物理存储单元存储一位二进制信息的（ 0/1 ）的电路单元可实现为 4 晶体管、 6 晶体管等模式（ 4T/6

T)

12

可以根据 W 上有无电流来判断触发器存入信息的状态。

VCCZ

/w

T3 T4

T5 T6

T1 T2

A B

w 保持：字线保持低电位，一对位线与双稳态电路相分离。双稳态电路依靠自身的交叉反馈，保持原有状态不变。

VCCT1 导通

读出时若原来信息为“ 0”, 就有电流自位线 1 经 T5 流向 T1, 对地形成放电回路，经放大为“ 0 信号”，表明原来存入为 0 ，W 上无电流。

两个稳态： T1 导通， T2 截止为“ 0” ； T2 导通， T1 截止为“ 1”

T2 截止，从而使单元处于“ 0”态


13


字线（ Z ）控制存储单

元的通断位线（ W ）

数据存取的路径

VCCZ

/w

T3 T4

T5 T6

T1 T2

A B

w

VCCT1 导通 T2 截止，从而使单元处于“ 0”态

14

SRAM 的存储矩阵

1024 个存储单元排列成32×32 的矩阵。为了存取方便，给它们编上号。32 行编号为 X0 、 X1 、

…、 X31 ， 32 列编号为

Y0 、 Y1 、…、 Y31 。这样每一个存储单元都有了一个固定的编号，称为地址。

Z

C

15

SRAM 存储器 = 存储体 + 读写电路 + 地址译码电路 + 控制电路等。

SRAM 存储器的组成

多个存储矩阵可以按照同一地址实现存取，形成宽度为 n 的字存取机制

16

SRAM 存储器的组成存储体——存储体是存储单元的集合

各个字的同一位组织在一个芯片中，如 4096×1 位就是说 4096 个字的同一位

把 16 个 4096×1 位的芯片组织为矩阵的形式，从而组成 4096×16 的存储器。

访问机制：由选择线确定目标单元。

地址到选择信号的映射，即：地址译码

17

SRAM 存储器的组成译码

18

SRAM 存储器的组成地址译码器——将二进制代码表示的地址转换为存储

单元的选择信号，确定目标存储单元，驱动相应的读写电路。输入： CPU 地址寄存器产生的存储单元地址编码输出：目标存储单元选择信号

读/写控制

读/写放大器

存储矩阵

地址译码器

.. .

...

n

0

2n-1W

W

...

B0 B1 Bm-1

地址

可以分为单译码和双译码两类

19


读/写控制

读/写放大器

存储矩阵

地址译码器

.. .

...

n

0

2n-1W

W

...

B0 B1 Bm-1

地址

地址译码器—单译码仅含一个地址译码器译码器的输出叫字选线字选线选择某个字的所有位（一组存储单元）

n 位地址线，经过一维译码后，有 2n根选择线。

例如：地址输入线n＝4 经地址译码器译码，可译出 24＝16个状态，分别对应 16个字地址。

20

SRAM 存储器的组成地址译码器—单译码

问题：移码所需资源（译码器和选择线）增长迅速如图： 3-8译码到 4-16译码，译码设备增加一倍

仅适用于小容量存储器思考： 8+8=16 ， 8X8呢？矩阵形式是否更有效？

21

SRAM 存储器的组成地址译码器—双译码

包含两个地址译码器（ X/Y ） n 位地址线，经过二维译码后，

有 2×2n/2 根选择线可选择 2n/2×2n/2=2n 个存储字

例如： n=12 ，双译码输出状态为 212=4096 个，而译码线仅只有 2×26=128 根。

行

地

址

数

据

控

制

列地址

存储单元阵列

存储单元阵列

存储单元阵列

行

地

址

译

码

行

选

择

驱

动

存储矩阵

列 I/O电路

列选择驱动

列地址译码

数据

驱动输入数据

控制

.

...

...

字

..

多个存储矩阵可以按照同一地址实现存取，形成宽度为 n 的字存取机制

22


片选与读 / 写控制电路—用作多个存储器芯片的使能信号，以及读或写操作的选择信号。

I/O 电路—在数据总线和被选用的单元之间，用以控制被选中的单元读出或写入，并具有放大信息的作用。

驱动器—驱动挂在各条X方向选择线上的所有存储元电路。

输出驱动电路—为了扩展存储器的容量，将几个芯片的数据线并联使用；另外存储器的读出数据或写入数据都放在双向的数据总线上。这就用到三态输出缓冲器。

行

地

址

数

据

控

制

列地址

存储单元阵列

存储单元阵列

存储单元阵列

行

地

址

译

码

行

选

择

驱

动

存储矩阵

列 I/O电路

列选择驱动

列地址译码

数据

驱动输入数据

控制

.

...

...

字

..

23

SRAM 存储器芯片实例 2114： SRAM芯片，容量

为 1K4位。读操作

片选（ /cs ）有效，写（ /we ）无效，数据输出三态门打开，数据输出到外部数据总线。

写操作片选（ /cs ）有效，写（ /w

e ）有效，数据输入通路打开，数据输入信号控制指定存储单元的位线。

非工作状态片选（ /cs ）无效，数据输出端呈高阻抗，与数据总线隔离。

2114

地址线10根

数据线4根

A9～ A0

D3～ D0

CS

WE

片选线写使能

24

SRAM 存储器芯片实例

内部结构分为 4个位平面，每

个位平面有 1024个物理存储单元，构成一个 64行 16列的矩阵。

6-64行译码可以选择四个平面的同一行，4-16列译码选择四个平面的同一列

25

SRAM 存储器芯片实例

读周期时序：使能地址— > 使能片选 / 读— > 读出—

>撤销片选 / 读读周期 TRC ：两次读出的最小间隔 TCO ：从片选有效到输出数据稳定所需时间

26

SRAM 存储器芯片实例写周期

时序：使能地址 / 数据— > 使能片选 / 写— > 写入—>撤销片选 / 写

写周期 TWC ：两次写入的最小间隔 TW ：写时间，片选与写同时有效的时间

27

同步 / 异步读

28

同步 / 异步写

29

(1) 利用电容上存储电荷状态的不同来记录信息。定义为：电容充电至高电平，为 1 ；电容放电至低电平，为 0 。

(2) 读写操作即为电容的充放电过程

(3) 不用双稳态电路，可以简化结构，完成充电后可将 MOS 管断开，既可降低芯片的功耗，也使芯片的集成度得到提高。

Z

W

T CS

CD

单管 MOS 动态存储单元

速度慢、集成度高、功耗小

30

（ 1 ）写入若写入 0 ，字线为高电平，位线为低电平， CS 通过 T 放电；反之写入 1 。

（ 2 ）读出对位线预先充电（ CD)至高电平，断开充电回路。字线加高电平。若 CS充有电荷，则CS 放电，使位线电位上升，放大信号可得出 CS 为“ 1” 。若 CS 上原来无电荷，则CD 向 CS充电，位线电位下降，得出 CS 为” 0”

Z

W

T CS

CD


利用 MOS 电容存储电荷保存数据

31

读出对位线预先充电（ CD)至高电平，断开充电回路。字线加高电平。若 CS充有电荷，则 CS 放电，使位线电位上升，放大信号可得出 CS 为“ 1” 。若 CS 上原来无电荷，则 CD 向 CS充电，位线电位下降，得出 CS 为” 0”

Z

W

T CS

CD


破坏性读，需要重写（再生）

32

暂存信息：字线 Z 为低电平， T 截止。但是此时仍然有电流泄露问题，电容电荷仅可以保持数毫秒

Z

W

T CS

CD


暂存信息（ Z 为低电平）时需要不断刷新，即：读出并重写

故而称之为动态存储器，即 DRAM

33

DRAM 存储器结构

存储矩阵地址总

线

I/O缓冲

器数据总线

读写控制 / 动态刷新电路

RAS#

地址锁存

器

CAS# WE#

行列地址选择：克服大容量存储器带来的地址线激增问题

34

DRAM 存储器芯片实例

2164： DRAM芯片， 64K1 位引脚介绍

地址 8位：兼作行地址和列地址，分时复用行选：为低电平时将地址线作为行地址，送入芯片内的行地址锁存器。

列选：为低电平时将地址线作为列地址，送入芯片内地列地址锁存器。

35


内部结构四片 128X128 矩阵行 / 列译码各驱动 25

6 根选择线行 / 列地址需要依次

输入且锁存

36


读周期时序：使能地址— > 使能 RAS—> 使能读— > 使能地址— > 使能 CAS —>撤销 RAS/CAS/ 读

TRC ：读周期，两次发送行选信号之间的时间间隔 TRAC/CAS ：从发送行 / 列选信号到数据有效的时间间隔

37


写周期时序：使能地址— > 使能 RAS—> 使能写— > 使能地址 /

数据— > 使能 CAS —>撤销 RAS/CAS/ 写写周期与读周期相同，成为存取周期或读 / 写周期

38

39

DRAM 存储器的刷新

逐行刷新：设置一个刷新地址计数器，提供刷新地址，每刷新一行后，刷新地址计数器加 1 ，每个计数循环对芯片各行刷新一遍。

刷新周期：把全部存储单元都刷新一遍所允许的最大时间间隔称为最大刷新周期，按目前的工艺，这一指标约为 2ms 。

问题：如何安排刷新周期？

答案：集中刷新、分散刷新、异步刷新

40

几点要求：两次刷新时间间隔不能超过允许时间 2ms刷新优先于访存，但不能打断访存周期在刷新期间内，不准访存。

41

集中刷新

集中式刷新：在一个刷新周期内，利用一段固定的时间依次对存储器的所有行逐一再生，在此期间停止对存储器的读和写。例如：一个存储器有 1024 行，系统存取周期为 200ns 。刷新周期为 2ms 。这样，在每个刷新周期内共有 10 000个工作周期，其中用于再生的为 1024 个工作周期，用于读和写的为 8976 个工作周期。即 (2ms/200ns)-1024=8976 。

优点：主存利用率高，控制简单缺点：在集中刷新状态中不能使用存储器，形成一段死区，如果系统工作方式不允许死区，则不能用这种方式。

42

分散刷新

分散刷新：将每个存取周期分为两部分，前半期可用于正常读写或保持，后半期用于刷新。即：将各个刷新周期分散地安排于各读写周期之后。

优点：控制简单，主存工作没有长的死区。缺点：主存利用率低，工作速度约降低一倍。这是因为每个存取周期中都包含一个刷新周期，所需时间约增加一倍。如果主存所用存储芯片的读 / 写周期 tRC 为 100ns ，若采用分散刷新方式，存取周期将增至 200ns 。在 2ms 内将刷新 10000 次，远超过芯片行数，浪费很多。因此分散刷新方式只能用于低速系统中。

43

异步刷新

异步刷新：按芯片行数决定所需的刷新周期数，并分散安排在 2ms 的最大刷新周期之中。例如芯片最大行数为 128 ，可每隔 15.6µs 提出一次刷新请求，响应后就安排一个刷新周期。提出刷新请求时有可能 CPU 访存尚未结束，则稍事等待至主存有空时，再安排刷新周期进行刷新，所以称为异步刷新方式。优点：对主存利用率和工作速度影响最小，而且没有死区。虽然控制上复杂一些，但可利用系统已有的 DMA 功能去实现。因此大多数计算机系统采用异步刷新方式。另外：还可采取不定时刷新，在主机不访存的时间内刷新，取消了死区，但控制极其复杂。

44

三种方式实例比较

存储单元 1024 个，排成 32×32 阵，存取周期 500ns ，刷新按行进行，每刷新一行用一个存取周期 500ns ，共刷新 32 行即 32 个存取周期。集中式 2ms/500ns=4000 个周期

4000-32=3968 个， R/W 32 个，刷新

45

分散式按上例：存取周期 500ns ，刷新一行 500ns ，系统周期： 1μs

存储单元 1024 个，排成 32×32 阵，存取周期 500ns ，刷新按行进行，每刷新一行用一个存取周期 500ns ，共刷新 32 行即 32 个存取周期。

刷新间隔为 32μs

周期 0 周期 1 周期 31

46

存储单元 1024 个，排成 32×32 阵，存取周期 500ns ，刷新按行进行，每刷新一行用一个存取周期 500ns ，共刷新 32 行即 32 个存取周期。异步式在 2ms 的时间内，把存储单元分散的刷新一遍。 32×32 阵，2ms/32=62.5μs （每行刷新的平均间隔）

62μs 0.5μs

刷新间隔（ 2ms ）

62.5μs

47

注意

刷新对 CPU是透明的，原来存在的事物或属性，从某个角度看好像不存在了。

刷新按行进行，不需列地址刷新和读出操作即相似又不同

读出对电容充电，刷新也充电，但仅补充电荷，无信息输出

48

随机读写存储器 (RAM)

静态存储器 SRAM利用触发器实现无需动态刷新速度快、集成度低、功耗大

动态存储器 DRAM利用 MOS 电容存储电荷保存数据需要动态刷新速度慢、集成度高、功耗小

49

DRAM 的优点：1.使用简单的单管单元作为存储单元，每片存储容量较大，约是 SRAM的 4倍。引脚数比 SRAM要少，它的封装尺寸也可以比较小。存储容量要比用 SRAM大 4倍以上。

2.DRAM的价格比较便宜，大约只有 SRAM的 1/4。3.DRAM所需功率大约只有 SRAM的 1/6。

DRAM 的缺点：1.速度比 SRAM要低 2.DRAM需要再生，不仅浪费了宝贵的时间，还需要有

配套的再生电路，它也要用去一部分功率。

DRAM 与 SRAM 比较

DRAM 主要用于大容量内存， SRAM 用作小容量的高速存储器。

50

各种随机存储器 DRAM EDO RAM （ Extended Data Out RAM ，扩充数据输出存储器） BEDO RAM （ Burst ，突发扩充数据输出存储器） SDRAM （ Synchronous DRAM ，同步）与系统时钟同步，以相

同的速度工作，性能较 EDO 提高 50%

DDR （ Dual Data Rate ，也称 SDRAM II ）以 SDRAM 为基础，速度和容量明显提高，允许在时钟的上升沿和下降沿读出数据，所以速度是准 SDRAM 的 2倍。

CDRAM(Cached)把高速的 SDRAM 集成到 DRAM芯片中，作为DRAM 内部的缓存。

RDRAM(Rambus DRAM)

51

谢谢！

Documents

存储系统与随机存储器