Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Copyright 2008 FUJITSU LIMITED
ソフトエラー評価技術・対策技術の研究開発戦略
富士通セミコンダクター㈱上村 大樹Fujitsu Semiconductor LTD. E-mail: [email protected]
1 Copyright 2008 FUJITSU LIMITED
� ソフトエラーについて
� ソフトエラー評価技術
� ソフトエラー対策技術
ソフトエラーの測定技術と対策技術
2 Copyright 2008 FUJITSU LIMITED
ソフトエラーのメカニズム
宇宙線起因の環境中性子
中性子線α線IC材料中の放射性不純物から
中性子α粒子
N
P
N
P
NN
核反応
α線、中性子により発生する電子or正孔が
ドレインに収集され電流ノイズが発生する
3 Copyright 2008 FUJITSU LIMITED
ソフトエラーと半導体
� ソフトエラーに関する規準
� JESD89A(JEDEC Standard: Measurement and Reporting of Alpha Particle and Terrestrial Cosmic Ray-Induced Soft Errors in Semiconductor Devices)
� 半導体産業の特徴
� 製造技術が完成する前から、設計作業が始まることがある。
� 非常に短いサイクルで、新しいテクノロジーが生まれる。
4 Copyright 2008 FUJITSU LIMITED
ソフトエラーの評価
線量評価
実測定
シミュレーション
実験
シミュレーション
デバイス
材料中α線量測定
環境中性子線量
α線 中性子
加速試験
フィールド試験
実環境、実験環境線量計算
加速試験時中性子線量
エラー率計算
5 Copyright 2008 FUJITSU LIMITED
� 中性子線量測定
� 中性子フィールド試験
� 中性子加速試験
中性子ソフトエラーの評価
6 Copyright 2008 FUJITSU LIMITED
中性子線量は一定でない
� 時期(太陽周期)• 11年周期で、13%変化
� 位置(磁気緯度)• 日本は、NYの6~7割
� 高度(大気遮蔽)
• 高度が高いと線量が上がる。
• 800m上昇で2倍
� 建物(遮蔽)• 3F中1Fで、半分になることも
EXPACS + Google Earth
� JESD89A� 13cph/cm2(10Mev以上の中性子)でreport
• @NY、open air, sea level
7 Copyright 2008 FUJITSU LIMITED
環境の中性子線測定
� ボナーボール検出器(低エネルギー)と、シンチレータ検出器(高エネルギー)の組み合わせにより、幅広いスペクトルの環境中性子線量を測定することが可能。
[R. Takasu, 2007]
8 Copyright 2008 FUJITSU LIMITED
中性子ソフトエラーのフィールド試験
� 高地で行うことにより、データ取得速度を上げる、α線の影響を相対的に低くすることが可能。
� 線量を同時計測することにより、より正確なデータ取得が可能。
[2008 Y. Tosaka, et al.]
@Mt. Mauna Kea (4700m)
9 Copyright 2008 FUJITSU LIMITED
短時間で結果が得られ、低いエラー率のデバイスも評価が可能。・ソフトエラー対策をほどこした回路・製品
Ring cyclotronAVF
cyclotr
on
Quasi-mono
neutron beam
spallation
neutron beam
RCNP
LANCE
Sea level (multiplied by 1.5 x 10^8)
1E+1
1E+2
1E+3
1E+4
1E+5
1E+6
Neutrons [n/cm2/s/M
eV]
1 10 100 1000
Energy [MeV]
[Y. Iwamoto, 2010]
� JESD89A� 試験施設:LANSCE、TRIUMF, RCNP, (ANITA)→同じスペクトルとしている
� 線量は10MeV以上の中性子数で規格
[RCNP@Osaka Univ.]
中性子加速試験
10 Copyright 2008 FUJITSU LIMITED
中性子加速試験例(ラッチ回路)
� Spallation neutron beam
� Research Center for Nuclear Physics (RCNP) at Osaka University
� More than 200k bit flip-flop on the test chip
Triple-well
Twin-well
[T. Uemura, 2010]
11 Copyright 2008 FUJITSU LIMITED
0.1
1
10
0.6 0.8 1 1.2 1.4 1.6
Voltage [V]
Norm
alized SER
28nm DATA0
28nm DATA1
45nm DATA0
45nm DATA1
65nm DATA0
65nm DATA1
Normalized with
� SER decreases with technology advancing
� In 45nm and 28nm technologies, SER on DATA0 is more than twice higher than on DATA1.
� SiGe process is used on PMOS in 45nm and 28nm process.
� PMOS width in 45nm and 28nm is shorter than in 65nm.
SER trend on sequential element
[T. Uemura, 2011]
12 Copyright 2008 FUJITSU LIMITED
SER Critical part on a latch
� A latch consists of un-balanced feedback loop.
� Feed-back gate is sensitive to soft error
� In DATA0, SER on NMOS of feedback gate is dominant.
� In DATA1, SER on PMOS of feedback gate is dominant.
Din
CK
CK
CK
Dout
Feed-through gate
Feed-back gate
CK
high
DATA0
low
NMOS
13 Copyright 2008 FUJITSU LIMITED
1
10
100
1000
10000
(i)
65nm
1.2V
(ii)
45nm
1.1V
(iii)
28nm
0.85V
SER [A.U.]
Single-FF(SBU)
TMR-FF(MCU)
Technology trend of redundancy technique
� SBU rate decreases with technology advancing.
� MCU rate on the horizontal layout does not so change with technology advancing.
� Soft-error mitigation techniques by redundancy techniques are effective even on advanced technologies.
FF FFFF
FF
[T. Uemura, 2011]
14 Copyright 2008 FUJITSU LIMITED
Spallation neutron beam
Internal view of PW650 server
CPU module placement
[2007 H. Ando, et al.]
中性子加速試験の例2
15 Copyright 2008 FUJITSU LIMITED
90nm SPARC64 V
� Microprocessor for Mission Critical servers
�High reliability, High data integrity
�Introduced in 2005
� Major specifications
�90nm Bulk CMOS, 10 Cu layers
�18.46mm x 15.94mm
�~1.0V Vdd, 2.16GHz Clock
�~240K Latches
�L1$: 128KB+128KB
�L2$: 4MB
[2007 H. Ando, et al.]
16 Copyright 2008 FUJITSU LIMITED
� 93.6% of estimated Latch flips were Vanished
� Noticed Errors were 6.4% ⇒ Derating factor = 0.064.
� Among Noticed Errors, 90% of them Detected
� Among Noticed Errors, 76% of them Recovered
� Only 1.5% of estimated latch flips resulted in Fatal errors
Noticed
6.4%
Recovered76%
(4.9%)
Fatal 24%(1.5%)
Vanished
93.6%
Error Detected90%
(5.8%)
Crash w/o Log 10%
Among
Noticed Errors
CPU(SPARC)におけるソフトエラーのリカバリ
[2007 H. Ando, et al.]
17 Copyright 2008 FUJITSU LIMITED
� α線量測定
� α線フィールド試験
� α線加速評価
α線ソフトエラーの評価
18 Copyright 2008 FUJITSU LIMITED
α線量測定
� 試料にトラック板(CR-39)を貼りつけて、α線がつくる飛跡をとらえる。
� 飛跡はエッチングによって目に見えるようにし、顕微鏡で数える。
トラック板
顕微鏡
試料
試料に曝露
エッチピットの例
αααα
飛跡生成
トラック板
試料
トラック板
エッチング液
エッチピット数、曝露時間、トラック板の面積から、α線量率を計算
エッチング 計数
飛跡を可視化
[R. Takasu, 2005]
19 Copyright 2008 FUJITSU LIMITED
α線加速試験
Flux attenuation profile on a 5mm X 5mm die(size of source d=5mm at 1mm)
� α線源を使用し、チップにα線を照射
� 被曝線量から、加速率を算出し、エラー率を計算。� Wire Packageのみで実施可能。
[2008 T. Uemura]
Die
Alpha-source241Am
Package
Alpha-ray
20 Copyright 2008 FUJITSU LIMITED
HUF(Fot Under Fill)による加速試験
� アンダーフィルにα線源(210Po, 210Pb)を混入して、評価
� Bump Packageの製品に対しても試験が可能
� POWER 7(IBM)の評価などで実施されている。
Flip-chip
Carrier
C4C4C4
Under fill
[M. S. Gordon, 2008]
21 Copyright 2008 FUJITSU LIMITED
α線ソフトエラーのフィールド試験
� 山を貫通するトンネルの中央で測定することにより、中性子線量を1/100程度に下げる。
� α線ソフトエラーのみを検出する。
� 非常に低いエラー率評価になるため、長い期間が必要。
中性子線量:0.14 [cph/cm2]
[大塔コスモ研究所]
22 Copyright 2008 FUJITSU LIMITED
� シミュレーションの概要
Simulation
23 Copyright 2008 FUJITSU LIMITED
Simulation
� シミュレーションのメリット
� 作っていないものに対して評価できる。
� 設計前にエラー率がわかる。
� ありとあらゆる対象の評価が可能。
� ソフトエラーの発生過程
� 放射線の飛来
� 核反応
� 生成粒子
� デバイス内でのキャリア
� 電流ノイズ
� 回路・システム・プログラム
n
N
P
N
核反応
24 Copyright 2008 FUJITSU LIMITED
ソフトエラーシミュレーション
粒子輸送コード(GEANT 4, PHITS)
放射線の飛来
核反応
電荷発生
デバイス内でのキャリア
電流ノイズ
回路
システム・プログラム
TCAD(Sentaurus, HyENEXSS等)
SPICE(SPICE, fast SPICE等)
SER simulator(SEMM, NISES, CREAM, TFIT等)
EDAツール、ハードエミュレータ
25 Copyright 2008 FUJITSU LIMITED
N-nucleus reactiondata
particle
Circuit Simulation
Structure data
Device structure
data
SER SPICE
Sensitive Volume
Monte Carlosimulation
AMD
TCAD
SRIM
MCデバイスSim.
Simulator例 (NISES)
[1997 Y. Tosaka]
26 Copyright 2008 FUJITSU LIMITED
電子デバイスができるまで
Standard cell (SRAM, FF)
Transistor
system
RTL
本当に知りたいエラー率はココ
加速試験(ただし開発後期)
加速試験フィールド試験
Othercard
線量評価等
Chipsoftware
GDS, Netlist
Die Assembly
27 Copyright 2008 FUJITSU LIMITED
ソフトエラー評価のまとめ
�フィールド試験評価
�最も信頼されるデータ
�評価には長い時間と、大量のサンプルが必要になる。
• 1種類の素子に対して、1000sample、1yearが必要
�加速試験評価
�低いエラー率を、短時間で評価することが可能
• 1種類のデバイスに対して、4~40[sample]、10~[hour]
→対策効果の検証、実製品の評価
�シミュレーション
�全ての半導体デバイスの構成要素、全ての製品を、実験することは不可能。テクノロジの進歩が早く、実物が完成する前に評価する必要がある。
28 Copyright 2008 FUJITSU LIMITED
� 様々なソフトエラー対策
� 回路によるソフトエラー対策
� ソフトエラー対策効果の評価
ソフトエラー対策
29 Copyright 2008 FUJITSU LIMITED
ソフトエラー対策
� RAMにおけるソフトエラー対策
�ECC (Error correction code)
→パリティビットを付加しエラーを検出(detection)&修正(correction)
(例:64bit + 8bitのパリティ→1bit error correction, 2bit error detection)
� Logicにおけるソフトエラー
�スタンダードセルレベルの対策
• Latch →内部冗長回路機能をもった対策Latchを使用。
• 組合せ回路 →2重化、ノイズフィルター
�上位レベルの対策
• 冗長:TMR (Triple module redundancy) → ロジックの3重化
• エラーチェック:HIR (Hardware Instruction Retry)→ エラーを検出した場合のみ命令を再発行
30 Copyright 2008 FUJITSU LIMITED
ラッチにおけるソフトエラー対策
� Multi latch technique
� 2000: A multi-latch flip-flop using a C-element was proposed by T. Maruyama.
� 2006: A reuse paradigm (BISER) was proposed by S. Mitra.
� Multi node latch
� 1990: A multi-node latch was proposed by M. Katoh and K. Okabe.
� 1994: An multi-node latch with 8 transistors was proposed by T.Masson and R. Ferrant
� 1996:T. Calin, M. Nicolaidis, R. Velazco (DICE).
31 Copyright 2008 FUJITSU LIMITED
対策ラッチの課題
[07. N. Seifert]
� テクノロジ世代が進むほど、同時に2カ所でノイズが発生する確率が上がる。
� →回路での対策効果が低下する。
� クロックバッファーで発生したSETの問題も無視できない。
1.0 1.2 1.4
VDD [V]
Norm
aliz
ed S
ER
[A
. U
]
Conventional
This work
ALL 0
ALL 1
ALL 1ALL 0
0
1
0.8
0.6
0.4
0.2
[07. T. Uemura]
32 Copyright 2008 FUJITSU LIMITED
Cancellingキャンセリング
エリアクリティカル
エリアクリティカル
エリア
複数個所での電荷収集を防止する技術
クリティカルな二つのノードの間に、それをキャンセリングするノードを間に配置。
[T. Uemura, 2010]
33 Copyright 2008 FUJITSU LIMITED
� 二つのクリティカルエリアでノイズが発生すると、ラッチの保持データは反転。
� 二つのクリティカルエリアと同時に、一つのキャンセリングエリアでノイズが発生すると、ラッチの保持データは反転しない。
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Time [pico sec]
Voltage [
V]
0 20 40 60 80 100Time [pico sec]
0 20 40 60 80 100-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Voltage [
V]
対策ラッチにおける、複数個所での電荷収集
2 critical area & 1 cancelling area2 critical area
データが反転
データが反転しない
[T. Uemura, 2010]
34 Copyright 2008 FUJITSU LIMITED
Data input
Data output
CK
CK
DICE-base circuit
� クロックバッファーを2つに分割し、クロックバッファでのSETの影響を抑える。
クロック起因のソフトエラーの防止技術
[T. Uemura, 2010]
35 Copyright 2008 FUJITSU LIMITED
1
10
100
1000
0.7 0.8 0.9 1.0 1.1
Voltage [V]
SE
R [
A.U
.]
Un-robust latch DATA1Un-robust latch DATA0SEILA DATA1SEILA DATA0
�SEILA (Soft Error Immune Latch)は、さらに10倍以上ソフトエラー耐性が向上した。
0.007
0.102
1
SEU
<0.001SEILA
0.090以前の対策ラッチ
0.100普通のラッチ
SET
@clock
SEILA (Soft Error Immune Latch)の評価
[T. Uemura, 2010]
36 Copyright 2008 FUJITSU LIMITED
Robust latch (SEILA: Soft error immune latch)
� Collection charge on one node is not upset.
� (a) critical PMOSs are not separated by STI.
� (b) critical PMOSs are separated by STI.
� (b)DHC-SEILA is sensitive to CCM only on PMOS.
Nwell
CK
CK
CK
CK
Dp1
Dp2
CK
Nw
ell
CK
CK
CK
(a)robust(SHC)
Dp2: distance between critical PMOSs(b1)0.56um, (b2)0.34um
Pwell
Nwell
Pwell
DHClatch
(b)DHC-SEILA
[T. Uemura, 2011]
37 Copyright 2008 FUJITSU LIMITED
SER mitigation [email protected]
� SER on (a) is dramatically high.
� Separation by STI is important for mitigating SER.
� SER on (b1) is higher than on (b2)
� Shorter Dp2 become higher SER.
0.00
0.02
0.04
0.06
0.08
0.10
0.12
(a) robust (b1) SEILAw long Dp2
2well
3wellN
orm
aliz
ed
SE
R
Dp2Dp2
Sensitive drain
(b2) SEILAw short Dp2
SERs are normalized with SER on (o) un-
robust lathes
[T. Uemura, 2011]
38 Copyright 2008 FUJITSU LIMITED
まとめ
� ソフトエラーを評価・対策を行うにはありとあらゆる技術が必要。
� 評価
• 目的にあわして、最適な評価方法を選択する必要がある。
• 「これだけやればOK」ということはない。
� 対策
• 求められる信頼性、許容されるコストを、正しく評価し、最適な(必要十分の)対策方法を採ることが重要。