22
下山 武司 富士通研究所 セキュアコンピューティング研究部 準同型暗号の実装とMontgomery, Karatsuba, FFTの性能 Copyright 2015 FUJITSU LABORATORIES LTD. x86_64勉強会 2015315日、秋葉原UDX10F

準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

Embed Size (px)

Citation preview

Page 1: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

下山 武司

富士通研究所

セキュアコンピューティング研究部

準同型暗号の実装とMontgomery, Karatsuba, FFTの性能

Copyright 2015 FUJITSU LABORATORIES LTD.

x86_64勉強会2015年3月15日、秋葉原UDX10F

Page 2: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

準同型暗号

研究背景

クラウドやビッグデータ分析などの進展に伴い、機密データ利活用とプライバシー保護の両立が大きな課題

準同型暗号

暗号化したまま加算や乗算が可能な暗号技術

クラウドコンピューティング分野への適用が期待

Copyright 2015 FUJITSU LABORATORIES LTD.

E:準同型暗号化関数E(a+b) = E(a) + E(b)E(a×b) = E(a)×E(b)85点→E(85)

E(85)E(72)E(89)

暗号化したまま集計

E(246)

一度も元データに戻さず処理可能⇒ データの機密性を保持したまま計算可能(クラウド上暗号化)

合計246点

復号

72点→E(72)

89点→E(89)

準同型暗号化

2

Page 3: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

適用例1:医療データ統計計算

医療や生化学データといった機密情報のデータ分析などの複数の企業にまたがった情報活用を促進

医療費/特定疾病/健診結果/生活習慣等の統計計算等

病院A 健保B

有り :1

無し :0

メタボの人は肝炎になりやすい

暗号化したデータを送信するだけで、分析結果が得られる。

暗号化したまま内積計算

復号

暗号化 暗号化

内積=肝炎かつメタボの人の数

病歴等が見える

希少データから個人特定の可能性

Copyright 2013 FUJITSU LABORATORIES LTD.3

Page 4: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

適用例2:秘匿生体認証

生体認証特徴コード

手のひら静脈画像から2048ビットの特徴コードを抽出し照合する認証技術

簡単な比較計算により、高速照合が可能

一つの生体情報から複数の特徴コードを生成できるため、生体認証サービスごとに異なる特徴コードを登録することが可能

準同型暗号で秘匿しながら照合処理が可能

画像正規化(位置・変形補正)

特徴コード生成

変換条件

01010010・・・’0’と’1’に変換

照合用特徴コード(2048ビット)

手のひら静脈画像

特徴成分抽出

Copyright 2013 FUJITSU LABORATORIES LTD.4

Page 5: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

準同型暗号方式の種類(3タイプ)

Copyright 2015 FUJITSU LABORATORIES LTD.

完全準同型(任意の暗号演算)

Somewhat準同型(限定回の

暗号加算・乗算)

加算準同型(暗号加算のみ)

(RSA, ElGamal, Paillier,Okamoto-Uchiyama, etc.)

機能性(適用例)

集計(電子投票)

統計計算など(医療データ統計分析

・生体認証)

高度な分析(スパムメール対策)

処理時間

機能性の向上に伴い、処理時間が大きく劣化

遅い(暗号化に数分~数十分)

速い

5

Page 6: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

SHE準同型暗号

SHE (Somewhat Homomorphic Encryption) 暗号化したまま、限定された演算可能回数(N)のデータ操作可能な暗号

基本演算の違う方式が、これまでにいくつか提案されている

• BGN(N = 1) :ペアリングの計算

• 整数ベース :代数的整数の計算

• イデアル格子ベース :多倍長整数を法とした整数計算

• Ring-LWEベース :正標数係数多項式演算

Copyright 2015 FUJITSU LABORATORIES LTD.

本発表のターゲット

6

Page 7: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

Ring-LWEベース準同型暗号方式

鍵・パラメータ生成

Rq=GF(q)[x]/(xn+1), 秘密鍵sk1=s, 公開鍵pk1 = (a0, a1)• a0 = -(a1s + te) in Rq, s, a1, e: 鍵生成時の乱数 in Rq,• t:平文空間の法、q:係数体の位数

暗号化

平文 m の暗号文を Epk(m) = (c0, c1) (n-1次多項式の組) • c0 = a0u + tg + m (in Rq), c1 = a1u + tf (in Rq)• u, g, f: 暗号化時の乱数

暗号文処理

平文m, m’に対する暗号文の準同型乗算処理

• Epk(m×m’)= (c0, c1)*(c’0, c’1) = (c0 c’0 , c’0 c1 +c1 c’0 ,c’1c’1 ) (in Rq)• Epk(m+m’)= (c0, c1)+(c’0, c’1) = (c0 + c’0 ,c’1 + c’1 ) (in Rq)

復号

暗号文Epk(m) = (c0, c1, c2 ) に対する復号処理

• Decs(c0, c1, c2) = c0 +c1s+c2s2 (mod Rt) (in Rq)

多項式の乗算

正標数(mod q)係数の多項式

7

Page 8: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

Ring-LWE準同型暗号の実装

実装上の基本パラメータ

Rq=GF(q)[x]/(xn+1)• n : 剰余多項式の次数

• q : 係数の剰余(素数)

複数パラメータを実装

n=2048, q: 61-bit 素数, (27*(256) + 1) n=4096, q: 65-bit 素数, (31*(260) + 1) n=8192, q: 69-bit 素数, (9*(265) + 1) n=16384, q: 73-bit 素数, (31*(268) + 1)※nが4096以上の場合は、q の大きさが 64bit を超えている(;_;)※qが小さいと復号処理に失敗するので、仕方がない。

※素数qは、GF(q)上の2冪乗根(FFTで必要)が計算しやすい値としている。

Copyright 2015 FUJITSU LABORATORIES LTD.8

Page 9: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

実装上の注意点

基本演算:正標数係数多項式の乗算剰余処理

多項式乗算:FFT or Karatsuba係数乗算剰余:Montgomery乗算

mod xn+1 : 係数をずらして引くだけ

実装上の工夫

乗算処理回数の削減(乗算3回→乗算1+事前計算) • 2a×b + a×c1 + b×c2 → 1/2((2a + c2)×(2b + c1) – c1×c2)

実装パラメータ・コードの最適化

• パラメータのMontgomery化• 係数は“mul” (64bit*64bit)とKaratsubaの併用で 96bit*96bit 乗算処理

• ガウス乱数を一様乱数の平均値で代用

• その他、もろもろ

サボった点

• メモリアクセス速度の最適化は未実施

では、多項式FFT or Karatsubaはどちらが早い?

Copyright 2015 FUJITSU LABORATORIES LTD.9

Page 10: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

KaratsubaとFFTを実装してみた

Copyright 2015 FUJITSU LABORATORIES LTD.10

1.E+00

1.E+01

1.E+02

1.E+03

1.E+04

1.E+05

1.E+06

1.E+07

1.E+08

1.E+09

1 4 16 64 256 1024 4096 16384

FFT 73bit

FFT 61bit

Karatsuba 73bit

Karatsuba 61bit

Karatsuba

FFT801次 (61bit prime)

1563次 (73bit prime)

多項式の次数

正標数係数多項式乗算

cloc

k cy

cle

Intel Xeon X3480, 3.07GHz, 16GB memory, x86_64 asm, gcc on Cent OS 6.1

※傾き Karatsuba: 1.6279, FFT:1.0662, (理論値は各々1.584, 1.0)

今回扱う範囲ではFFTの方が速そう

Page 11: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

実装上の細かい点

Montgomery乗算 (乗算剰余) bビット素数p, に対し、a×b/R mod p, (R =2b)を乗算3回で行う計算法

• (x,y に対して xy mod p を計算する際、a = xR, b = yRとし ab/R=(xy)Rを計算)

• m = -p-1 mod R (事前計算)1. T=a×b2. U=T×m mod R, (Rは2巾なので mod Rは簡単)3. (T+U×p)/R を出力 (カッコ内は必ずRで割り切れるのでシフトのみ)

• x86_64実装でのちょっとした工夫

• 3.の乗算下位は不要。1.の下位ワードと(-1)との加算によるcarry registerで代用

• 3.の加算結果がピッタリ上位registerに来るように入力を調整、シフト不要

Copyright 2015 FUJITSU LABORATORIES LTD.

movq (a), %raxmulq (b)movq %rax, %rcxmovq %rdx, %rbximulq (m), %raxmulq (p)add (-1), %rcxadc %rdx, %rbxmovq %rbx, (ret)

※左コードは16clock程度(同様にp < 295では36clock程度)

Montgomery乗算(p<263)のコード例

11

Page 12: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

FFT変換処理のMontgomery化

Copyright 2015 FUJITSU LABORATORIES LTD.12

Input f[];Output g[];

for (i=0; i<n; i++) { v[i] = f[i]; }for (k=(n>>1), kk=0; k>=1; (k=k>>1), kk++) {for (j =0; j<k; j++) {

u = 1;for (i=0; i<n; i+=(k<<1)) {

x = v[i+j]; y = v[i+j+k];s = u*y mod q;t[i] = x + s mod q;t[i+k] = x – s mod q;u = u * w[kk] mod q;

}for (i = 0; i< (n>>1); i+=k ) {

v[i+j] = t[i<<1];v[i+j+(n>>1)] = t[(i<<1)+k];

}}

}for (i=0; i<n; i++) { g[i] = v[i]; }

Montgomery空間(x→xR)で処理

Page 13: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

準同型暗号処理性能

Ring-LWEベース

パラメータ(n,q,t) 鍵生成 乗算 暗号化 秘匿内積 復号

(2048,61-bit prime, 211) 3.50ms 1.56ms 3.65ms(31.2KB)

5.31ms(46.8KB)

3.47ms

(4096,65-bit prime, 212) 11.74ms 11.09ms 23.03ms(66.6KB)

34.34ms(99.8KB)

22.17ms

(8192,69-bit prime, 213) 24.82ms 23.17ms 48.07ms(141.3KB)

71.25ms(212.0KB)

46.35ms

(16384,73bit prime, 214) 54.50ms 51.97ms 107.25ms(299.0KB)

159.45ms(448.5KB)

103.94ms

CPU: Intel Xeon X3480 at 3.07 GHz, 16 GBmem

実装完了。これって速いのか?遅いのか?

別の準同型暗号 (イデアル格子版)と比較してみる

Copyright 2015 FUJITSU LABORATORIES LTD.

※ 秘匿乗算 0.19秒(n=2048) ,0.95秒(n=4096) by Magma, Core2 [email protected] in [1], [1] Naehrig, et.al., “Can homomorphic encryption be practical?”, CCSW2011

13

Page 14: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

イデアル格子準同型暗号スキームの構成

鍵生成

n: 格子次元, t: ビット長(鍵生成パラメータ)

公開鍵pk = (d, r), 秘密鍵sk = wi (V×W =W×V= dを満たすWの1成分)

• vi: t-ビット乱数, d: 行列Vのdeterminant

Copyright 2015 FUJITSU LABORATORIES LTD.

10

0100

1

nr

rd

B

021

201

110

vvv

vvvvvv

V nn

n

HNF変換

公開鍵

暗号化

平文情報(整数): b → 暗号文:b + s・Σui・ri mod d

復号

暗号文: c → (c・sk mod d) mod s

暗号操作

暗号加算:c1 + c2 mod d, 暗号乗算: c1×c2 mod d

ノイズ(ui:乱数)平文空間サイズ

逆変換は困難

14

Page 15: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

暗号化処理の実装について

基本演算は、多倍長整数の乗算剰余と加算

暗号化:平文 b → 暗号文c = b + s・Σui・ri mod d暗号操作:加算 c1+c2 mod d、乗算 c1×c2 mod d復号:暗号文 c → 平文 b = (c×sk mod d) mod s

法 d の大きさについて• (n,t)=(2048,37)→ d: 75776ビット

• (n,t)=(4096,37)→ d:151182ビット

• (n,t)=(8192,41) → d:335827ビット

• (n,t)=(16384,45)→d:737280ビット

実装の肝は、超巨大な整数演算!

乗算剰余 : Montgomery 乗算

多倍長乗算 : Karatsuba

※FFTは?Karatsubaと、どちらが速い?両方実装して比較しよう!

Copyright 2015 FUJITSU LABORATORIES LTD.

超巨大!

15

Page 16: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

法dの例 (n=2048, 75776bit)

Copyright 2015 FUJITSU LABORATORIES LTD.16

d=

Page 17: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

再度KaratsubaとFFTの両方を実装してみた

Copyright 2015 FUJITSU LABORATORIES LTD.17

n×nビット多倍長整数乗算(固定ビット長)の処理時間

Intel Xeon X3480, 3.07GHz, 16GB memory, x86_64 asm, gcc on Cent OS 6.1

n bit

今回扱う範囲では、FFTは追いつかなそう。

※傾き Normal : 2.066, Karatsuba: 1.616, FFT:1.145, (理論値は各々2.0, 1.584, 1.0)

cloc

k cy

cle

1.E+00

1.E+01

1.E+02

1.E+03

1.E+04

1.E+05

1.E+06

1.E+07

1.E+08

1.E+09

1.E+10

1.E+11

16 128 1024 8192 65536 524288 4194304 33554432

FFT

Karatsuba

Normal

21638213bit

327bit

Page 18: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

実装上の細かい点

Karatsuba係数は整数演算でOK

• 正標数係数多項式演算より圧倒的に高速

FFT正標数係数多項式のFFTを利用

係数は63ビット素数を法とした剰余演算

整数の桁上がり制御にCRT(Chinese Remainder Theorem)を使用

• (63ビットFFT+CRT処理)×T回時間 < 63×Tビット係数FFT処理時間

• CRTの実装にはGarner’sアルゴリズム(前処理による高速化)を利用

n次多項式で演算可能な最大整数は62×(n/2) ビット

Copyright 2015 FUJITSU LABORATORIES LTD.

次数 最大bit長 処理clock数

2 62 4802

4 124 12818

8 248 31948

16 496 75146

32 992 170240

64 1984 380742

18

Page 19: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

準同型暗号処理性能

イデアル格子ベース

Copyright 2013 FUJITSU LABORATORIES LTD.

パラメータ(n, t)

鍵生成 (一括)暗号化

秘匿内積 復号 暗号文サイズ

(2048, 37) 590 ms 6.33 ms 4.99 ms 2.53 ms 9.5 KB

(4096, 37) 2250 ms 24.43 ms 14.91 ms 7.49 ms 19 KB(8192, 41) 8910 ms 105.92 ms 54.58 ms 27.36 ms 38 KB(16384, 45) 34610 ms 488.88 ms 217.65ms 108.96 ms 76 KB

CPU: Intel Xeon X3480 at 3.07 GHz, 16 GBmem

先ほどの準同型暗号 (Ring-LWE版)と比較すると

19

Page 20: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

Ring-LWE版 (暗号文:正標数係数多項式)

イデアル格子版

(暗号文:多倍長整数)

パラメータ(n,q,t) 鍵生成 乗算 暗号化 秘匿内積 復号 暗号文サイズ

(2048,61, 211) 3.50ms 1.56ms 3.65ms 5.31ms 3.47ms 31.2KB(4096,65, 212) 11.74ms 11.09ms 23.03ms 34.34ms 22.17ms 66.6KB(8192,69, 213) 24.82ms 23.17ms 48.07ms 71.25ms 46.35ms 141.3KB

(16384,73, 214) 54.50ms 51.97ms 107.25ms 159.45ms 103.94ms 299.0KB

パラメータ(n, t) 鍵生成 乗算 暗号化 秘匿内積 復号 暗号文サイズ

(2048, 37) 590 ms 2.46 ms 6.33 ms 4.99 ms 2.53 ms 9.5 KB

(4096, 37) 2250 ms 7.40 ms 24.43 ms 14.91 ms 7.49 ms 19.0 KB(8192, 41) 8910 ms 27.18 ms 105.92 ms 54.58 ms 27.36 ms 42.1 KB(16384, 45) 34610 ms 108.63 ms 488.88 ms 217.65ms 108.96 ms 92.4 KB

準同型暗号処理性能比較

約三桁の差!処理性能は数倍以内漸近的にはRing-LWEの方が高速

暗号文はイデアル格子が小さい

Copyright 2015 FUJITSU LABORATORIES LTD.

勝ち 負け 大敗

20

Page 21: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

考察とまとめ

多項式と整数のKaratsuba, FFTを比較

(正標数)多項式: 801次(61ビット)、1563次(73ビット)で逆転

整数:約2000万ビット(約650万桁)程度で逆転

二種類の準同型暗号Ring-LWE版とイデアル格子版を比較

暗号化・復号・秘匿内積の処理性能は数倍以内

• 漸近的にはRing-LWE版の方が高速

暗号文サイズは、イデアル格子の方が小さく、約1/3程度

鍵スケジュール部の処理は、Ring-LWEの方が圧倒的(3桁)に速い

Copyright 2015 FUJITSU LABORATORIES LTD.21

Page 22: 準同型暗号の実装とMontgomery, Karatsuba, FFT の性能

Copyright 2015 FUJITSU LABORATORIES LTD.Copyright 2010 FUJITSU LIMITED2222