コンパイラ演習 第 6 回 ( 2011/11/17)

Preview:

DESCRIPTION

コンパイラ演習 第 6 回 ( 2011/11/17). 中村 晃一 野瀬 貴史 前田 俊行 秋山 茂樹 池尻 拓朗 鈴木 友博 渡邊 裕貴 潮田 資秀 小酒井 隆広 山下 諒蔵 佐藤 春旗 大山 恵弘 佐藤 秀明 住井 英二郎. 今日の内容. 実マシンコード生成 アセンブリ生成 ( emit.ml ) スタブ・ライブラリとのリンク 末尾呼出し最適化 関数呼出しからの効率的なリターン ( emit.ml ) CPS 変換 種々の簡単な拡張 MinCaml にない機能. 実マシンコード生成. プログラム本体のアセンブリを生成 - PowerPoint PPT Presentation

Citation preview

コンパイラ演習第 6 回

(2011/11/17)

中村 晃一 野瀬 貴史 前田 俊行秋山 茂樹 池尻 拓朗鈴木 友博 渡邊 裕貴

潮田 資秀小酒井 隆広

山下 諒蔵 佐藤 春旗大山 恵弘 佐藤 秀明

住井 英二郎

今日の内容

• 実マシンコード生成– アセンブリ生成 (emit.ml)– スタブ・ライブラリとのリンク

• 末尾呼出し最適化– 関数呼出しからの効率的なリターン (emit.ml)– CPS 変換

• 種々の簡単な拡張– MinCaml にない機能

実マシンコード生成

1. プログラム本体のアセンブリを生成

2. スタブ(初期化プログラム等)をつける

3. 入出力などのライブラリをリンク

4. アセンブラによりバイナリに変換し完成

ビルドの流れMinCaml ソース

MinCaml コンパイラ

libmincaml.s

SPARC アセンブリ 自作 CPU アセンブリ

自作アセンブラ自作リンカ

自作 CPU バイナリSPARC バイナリ

stub.c (自作スタブ)

(自作ライブラリ)

アセンブリ生成 (emit.ml)• main.ml の最後のステップ• save/restore を具体的なストア / ロードに変換

– スタックの状態を追跡 (stackmap, stackset)• if 文の合流後は両方のスタックの共通部分をとる

• 規約に従うように関数呼出しを変換– 引数を規定されたレジスタにセット (shuffle 関

数 )– リターンアドレスの save/restore– スタックポインタの管理

• 条件分岐をジャンプに変換– 分岐用・合流用のラベルを導入

外部ファイル

• スタブ (stub.c)– ヒープとスタックを確保したのち

MinCaml のエントリポイントを呼び出すコード• ライブラリ (libmincaml.s)

– 外部関数が定義されている• 入出力• 配列生成• 数値計算

• 自作 CPU 向けの外部ファイルも必要かも– アーキテクチャ次第

末尾呼出し最適化

• 末尾呼び出しの例

• 関数の最後の処理が call• 基本的には関数呼出しの際には

戻り番地 (return address) を保存しておかないといけない

let rec fact x r = if x <= 1 then r else fact (x - 1) (r * x)

単純にコンパイルすると…

save(Rret)add Rsp, 4, Rsp

call factnopsub Rsp, 4, Rsp

restore(Rret)retlnop

let rec fact x r = if x <= 1 then r else fact (x - 1) (r * x)

戻り番地 (Rret) だけからなるフレームをメモリに構成

戻り番地を pop して直ちにリターン

このコードを再帰的に何度も実行していくと…

その結果

main 関数のフレーム

Rret

Rret

Rret

Rret

Rret

Rret戻り番地だけを保存した無駄なフレームが積みあがる!

     / \__ _ /ヽ   ヽ   /     ::::::::::::::::\ つ  . |   ,,-‐‐    ‐‐ - 、 .:::|  わ   |   、 _(o)_,:   _(o)_,  :::| ぁぁ.   |      ::<       .::| あぁ   \  /( [ 三 ] ) ヽ :: /ああ   /`ー‐ --‐‐―´ \ぁあ

何がいけなかったのか ?どうすればよいのか ?

• 問題の原因: 末尾呼出し直後の地点に律義にリターンしている– 時間的に無駄

• 何もしない地点へわざわざリターン– 空間的にも無駄

• いちいち戻り番地を退避

• することがないなら呼出し元に直接飛べばよい!– コンパイラで末尾呼出しを認識し最適化する

末尾呼出し最適化の例 : beforelet f x = ... (g 8) - 3 ...

let g x = h (x + 1)

let h x = x * 2最適化する前は律義に g に

戻っているのでもったいない

末尾呼出し最適化の例 : afterlet f x = ... (g 8) - 3 ...

let g x = h (x + 1)

let h x = x * 2

大元の呼出し元に直接リターン

末尾呼出し最適化

• 末尾呼出し時の無駄なジャンプ・退避を除去する

• cf. 自己末尾再帰– 関数の最後の処理が自分自身の再帰呼び出し

• 末尾呼出し最適化により単なるループに変換できる

call の直後にリターンする場合

• call をただのジャンプにできる

save(Rret) add Rsp, n, Rsp

bl Lf

sub Rsp, n, Rsp

restore(Rret) blr

b Lf

if の直後にリターンする場合

• 合流する必要はない– 下の例では L2 に飛ばずに blr する

cmp c0, x, y bg c0, L1 ... then clause ... b L2L1: ... else clause ...L2: blr

cmp c0, x, y bg c0, L1 ... then clause ... blrL1: ... else clause ... blr

末尾呼出し最適化の実装

• アセンブリに変換する際変換中の式が末尾にあるかどうかを管理(emit.ml)– Tail : 末尾

• 末尾呼出し最適化を実行、または、• 結果を返り値用のレジスタにセットしてリターン

– NonTail(r) : 末尾でない• 結果をレジスタ r にセット

CPS 変換

• すべての call や if を末尾にしてしまう– 末尾でない関数適用 / 条件分岐の 「継続」 を生

成• 「継続」 ≒ 「その後にすること」

– クロージャで表現する

– すべての関数定義 / 関数適用に仮引数 / 実引数として継続を追加

– 関数からのリターンは継続の呼出しになる• α 変換および A 正規化の完了した

K 正規形に対して行うと簡単

CPS 変換のイメージ (1/2)

let rec f x = g x + 5

let rec g y = y + y

この部分を実行する関数 (クロージャ) を新たに導入しg の引数として渡すようにする

CPS 変換のイメージ (2/2)

let rec f x cont = (* cont は継続 *) let rec f_cont z = (* 継続をつくる *) let result = z + 5 in cont result in g x f_cont

let rec g y cont = (* cont は継続 *) let result = y + y in cont result

g は実行が終わったら引数にもらった継続 (クロージャ) を呼び出すことにより「リターン」 する

赤枠が f の “ +5” だった部分

CPS 変換の利点 /欠点

• 利点: 以降の処理が容易– 関数呼び出し時の save/restore が不要– 「リターンアドレス」 の概念が不要– スタックも不要

• 欠点: クロージャが頻繁に生成 / 適用される– 効率的なヒープ管理が必要

• エスケープ解析– スタックに確保してもよいクロージャが見つかる

• 世代別ガベージコレクション

種々の簡単な拡張

• レコード・バリアント

• λ抽象・部分適用

レコード・バリアント

• レコード: フィールドがアルファベット順に並んだタプルと見なす– { foo = 3; bar = 7 } ⇒ (7, 3)

• バリアント: コンストラクタを整数で表しそれを第 1 要素とするタプルにする– type 'a list = Nil  | Cons of 'a * 'a list のとき、Nil ⇒ (0)、 Cons(x, y) ⇒ (1, x, y)

λ抽象・部分適用

• λ抽象: let rec に置換– fun x -> M ⇒ let rec f x = M in f

• f は fresh な名前

• 部分適用: let rec と完全適用に置換– たとえば let rec f x y = x - y のとき、

f 3 ⇒ let rec g y = f 3 y in g• g は fresh な名前

– g をはさむことで完全適用にした

共通課題

• 5 問中 3 問解けばよい

共通課題 1• 以下のプログラムはどのようなアセンブリ

にコンパイルされるか、末尾呼び出し最適化をしない場合とする場合のそれぞれについて説明せよ– ヒント: 末尾呼び出し最適化をする場合、手続

き型言語でループを用いて書いた gcd と同じようなアセンブリになる (はず)

let rec gcd m n = if m <= 0 then n else if m <= n then gcd m (n - m) else gcd n (m - n)in print_int (gcd 21600 337500)

共通課題 2

• 以下のプログラムを手動で CPS 変換せよ– K 正規化はしてもしなくてもよい

• 余裕があれば、 CPS 変換した場合としなかった場合でどのようなアセンブリにコンパイルされるか、両者を比較してみよう

let rec ack x y = if x <= 0 then y + 1 else if y <= 0 then ack (x - 1) 1 else ack (x - 1) (ack x (y - 1))in print_int (ack 3 10)

共通課題 3

• MinCaml をCPS 変換を用いるように改造してみよ– K 正規形に対して変換するとよい

• 外部関数呼出しの扱いに注意

共通課題 4

• 「種々の簡単な拡張」 ( の一部 ) を用いるML プログラムを書け

• 更にその ML プログラムを既存の ML コンパイラがどのようにコンパイルするか調べて解説せよ–同程度以上に複雑な他のプリミティブについて調べてもよい

共通課題 5

• MinCaml を改造してλ 抽象・部分適用を実装せよ

課題の提出先と締め切り

• 提出先 : compiler-report-2011@yl.is.s.u-tokyo.ac.jp• 締め切り : 2 週間後 (12/01) の午後 1 時

(JST)• Subject: Report 6 <学籍番号 : 5 桁 >

– 例: Report 6 01099• 本文にも氏名と学籍番号を明記のこと

半角スペース 1 個ずつ

質問は compiler-query-2011@yl.is.s.u-tokyo.ac.jp まで

今後のトピック (変更の可能性あり)

• 多相型• 基礎的な最適化• レジスタ割付・スケジューリング• 並列化・ループ最適化• VM ・バイトコードインタプリタ• Garbage Collection

Recommended