言語理論とコンパイラ

第一回 (2007年 4月13日)

授業の概要
言語理論とコンパイラの応用分野
コンパイラ全体の仕組み

AGU

© 2006 Martin J. Dürst 青山学院大学

自己紹介

授業の位置付け

授業の進め方

授業の内容

理論 コンパイラ 他の応用
フロントエンド 言語理論、オートマトン 字句解析、構文解析 正規表現, XML
バックエンド 最適化、コード生成

入力の難しさ

コンパイラの役割

ソフトからハードへの橋渡し

入力: 人間が分かるプログラム (高級プログラムイング、ソース (プログラム)、原始プログラム)

出力: 機械が分かるプログラム (目的プログラム、実行プログラム)

コンパイラの仕事の一例

入力のプログラムの一部:

sum += price * 25;

出力:

LOAD   R1, price    ; R1 (レジスタ1) に price というアドレスからロード
LOAD   R2, 25       ; R2 (レジスタ2) に 25 の定数をロード
MUL    R1, R1, R2   ; R1 に R1 と R2 の掛け算の結果を入れる
LOAD   R2, sum      ; R2 に sum というアドレスからロード
ADD    R2, R1, R2   ; R2 に R1 と R2 の合計を入れる
STORE  sum, R2      ; sum というアドレスに R2 を入れる

コンパイラの論理的構造

[プリプロセッサ (preprocessor) ]
字句解析 (lexical analysis)
構文解析 (parsing; syntax analysis)
意味解析 (semantic analysis)
最適化 (optimization)
コード生成 (code generation)
[アセンブラ (assembler)]
[リンカ (linker)・ローダ (loader) ]

コンパイラの種類と関連物

字句解析の一例

入力のプログラムの一分 (文字の列):

s u m   + =   p r i c e   *   2 5 ; \n

出力 (記号の列):

id("sum"), plusequal, id("price"), asterisk, int(25), semicolon

構文解析の一例

入力 (記号の列):

id("sum"), plusequal, id("price"), asterisk, int(25), semicolon

出力 (構文木、syntax tree):

statement (+= (sum, * (price, 25)))



オートマトンの一例

自動販売機:



状態遷移図 (state transition diagram)

言語と文法

形式言語の文法の一例

文法から文の導出 (derivation) の一例:

S → a S o → a a S o o → a a A o o → a a y a o o

S ⇒ a a y a o o

宿題

提出期限と場所: 2007年4月19日 (木) 19:00 まで O棟5階のO529 号室の前の箱に投入

形式: A4 一枚

  1. XML に付いて調べて、結果をページ半分程度にまとめなさい。(この授業に関係あることの方がよい。)
  2. 次の行の Cプログラムの一文の字句解析の結果、構文解析の結果、そしてコンパイラの出力 (アセンブリ言語; コメントは必要ない; 割り算は DIV で) を、授業の例に習って書きなさい。
    total = pretax + pretax/100*5;