3.1 正規形 | Umatani's Lecture Documents

講義テキストの言語 $\mathcal{C}$ がそうであるように，この実験の正規形も式の評価順序が明確に表現されるように設計されている．そのため，算術式のオペランド式やif式の条件式として任意の式を書くことはできず，変数あるいは整数定数（正規形ではこれらを合わせて値 (value)と呼ぶ）しか書けないようになっている．

$\begin{align*} \langle \mathit{value}\rangle &::= \langle\mathit{ID}\rangle \;\;|\;\; \langle\mathit{IntV}\rangle \end{align*}$

さらに，言語 $\mathcal{C}$ と異なり，正規形では式を二種類に分類し，let式やloop式によって変数に束縛される値となる式（以下，単にletの右辺式と呼ぶ）として書くことの許される式に制限を設ける．具体的には，let式，loop式，let rec式，recur式をletの右辺式とすることはできないようにする．

$\begin{align*} \langle \mathit{cexp}\rangle &::= \langle \mathit{value}\rangle \;\;|\;\; \langle \mathit{value}\rangle\ \mathit{bop}\ \langle \mathit{value}\rangle \\ &\ \ \ | \ \ \ \langle \mathit{value}\rangle\ \langle \mathit{value}\rangle \\ &\ \ \ | \ \ \ \color{red}{\texttt{if }} \langle \mathit{value}\rangle \color{red}{\texttt{ then }} \langle \mathit{exp}\rangle \color{red}{\texttt{ else }} \langle \mathit{exp}\rangle \\ &\ \ \ | \ \ \ \color{red}{\texttt{( }} \langle \mathit{value}\rangle \color{red}{\texttt{ , }} \langle\mathit{value}\rangle \color{red}{\texttt{ )}} \\ &\ \ \ | \ \ \ \langle\mathit{value}\rangle \color{red}{\texttt{ . 1}} \;\;|\;\; \langle\mathit{value}\rangle \color{red}{\texttt{ . 2}} \\ \\ \langle \mathit{exp}\rangle &::= \langle \mathit{cexp}\rangle \\ &\ \ \ | \ \ \ \color{red}{\texttt{let }} \langle \mathit{id}\rangle \color{red}{\texttt{ = }} \langle \mathit{cexp}\rangle \color{red}{\texttt{ in }} \langle \mathit{exp}\rangle \\ &\ \ \ | \ \ \ \color{red}{\texttt{loop }} \langle \mathit{id}\rangle \color{red}{\texttt{ = }} \langle \mathit{cexp}\rangle \color{red}{\texttt{ in }} \langle \mathit{exp}\rangle \\ &\ \ \ | \ \ \ \color{red}{\texttt{let rec }} \langle \mathit{id}\rangle\texttt{ }\langle \mathit{id}\rangle \color{red}{\texttt{ = }} \langle \mathit{exp}\rangle \color{red}{\texttt{ in }} \langle \mathit{exp}\rangle \\ &\ \ \ | \ \ \ \color{red}{\texttt{recur }} \langle \mathit{value}\rangle \end{align*}$

プログラム全体は $\langle \mathit{exp}\rangle$ である．抽象構文木に含まれていた：

bool型のリテラルtrue，false
fun式

は正規形には含まれていない．前者はそれぞれ整数リテラル1，0で表現することにする．後者はlet rec式を使った等価な正規形の式として表現できる．具体的にどのようなlet rec式に変換するかは次節で説明する．

先述のletの右辺式に関する制限は， $\langle \mathit{exp}\rangle$ 定義中のlet式，loop式の右辺式が $\langle \mathit{exp}\rangle$ ではなく $\langle \mathit{cexp}\rangle$ であることにより表現されている．一方， $\langle \mathit{cexp}\rangle$ 定義中のif式の部分式は $\langle \mathit{cexp}\rangle$ ではなく $\langle \mathit{exp}\rangle$ である．つまり，let式やlet rec式をletの直接の右辺式として書くことはできないが，間接的にlet式やlet rec式が入れ子になることはあり得る．たとえば：

let x = if i < 10 then
           let j = i + 1 in ...
        else ...
in ...

は正しい正規形である．

letの右辺式の種類を上記のように制限し，束縛を伴う式の（直接の）入れ子構造を取り除いておくと，後のフェーズの処理が簡潔になる．詳しくは仮想機械で説明する．

正規形を表現するOCamlのデータ型を以下に示す．BNF記法による文法定義をそのままの形でOCamlの型宣言にしているだけである．配布コードのnormal.mlにもすでに含まれている．

`normal.ml`

open Pretty
module S = Syntax

exception Error of string
let err s = raise (Error s)

type id = S.id
type binOp = S.binOp

let fresh_id = Misc.fresh_id_maker "_"  (* <= 1 *)

(* ==== 値 ==== *)
type value =
    Var  of id
  | IntV of int

(* ==== 式 ==== *)
type cexp =
    ValExp    of value
  | BinOp     of binOp * value * value
  | AppExp    of value * value
  | IfExp     of value * exp * exp
  | TupleExp  of value * value
  | ProjExp   of value * int

and exp =
    CompExp   of cexp
  | LetExp    of id * cexp * exp
  | LetRecExp of id * id * exp * exp
  | LoopExp   of id * cexp * exp
  | RecurExp  of value

なお，normal.mlの(* <= 1 *)行目で定義されているfresh_id関数は，次節の変換処理中にフレッシュな名前を生成するために用いる．id型（string型）の引数" $\langle s\rangle$ "を受け取ると，id型の値"_ $\langle s\rangle \langle n\rangle$ "を返すようになっている（ $\langle n\rangle$ はフレッシュとなるよう適当に割り振られる番号）．フレッシュな名前を生成する際，関連するソースプログラム中の識別子名を $\langle s\rangle$ として指定しておくと，中間表現を読むときにフレッシュな名前がソースプログラム中のどれと対応しているのか分かりやすくなり，デバッグに便利である．正規形に限らず，この後のフェーズすべてで同様の工夫を行うようにすると良い．

Tip: さらに，フレッシュな名前につけるプレフィックス（ここでは"_"）をフェーズ毎に別にしておくと，どの変換処理中で生成した名前かも一目瞭然である．