2016年度「プログラミング言語」配布資料 (9)

五十嵐淳 (京都大学大学院情報学研究科通信情報システム専攻)

2016年12月18日

再帰とスタック・オーバーフロー
末尾呼出しと末尾呼出しの最適化
末尾再帰関数から繰り返し処理へ
末尾再帰化
- sum の末尾再帰化
- (mutable版) insert の末尾再帰化

under construction 2017年版に向け改訂中

while や for などの 繰り返し(iteration) の構文を使いこなすことは，プログラミング，特にJavaやC言語でのプログラミングにおいては必須の技術である．しかしながら，本稿では，不自然と思えるくらいに繰り返し構文を使っていない．その理由としては以下のようなことがあげられる．

題材として再帰的なデータ構造である2分(探索)木を取りあげており，操作の定義には再帰がより自然であるため
代入と繰り返しをあまり使わない OCaml プログラムとの対比をしやすくするため
繰り返しは再帰を使って表現できるため

本章では，「何度も同じような計算を行う」ための手法である再帰と繰り返しを比較していく．

再帰とスタック・オーバーフロー

既に述べたように，関数呼出しは一回毎にパラメータや局所変数を格納するためのフレームと呼ばれる領域をメモリに確保して，関数本体の実行を行い，実行が終了したらフレームを解放して，呼出し元に実行を移す．フレームは新しく確保したものから先に解放される，という意味で LIFO の原則に従うため，通常，フレーム管理はスタックを用いて行う．ある関数の実行中に，関数呼出しが発生して，その本体の実行中に，関数呼出しが発生して，というように関数呼出しの段数が増えるとその分だけスタックを消費するわけだが，段数が増えすぎるとスタック領域が足りなくなってプログラムが異常終了することがある．これが スタック・オーバーフロー(stack overflow) である．

以下は，C言語で書かれた 1 から \(n\) までの和を計算する簡単な再帰関数¹だが，手元では引数が 270000 になると，OS レベルのエラー (スタック領域をはみだしてメモリの読み書きをしてしまったことで発生した segmentation fault) によって，プログラムの実行が異常終了した．

int sum(int n) {
  if (n == 1) then return 1
  else return n + sum(n - 1);
}

int main(void) {
  int n = 260000;
  printf("sum(%d) = %d\n", n, sum(n));

  return 0;
}

これは OCaml でも(ここでは示さないが Java でも)同じ事情で，以下の関数はだいたい同じ大きさの引数でスタック・オーバーフローが発生した．(なお，このスタック・オーバーフローは，OSではなく，インタラクティブ処理系の内部で検知されたものなので，インタラクティブ処理系自体が終了せずに済んでいる．)

# let rec sum n =
    if n = 1 then 1
    else n + sum (n-1);;
val sum : int -> int = <fun> 
# sum 260000;;
- : int = 33800130000
# sum 270000;;
Stack overflow during evaluation (looping recursion?).

次は，ユークリッドの互除法で最大公約数を求める関数である．(ただし，再帰呼出しの回数を多くするために，剰余を求めずに，引き算を使っている．)

int gcd(int n, int m) {
  assert(n>0 && m>0);
  if (n == m) { return n; }
  else if (n > m) { return gcd(n-m, m); }
  else /* m > n */ { return gcd(m-n, n); }
}

int main(void) {
  int a = 540001;
  int b = 2;
  printf("gcd(%d, %d) = %d\n", a, b, gcd(a, b));
  return 0;
}

a, b を上のように設定することで，sum の時と同じくらいの関数呼出しの段数でスタック・オーバーフローが発生した．²

しかしながら，OCaml で gcd を定義すると，驚くべきことに(？)引数が大きくなっても sum と違ってスタックオーバーフローが発生する様子がない．これは一体どうしてだろうか．

let rec gcd(n, m) =
  if n = m then n
  else if n > m then gcd(n-m, m)
  else (* m > n *) gcd(m-n, n)

# gcd(540001, 2);;
- : int = 1
# gcd(5400001, 2);;
- : int = 1
# gcd(54000001, 2);;
- : int = 1
# gcd(540000001, 2);;
- : int = 1

末尾呼出しと末尾呼出しの最適化

sum と gcd は，どちらも再帰呼出しを行うものの，再帰呼出しの結果の扱いが違う．すなわち，sum は再帰呼出しの結果に対し足し算を行った値を返す一方で，gcd は，再帰呼出しの結果がそのまま返値となっている．このような，返値の位置にある関数呼出しを---再帰呼出しでも別の関数呼出しでも--- 末尾呼出し(tail call) と呼ぶ．

末尾呼出しは，多くの場合，呼出しを行う直前に呼出し側のフレームの領域を解放することができる．このため，末尾呼出しを繰り返す限りにおいてはスタック領域を食いつぶすことなく実行を続けることができる．このように末尾呼出しを特別扱いすることを 末尾呼出しの最適化(tail-call optimization) もしくは 末尾呼出し除去(tail-call elimination) と呼ぶ．OCaml ではこれが実装されており，gcd のように末尾呼出しを繰り返す関数についてはスタック・オーバーフローを起こすことなく実行を続けることができる．C言語でも，コンパイラ起動時に -O2 などのオプションをつけて最適化するように指示をすると，末尾呼出しを検知して末尾呼出し最適化を行ってくれるようである．

末尾呼出しにおいてフレームの領域を解放できるのはなぜか考えてみよう．関数 f から関数 g を末尾呼出しする直前の状況を考える．f の残りの仕事は g からの返値を f の呼出し元に返すだけなので，多くの場合，局所変数の領域はこの時点で必要なくなる．例外は，C言語で f の局所変数のアドレスを & を使って取得して g に渡しているような場合である．OCaml (や Java) では，このような局所変数のアドレスを取得するようなことはできないので，局所変数の領域は末尾呼出し直前で必ず不要になる．また，フレームには，局所変数の情報だけでなく，関数から実行をどこへ戻せばよいか，戻り番地情報が書かれているが，末尾呼出しの場合，これも以下の工夫をすることで不要になる．f の呼出し元への戻り番地情報は，f から f の呼出し元に値を返す時に必要になるように思えるが，g のフレームに書かれる戻り番地を g の呼出し元(すなわち f の最後)にせず f の呼出し元に(g から f を飛ばして f の呼出し元に直接返るように)するのである．

末尾再帰関数から繰り返し処理へ

再帰関数定義中の再帰呼出しが全て末尾呼出しになっているような関数を 末尾再帰関数(tail-recursive function) と呼ぶ．gcd は末尾再帰関数である．末尾再帰関数は，系統的な方法で，再帰を使わない，繰り返し構文(と代入)を使った処理に書き換えることができる．

まず，例を見てみよう．C言語の gcd 関数は以下のように書き換えることができる．(この例は，後述する系統的な書き換えを愚直に適用したので無駄な処理が含まれている．)

int gcd_iter(int n, int m) {
  while (true) {
    if (n == m) { return n; }
    else if (n > m) {
      n = n - m;
      m = m;
    } else /* m > n */ {
      int tmp = n;
      n = m - n;
      m = tmp;
    }
  }
}

書き換えのポイントは以下の通りである．

関数全体を while ループにし，条件式は true にしてしまう．
末尾再帰呼出し以外はそのまま．
末尾再帰呼出し---例えば gcd(n-m, m)---は，関数パラメータ(この例では n, m)へ実引数の式(n-m, m)を代入する処理で置き換える．ただし，代入の順番によっては素直に書けない場合があるので，そこは一時変数を用意するなどの注意をする．(上記 else 節がその例である．)

これで，関数本体が繰り返し実行される．条件式は true なので終了しないようにも思えるが，return 文を実行することで，関数を抜けることになる．再帰呼出しの代わりの代入は，先程述べた，末尾呼出しの最適化，すなわち，末尾呼出し前のフレームの解放・呼出し後の新たなフレームの確保と局所変数の初期化をプログラムで実現しているといえる．

以下は，gcd_iter と，実質的には同じ動作をするが，m = m; のような無駄な代入を省き，while の条件を return 文に到達する条件の否定に変えて，return 文を関数の最後に移動させたバージョンである．

int gcd_iter_take2(int n, int m) {
  while (n != m) {
    if (n > m) {
      n = n - m;
    } else /* m > n */ {
      int tmp = n;
      n = m - n;
      m = tmp;
    }
  }
  return n;
}

このように末尾再帰関数は繰り返しに帰着させることができる．逆に，繰り返し構文を末尾再帰関数に変換することもできる．繰り返し構文の使用一箇所につき，ひとつ関数定義を用意することになる．

2分探索木の処理でも実は find 関数は末尾再帰的である．よって，同様の変換を施して繰り返しで書き直すことができる．以下の find_iter が，愚直に変換をして得られるバージョン，find_iter_take2 が，return するための条件の否定をループの条件にしたり，無駄な代入を省くことで得られるバージョンである．この最後の find_iter_take2 は，C言語を使ったアルゴリズムの教科書に書かれているであろう定義に非常に近くなっているのが面白いところである．

bool find(struct tree *t, int n) {
  if (t->tag == LEAF) {
    return false;
  } else /* t->tag == BRANCH */ {
    struct branch b = t->dat.br;
    if (n == b.value) {
      return true;
    } else if (n < b.value) {
      return find(b.left, n);
    } else /* n > b.value */ {
      return find(b.right, n);
    }
  }
}

// 変換を愚直にした繰り返し版
bool find_iter(struct tree *t, int n) {
  while (true) {
    if (t->tag == LEAF) {
      return false;
    } else /* t->tag == BRANCH */ {
      struct branch b = t->dat.br;
      if (n == b.value) {
        return true;
      } else if (n < b.value) {
        t = b.left;
        n = n;
      } else /* n > b.value */ {
        t = b.right;
        n = n;
      }
    }
  }
}

bool find_iter_take2(struct tree *t, int n) {
  while (t->tag != LEAF && n != t->dat.br.value) {
    struct branch b = t->dat.br;
    if (n < b.value) {
      t = b.left;
    } else /* n > b.value */ {
      t = b.right;
    }
    // or, equivalently, t = (n < b.value) ? b.left : b.right;
  }
  return (t->tag != LEAF);
}

Java の2分探索木では，処理が複数のクラスに分散してしまっているので，このような変換をするのは困難である．(null を使うバージョンであれば，find に関わる全ての処理がひとつにまとまっているので▼変換できる．)

OCaml では，末尾呼出し最適化がされるので，元の gcd や find をそのまま実行すればよいわけだが，mutable レコード(もしくは，この講義では紹介していない参照(reference)という仕組み)を使えば，C言語や Java の代入可能な変数を模倣することができるので，それと(これまた紹介していない) while 構文を組み合わせて同様な変換をすることもできる．

末尾再帰化

さて，冒頭の sum のような関数は末尾再帰関数ではないため，n を大きくするとスタック・オーバーフローを起こしてしまう．しかし，うまいことプログラムを変形することで，末尾再帰関数にすることができる．この章の最後として，いくつかの再帰関数を末尾再帰関数，さらには繰り返し処理へ変形していって見よう．例とするのは sum と mutable な2分探索木の insert である．この時，変形のポイントになるのは，「再帰呼び出しが終わった後の計算を，再帰関数側でやってもらうようにする」ということである．

sum の末尾再帰化

sum の定義をもう一度見てみよう．

let rec sum n =
  if n = 1 then 1
  else n + sum (n-1)

この定義では，sum (n-1) という再帰呼び出しの後，この関数から返るまでに「再帰呼び出しの結果に n を足す」という計算をしており，この部分のせいで末尾再帰でないことがわかる．「再帰呼び出しが終わった後の計算を，再帰関数側でやってもらうようにする」というのは，この足し算の部分を，再帰呼び出しの中でやってもらうようにしよう，というわけである．

これには，まず，sum の引数をひとつ増やして「(本来の)計算が終わった後に何を足せばよいか」を受けとれるように sum(n,m) とする．この第二引数が，上の「再帰呼び出しの結果に n を足す」と対応している．元の sum n は「1からnまでの整数の和」を計算するものだったが，この新しい sum(n,m) は，「1からnまでの和とmの和」となり，次のような定義になる．

let rec sum' (n, m) =
  m + (if n = 1 then 1
       else sum' (n-1, n))

ポイントは，

新しい引数 m は「本来の計算が終わった後に足す数であるので」 if 全体に足している
再帰呼び出しを伴っていた else 部 n + sum(n-1) の n + の部分は，再帰呼び出しした先でやってもらえるので，sum'(n-1, n) という形で第二引数にもってくる．

残念ながらこの定義は，まだ末尾再帰ではない．次に，m + (if ...) に着目してみる．if の場合分けの結果に m を足す，ということは，if の外側の部分を then, else 部それぞれの式に m + を「分配」して押し込んでも結果は変わらないはずである．これにより次の定義を得る．

let rec sum' (n, m) =
  if n = 1 then m + 1
  else m + sum' (n-1, n)

else 部の m + sum' (n-1, n) の値は「『1から n-1 までの和と n の和』とmの和」のはずである．足し算は結合則があるので，これは「1から n-1 までの和と n+m の和」であることに注意すると，再帰呼び出しの第二引数として n の変わりに n+m を渡せば，else 部の m + が除去できることがわかる．この結果得られるのが次の定義である．

let rec sum'' (n, m) =
  if n = 1 then m + 1
  else sum'' (n-1, m + n)   (* tail recursive! *)

これは末尾再帰になっている! ただし，この sum'' を使って 1 から n までの和を計算したい場合は
sum''(n, 0) と第二引数に 0 を渡さないといけないので少々注意が必要である．

同じ変形は C 言語での定義でもできて，以下のような定義が得られる．

int sum2(int n, int m) {
  if (n == 1) then { return m + 1; }
  else { return sum2(n-1, m + n); }
}

これを，上と同じように(ほとんど)機械的に繰り返しを使った定義に書き換えると以下のような関数定義になる．

int sum2_iter(int n, int m) {
  while (n != 1) {
    m = m + n;
    n = n - 1;
  }
  return m + 1;
}

もしも，この関数を呼ぶ時は必ず m を 0 として呼ぶのであれば，

int sum2_iter(int n) {
  int m = 0;
  while (n != 1) {
    m = m + n;
    n = n - 1;
  }
  return m + 1;
}

としてもよい．この定義はかなり「ふつうの」C言語らしいプログラムである．(多くの人は，n をカウントダウンする代わりに，別にカウンタを用意して 1 から n までカウントアップする定義を書くかもしれないが．)

この変形のポイントは，最初に書いた通り，「再帰呼び出しが終わった後の計算を，再帰関数側でやってもらうようにする」ということである．また，一旦，m + sum' (n-1, n) を得た後，(足し算の結合則を利用して) sum''(n-1, m + n) を導いているのは，いわば「再帰呼び出しが終わった後の計算を合成」しているわけである．

(mutable版) insert の末尾再帰化

OCaml や C の mutable な2分探索木の挿入操作(おそらく削除操作)も，同じ考えを応用することで末尾再帰化することができる．今度は C 言語の定義を元に変形してみよう．

まず，元の定義を再掲する．

struct tree *insert(struct tree *t, int n) {
  if (t->tag == LEAF) {
    free(t);
    return newbranch(newleaf(), n, newleaf());
  } else /* t->tag == BRANCH */ {
    struct branch *b = &(t->dat.br);
    if (n == b->value) {
      return t;
    } else if (n < b->value) {
      struct tree *newleft = insert(b->left, n);
      b->left = newleft;
      return t;
    } else /* n > b->value */ {
      struct tree *newright = insert(b->right, n);
      b->right = newright;
      return t;
    }
  }
}

再帰呼び出しは10行目，14行目の二箇所あるが，再帰呼び出しから返ってきた後にやっていることは，

再帰呼び出しの結果を(newleft や newright 経由で) b->left (または b->right) へ代入し，
最後に t を return する

となっている．(以下，10行目の再帰呼び出しに注目するが，もうひとつも同様にできる．)この newleft は読みやすさのために導入しただけで，実は

      b->left = insert(b->left, n);

と書いてもよかったものである．この，「b->left へ代入し」の部分を再帰呼び出し側でやってもらうことにしよう．これを行うためには b->left のアドレス &b->left を再帰呼び出しで渡してあげればよい．(& が必要なことに注意せよ．)b->left の型は struct tree * なので，そのアドレスは struct tree ** (tree構造体へのポインタへのポインタ) という型で表される．insert の引数を増やして書き換えた結果が以下の定義である．

struct tree *insert2(struct tree *t, int n, struct tree **pt) {
  if (t->tag == LEAF) {
    free(t);
    struct tree *newt = newbranch(newleaf(), n, newleaf());
    *pt = newt; /** Attention! **/
    return newt;
  } else /* t->tag == BRANCH */ {
    struct branch *b = &(t->dat.br);
    if (n == b->value) {
      *pt = t; /** Attention! **/
      return t;
    } else if (n < b->value) {
      insert2(b->left, n, &b->left);
      *pt = t; /** Attention! **/
      return t;
    } else /* n > b->value */ {
      insert2(b->right, n, &b->right);
      *pt = t; /** Attention! **/
      return t;
    }
  }
}

pt が増えた引数で，この関数は return する前に返値を pt の指す先に代入することになる．(コメントで /** Attention! **/ と書いた4箇所．)また，再帰呼び出しの結果は使わないので，insert2(...); と結果を捨てるように呼び出している．

次に，

まず，再帰呼び出しの結果は捨てられるだけなので，実はこの関数は値を返さない void insert2(...) {...} ものとして定義できる．
また *pt = t; という代入だが，もともと insert2 が再帰的に呼ばれた場合には，*pt の値と t の値は同じはずである．これは二箇所の再帰呼び出し(13行目と17行目)を見れば明らかである．さらに，そもそもの最初の insert2 の呼び出しの時の第三引数を insert2(t, 100, &t) のようにしてやれば(t は2分探索木の根)，insert2 の全てのフレームで *pt と t が等しいことになる．よって，この代入は不要である．

ということに注目し，さらにプログラムを書き換えると以下の insert3 が得られる．

// Values returned from insert2 are not really used. So, let's change the return type to void.
// If this function is always called with *pt == t, the assignment *pt = t is nop.  Indeed, 
// this relation holds at all recursive calls.  So, if the first, top-level call ensures
// t == *pt, we can remove *pt = t;.
void insert3(struct tree *t, int n, struct tree **pt) {
  if (t->tag == LEAF) {
    free(t);
    *pt = newbranch(newleaf(), n, newleaf());
    return;
  } else /* t->tag == BRANCH */ {
    struct branch *b = &(t->dat.br);
    if (n == b->value) {
      return;
    } else if (n < b->value) {
      insert3(b->left, n, &b->left);
      return;
    } else /* n > b->value */ {
      insert3(b->right, n, &b->right);
      return;
    }
  }
}

これは，再帰呼び出しの直後に return しているので末尾再帰であり，以下のような繰り返しを用いた定義に書き換えることができる．

void insert_iter(struct tree *t, int n, struct tree **pt) {
  while (true) {
    if (t->tag == LEAF) {
      free(t);
      *pt = newbranch(newleaf(), n, newleaf());
      return;
    } else /* t->tag == BRANCH */ {
      struct branch *b = &(t->dat.br);
      if (n == b->value) {
        return;
      } else if (n < b->value) {
        t = b->left;
        n = n;
        pt = &b->left;
      } else /* n > b->value */ {
        t = b->right;
        n = n;
        pt = &b->right;
      }
    }
  }
}

さらに，while の条件式を，return する条件の否定にして，ループを出てから return するよう書き換えたのが以下の定義である．ついでに n = n; のような無駄な代入も除去している．

void insert_iter_take2(struct tree *t, int n, struct tree **pt) {
  while (t->tag != LEAF && n != b->value) {
    struct branch *b = &(t->dat.br);
    if (n < b->value) {
      t = b->left;
      pt = &b->left;
    } else /* n > b->value */ {
      t = b->right;
      pt = &b->right;
    }
  }
  if (t->tag == LEAF) {
    free(t);
    *pt = newbranch(newleaf(), n, newleaf());
  }
  return;
}

この定義は，C言語でアルゴリズムの解説をしている教科書にある，典型的な挿入操作の定義とほぼ同じになっている．

[ 前の資料 | 講義ホームページ・トップ | 次の資料 ]

n(n-1)/2 を返せばいいじゃないか，とか言わないでくださいね．↩
手元で実験した限りでは sum と gcd ではフレームの大きさが(引数の数が違うので必要な領域の大きさが違うにも関わらず)同じであった．この原因は追求できていない．↩