うさぎでもわかるコンパイラ　第3羽　First・Follow・Director集合とLL(1)文法の判定

2022年9月19日 2022年9月20日 166分10秒

ももうさ

スポンサードリンク

こんにちは、ももやまです。

コンパイラ（言語処理系）の勉強をしていると、

LL(1)文法
First集合
Follow集合
Director集合

などの不思議な用語が出てきますよね。しかも、これらの定義（特にFirst集合やFollow集合）の定義は少し難解です。

文法 $G = (V_{N}, V_{T}, P, S)$ に関して、記号列 $α \in (V_{N} \cup V_{T})^{*}$ 、非終端記号 $A \in V_{T}$ について、 $First (α)$ , および $Follow$ は次のように定義される。 $First (α) = {a ∣ a \in V_{T}, α \overset{*}{\Rightarrow} a \dots}$ $Follow (A) = {a ∣ a \in V_{T}, S \overset{*}{\Rightarrow} \dots A a \dots}$ ただし $α \overset{*}{\Rightarrow} ε$ なら $ε \in First (α)$ とする。
コンパイラ補助資料　佐々木晃より

そこで今回は、

LL(1)文法とはそもそも何か？
First, Follow, Director集合を求めて何がうれしいのか
First, Follow, Director集合の求め方

の3点を中心に、LL(1)文法とFirst・Follow・Director集合のお勉強をしていきましょう。

文字表記に関する注意

本記事では特に指示がない限り、文章中に出てくる小文字・大文字・ギリシャ文字は

小文字 $a$ , $b$ , $c$ , $d$ , … → 終端記号
大文字 $S$ , $A$ , $B$ , $C$ , … → 非終端記号
$ε$ → 空文字

を表します。

スポンサードリンク

1. LL(1)文法とは

ある文字列 $α$ が文法規則を満たすかどうかを一番単純に調べる方法は、下のように「出発記号 $S$ から変換規則を総当たりで試していき、試した中に $α$ が含まれるか」を調べることです。

f:id:momoyama1192:20190906161619g:plain — 一番単純に文字列が文法規則を満たすか調べる方法

しかし、やみくもに総当たりで試す方法は、処理的にかなり無駄が発生してしまいます^[1] … Continue reading。

そこで、構文解析をする際に1文字だけ先読みし、どの生成規則を使えばよいかを決めてから実際に変換していく方法が考えられました。

このように、1文字だけ先読みすれば、文字列を後戻りすることなく構文解析ができる（文法を満たすか確認できる）文法からなる文法のことをLL(1)文法と呼びます^[2] … Continue reading。

LL(1)文法とは言えない文法（＝1文字だけ先読みするだけでは文字列を後戻りせずに構文解析ができない）文法の例も見てみましょう。

例えば、非終端記号（かつ出発記号） $S$ 、終端記号 $a$ , $b$ 、生成規則 $S \to a a S, S \to a b S, S \to b$ からなる文法規則があるとします。

この文法規則に $a b a b$ という文字列が当てはまるかどうかを1文字先読みで見ていきましょう。

しかし、1文字目 $a$ が出てくる生成規則には、

$S \to a a S$
$S \to a b S$

の2つがあるため、1文字先読みしただけでは $S \to a a S$ , $S \to a b S$ どちらの生成規則を適用すればいいかわかりません。

この例から分かる通り、LL(1)文法かどうかは文法の生成規則のみで決まります。

ここで、LL(1)文法を満たす生成規則であるかを機械的に確認する手法として導入されたのがFirst・Follow・Director集合という概念なのです！

つぎの第2章からは、

実際にFirst, Follow, Director集合の求め方の解説
なぜ機械的にLL(1)文法を満たすのかがわかるのか

の2点について解説していきます。

スポンサードリンク

2. First集合

(1) First 集合とはなにか

First集合 $First (α)$ は、「ある文字列 $α$ に対して生成規則を適用して（複数回適用OK）全て終端記号にした際に、先頭（1文字目）に出てくる可能性がある文字を集めた集合」を表します。

数式で書くと、 $First (α) = {a ∣ a \in V_{T}, α \overset{*}{\Rightarrow} a \dots}$ となります。（色部分を日本語の説明に対応させています）

例えば、 $First (α) = {a, b, c}$ の場合、 $α$ に生成規則を適用していった際に出来る文字列の先頭（1文字目）が $a$ , $b$ , $c$ のいずれかであることを表します。

(2) First 集合で頭にいれておくべき公式

※ 公式を丸暗記するのではなく、理屈を理解してから頭に入れましょう。

規則1[R1] First(a) … 終端記号1文字 $a$ の場合

終端記号 $a$ は、これ以上生成規則を適用することが出来ない文字を表すのでしたね。そのため、 $a$ はどう頑張っても他の文字に変換されることはありません。

よって、終端記号1文字 $a$ のFirst集合の要素は終端記号 $a$ だけとなります。 $First (a) = a$ ※ 空文字 $ε$ のFirst集合は、 $First (ε) = {ε}$ となります。言い換えると、 $First (α) = {ε}$ は、 $α$ が空文字であることを表します。

※ 以後、この規則を用いた変換をする場合は $\overset{R 1}{=}$ と = の上にR1（規則1）を用いていることを示します。

規則2[R2] First(A) … 非終端記号1文字の場合

非終端記号 $A$ のFirst集合 $First (A)$ を求める際、下のように樹形図を書いていって先頭1文字目に出てる文字を地味に探しても正しい答えは出てきますが、列挙ミスが発生する場合があります。

なのでもう少し機械的に $First (A)$ を求めてみましょう。

例えば、 $A \to B C$ という生成規則があったとします。これを言い換えると、「 $B C$ に対して生成規則を適用し、すべて終端記号に変換した際に出てくる文字列」は、必ず「 $A$ に対して生成規則を適用し、すべて終端記号に変換した際に出てくる文字列」として出てきますね。

言い換えると、「 $B C$ に生成先を適用してすべて終端記号にした際に出てくる先頭文字 $First (B C)$ の集合」の要素に、「 $A$ に生成先を適用してすべて終端記号にした際に出てくる先頭文字 $First (A)$ の集合」が含まれますね。

つまり、 $First (A)$ を機械的に求める手順としては、 $A$ から生成規則 $A \to α$ , $A \to β$ , … を探していき、その生成先の文字列 $α$ , $β$ , … のFirst集合 $First (α)$ , $First (β)$ の要素をすべてFirst集合 $First (A)$ の要素とすればOKです。

1つ例を見てみましょう。 $A$ から始まる生成規則 $A \to ε$ , $A \to a B$ , $A \to C b$ が3つあったとします。

この場合、 $First (A)$ の要素は、 $First (ε)$ , $First (a B)$ , $First (C b)$ の和 $First (A) = \underset{A \to ε}{\underset{⏟}{First (ε)}} \cup \underset{A \to a B}{\underset{⏟}{First (a B)}} \cup \underset{A \to C b}{\underset{⏟}{First (C b)}}$ となります。

ここで1点注意が必要です非終端記号 $A$ から空文字 $ε$ が生成される可能性があるときには、 $First (A)$ の要素に $ε$ が加わる点に注意してください。

※ 以後、この規則を用いた変換をする場合は $\overset{R 2}{=}$ と = の上にR2（規則2）を用いていることを示します。

規則3[R3] First(αβ…) … 2文字以上の場合

First集合は、「文字列に生成規則を加えて全て終端記号にした際に、先頭に来る可能性がある終端記号」を表しているのでしたね。

そのため、（First集合を求めるだけであれば）最初の1文字さえわかってしまえば、（最初の1文字が空文字とはならない限り）残りの後ろは何が来ようが関係ありません。

よって、文字列 $α β \dots$ のFirst集合 $First (α β \dots)$ は、 $α$ に空文字が来ない限り（＝ $ε \notin First (α)$ の場合）は $First (α)$ と等しくなります。

一方、 $α$ に空文字が来る可能性があるとき（＝ $ε \in First (α)$ の場合）は、2文字目が先頭になる可能性があるため、1文字目に加えて2文字目 $β \dots$ の先頭文字 $First (β \dots)$ も追加で調べます。つまり、 $First (α β \dots) = (First (α) - {ε}) \cup First (β \dots)$ が成立します。

※ $ε$ を引いた理由は、2文字目 $β$ の先頭に空文字 $ε$ が来ない場合、文字列 $α β \dots$ に $β$ の文字列が残り、文字列 $α β \dots$ が空文字 $ε$ になることはないからです。

まとめると、2文字以上の文字列 $α β \dots$ のFirst集合 $First (α β \dots)$ は、 $First (α β \dots) = {\begin{array}{ccc} First (α) & ε \notin First (α) \\ (First (α) - {ε}) \cup First (β \dots) & ε \in First (α) \end{array}$ で求めることができます。

※ 以後、この規則を用いた変換をする場合は $\overset{R 3}{=}$ と = の上にR3（規則3）を用いていることを示します。

注意: 左再帰 A → Aα が含まれる場合のFirst集合

$A \to A b c$ のように「生成先の文字列の先頭が生成元の文字列になっている」場合、First集合を求めていくと $\begin{aligned} First (A) & \overset{R 2}{=} First (A b c) \\ \overset{R 3}{=} First (A) \end{aligned}$ となり、求めたい集合 $First (A)$ が計算途中に出てくるというよくわからないことが起こります。

この形になった場合は、計算途中に出てくる $First (A)$ は無視してOKです。例えば、 $First (A) = \underset{無視}{\underset{⏟}{First (A)}} \cup First (b)$ となった場合は、左辺にも右辺にも出てくる $First (A)$ を無視し、 $First (A) = First (b)$ として計算してください^[3] $A \to A b$ のように左再帰文法となる規則を適用しても、先頭文字列は $A$ のまま変わらないため、無視しても問題ない。。

また、 $A \to B b, B \to A a, A \to c$ のように、見た目に左再帰になる生成規則は含まれてはいないものの、変形していくと、 $A \to B b \to A a b$ のように間接的に左再帰の形が出てくる場合、 $\begin{aligned} First (A) & = First (B) \cup First (c) \\ First (B) & = First (A) \end{aligned}$ のように、一意には答えを決定できないような形が出てくることがあります。

しかし、左再帰になる規則の部分だけに着目してみると、 $First (A) = First (B)$ , $First (B) = First (A)$ 以外の式が出てこず、特に新しい要素が足される気配（例えば $First (c)$ はありません。

そのため、間接的な左再帰が出てきた際（＝一意に答えが決定できないような形が出てきた場合）には、間接的な左再帰が出てくる式（例えば $A \to B b$ , $B \to A a$ ）をすべて無視し、残りの生成規則からFirst集合を求めてください。ただし、間接的な左再帰に寄与している非終端記号（今回の例だと $A$ , $B$ ）同士のFirst集合は等しくなる点は忘れないでください。

今回の場合は、 $A \to B b$ , $B \to A a$ , $A \to c$ のうちの赤文字部分が間接的な左再帰なため、まずは間接的な左再帰とは関係ない生成規則 $A \to c$ から $\begin{aligned} First (A) & \overset{R 1}{=} First (c) \\ = {c} \end{aligned}$ と求めます。さらに、間接的な左再帰に寄与している $A$ , $B$ のFirst集合は等しくなるため、 $First (B) = First (A) = {c}$ と求めることができます^[4]いったん\[\begin{align*}\mathrm{First} (A) & = \mathrm{First} (B) \cup \mathrm{First} (c)\ & = \underbrace{ \mathrm{First} (A) }_{ \mathrm{無視} } \cup \mathrm{First} (c)\ & = … Continue reading。

First集合を求める際に使う3つの公式まとめ

公式1[R1] 終端記号1文字 $a$ のFirst集合の要素はそのまま $a$ $First (a) \overset{R 1}{=} {a}$

※1: 例題・練習問題で公式1を適用する場合は $\overset{R 1}{=}$ と表記
※2: $First (ε) = {ε}$ である。
※3: $First (α) = {ε}$ は、 $α$ が空文字であることを表す( $α = ε$ )

公式2[R2] 非終端記号1文字 $A$ のFirst集合の要素は、 $A$ から生成される生成規則 $A \to α$ , $A \to β$ , $A \to γ$ , … の生成先(右辺)のFirst集合の和 $First (A) \overset{R 2}{=} \underset{A \to α}{\underset{⏟}{First (α)}} \cup \underset{A \to β}{\underset{⏟}{First (β)}} \cup \underset{A \to γ}{\underset{⏟}{First (γ)}} \cup \dots$

※1. 例題・練習問題で公式2を適用する場合は $\overset{R 2}{=}$ と表記
※2. $A \to A α$ のような左再帰が含まれる文法が出てきた場合は無視する（間接的な左再帰、例えば $A \to B α$ , $B \to A β$ など）が出てきた場合も無視するが、間接的な左再帰に寄与する非終端記号（例の場合だと $A$ , $B$ ）同士のFirst集合は等しくなる。）。

公式3[R3] 2文字以上の文字列 $α β$ のFirst集合の要素は、1文字目 $α$ に空文字の可能性がなければ1文字目のFirst集合、1文字目 $α$ に空文字の可能性があれば1文字目 $α$ と2文字目 $β$ のFirst集合 $First (α β \dots) \overset{R 3}{=} {\begin{array}{ccc} First (α) & (ε \notin First (α)) \\ First (α) \cup First (β \dots) & (ε \in First (α)) \end{array}$

※1: 例題・練習問題で公式3を適用する場合は $\overset{R 3}{=}$ と表記
※2: 1文字目も2文字目も空文字の可能性があれば、1文字目～3文字目のFirst集合の和を取ればOK^[5]一般化すると、1文字目からn文字目までの文字すべてに空文字があれば、1文字目～n+1文字目の和を取ればOK。。

(3) 例題で確認！

ここからは、1題例題を実際に解いてみましょう。

例題1

次の文法 $G$ がある。 $G = ({S, A, B}, {a, b, c, d}, P, S)$ $\begin{aligned} P = {S & \to a A \\ A & \to b B a | ε \\ B & \to S c | d} \end{aligned}$ この文法 $G$ に対し、

(1) $First (S)$
(2) $First (A)$
(3) $First (B)$

をそれぞれ求めなさい。

解説の前に、First集合を求める手順について確認しておきましょう。

First集合求める手順

ある非終端記号 $A$ のFirst集合 $First (A)$ は次の手順で求める。

Step1. $A$ が生成元となる規則 $\begin{aligned} A & \to α \\ A & \to β \\ A & \to γ \\ ⋮ \end{aligned}$ をすべて探す。

Step2. Step1で探したすべての生成規則の生成先（右辺） $α$ , $β$ , $γ$ のFirst集合 $First (α)$ , $First (β)$ , $First (γ)$ を求める。

Step3. Step2で求めたFirst集合の和を取る。 $First (A) = \underset{A \to α}{\underset{⏟}{First (α)}} \cup \underset{A \to β}{\underset{⏟}{First (β)}} \cup \underset{A \to γ}{\underset{⏟}{First (γ)}} \cup \dots$

First(S) の求め方

$S$ が生成元になる規則は、 $S \to a A$ ただ1つですね。

そのため、 $\begin{aligned} First (S) & \overset{R 2}{=} \underset{S \to a A}{\underset{⏟}{First (a A)}} \\ \overset{R 3}{=} First (a) \\ \overset{R 1}{=} {a} \end{aligned}$ で計算できます。

First(A) の求め方

$A$ が生成元になる規則は、 $A \to b B a | ε$ 、つまり $A \to b B a$ と $A \to ε$ の2つですね。

そのため、 $\begin{aligned} First (A) & \overset{R 2}{=} \underset{A \to b B a}{\underset{⏟}{First (b B a)}} \cup \underset{A \to ε}{\underset{⏟}{First (ε)}} \end{aligned}$ を求めればＯＫです。

ここで、それぞれのFirst集合は、 $\begin{aligned} First (b B a) & \overset{R 3}{=} First (b) \\ \overset{R 1}{=} {b} \end{aligned}$ $\begin{aligned} First (ε) & \overset{R 1}{=} {ε} \end{aligned}$ となるため、求めたいFirst集合は $\begin{aligned} First (A) & \overset{R 2}{=} First (b B a) \cup First (ε) \\ = {b} \cup {ε} \\ = {b, ε} \end{aligned}$ と計算できます。

First(B) の求め方

$B$ が生成元になる規則は、 $B \to S c | d$ 、つまり $B \to S c$ と $B \to d$ の2つですね。

そのため、 $\begin{aligned} First (B) & \overset{R 2}{=} \underset{B \to S c}{\underset{⏟}{First (S c)}} \cup \underset{B \to d}{\underset{⏟}{First (d)}} \end{aligned}$ を求めればＯＫです。

ここで、それぞれのFirst集合は、 $\begin{aligned} First (S c) & \overset{R 3}{=} First (S) \\ \overset{(1)}{=} {a} \end{aligned}$ $\begin{aligned} First (d) & \overset{R 1}{=} {d} \end{aligned}$ となるため、求めたいFirst集合は $\begin{aligned} First (B) & \overset{R 2}{=} First (S c) \cup First (d) \\ = {a} \cup {d} \\ = {a, d} \end{aligned}$ と計算できます。

※ $\overset{(1)}{=}$ は、(1)の答え $First (S) = {a}$ を使っていることを表しています。

スポンサードリンク

3. Follow集合

(1) Follow 集合とはなにか

Follow集合 $Follow (A)$ は、「ある非終端記号1文字 $A$ 以降の文字をの直後に来る可能性がある文字（終端記号）の候補を集めた集合」を表します。

数式で書くと、 $Follow (A) = {a ∣ a \in V_{T}, α \overset{*}{\Rightarrow} \dots A a \dots}$ となります。（色部分を日本語の説明に対応させています）

例えば、 $Follow (A) = {a, b}$ の場合、 $A$ の後ろの文字列をすべて終端記号にした際、 $A$ の直後に来る文字列が $a$ , $b$ のいずれかであることを表します。

1点注意が必要なのは、Follow集合の要素に「空文字 $ε$ 」が出てくることは絶対にありません。

その代わりに、「 $A$ の直後に来る文字はありません（＝ $A$ が文字列の終端になりますよ）」というのを表す記号 $$$ がFollow集合の要素で使われます。

(2) Follow 集合で頭にいれておくべき3つの公式

各非終端記号に対してFollow集合を求めていくときには、公式1～公式3で出てきた要素すべての和を取ることで求めます。

そこで、この「(2) Follow集合で頭にいれておくべき3つの公式」では、公式1～公式3の式の紹介だけでなく、何故この式でFollow集合が求められるのかまで説明していきます。

公式1. 出発記号 S の直後は必ず文字列の終端 $

文脈自由文法では、下のようにどの文字列も出発記号 $S$ から与えられた生成規則により変換されていき、導出されます。 $S \overset{S \to A a B}{\to} A a B \overset{A \to a A}{\to} a A a B \overset{A \to a}{\to} a a a B \overset{B \to b}{\to} a a a b$

そのため、出発記号の後ろは必ず文字列の終端となりますね。

そのため、最初に出発記号に対するFollow集合 $Follow (S)$ に対しては、文字列の終端を表す $$$ を要素に追加します。 $Follow (S) + = {$}$

※1: 出発記号ではない非終端記号に対しては何もしなくてOKです。
※2: $X + = Y$ は、（集合 $X$ に含まれない）集合 $Y$ の要素を集合 $X$ に加えることを表します。数式で書くと、 $X = X \cup Y$ です。

公式2. 直後の文字が空文字にならない場合

Follow集合は、「ある非終端記号の直後に来る（終端記号の）文字の候補」を表すため、Follow集合を求める際には、まずは生成規則の生成元ではなく、生成先側の文字列に着目します。

例えば、 $S \to a A c B$ という規則があったとします。この規則を適用すると、 $A$ の直後には必ず $c B$ という文字が来ますよね。

このように、 $S \to a A c B$ のような求めたい非終端記号 $A$ が生成されている規則を見つけ、その直後に来る文字（今回は $c$ ）を見つけ出す（＋非終端記号であれば終端記号に変換する）ことでFollow集合を求められそうですね。

もう少し一般化して、 $Follow (A)$ の求め方を公式化していきましょう。

まず、求めたい非終端記号 $A$ が生成されている規則を探し出し、生成先の文字列を $A$ より前にある文字列 $α$ と $A$ より後ろにある文字列 $β$ に分け、 $S \to α A β$ の形にします。

例えば、 $S \to a A c B$ であれば、 $S \to \underset{α}{\underset{⏟}{a}} A \underset{β}{\underset{⏟}{c B}}$ より、 $α = a$ , $β = c B$ となります。

※1 $α$ はFollow集合の計算ではいらない子なので、求めなくてもOK。
※2 $α$ , $β$ に空文字が来てもOK。例えば、 $S \to a A$ であれば、 $α = a$ , $β = ε$ となる。

ここで、 $Follow (A)$ というのは、 $A$ の直後に出てくる文字列でしたね。

また、先ほど生成規則を $S \to α A β$ と書き換えましたね。つまり、「 $A$ の直後に出てくる文字列」というのは、「 $β$ の先頭に来る文字列」と言い換えることができますね。さらにもう1段階言い換えると、「 $β$ の先頭に来る文字列」は $First (β)$ と書くことができますね。

そのため、生成規則 $S \to α A β$ に対して、Follow集合に $Follow (A) + = First (β)$ と $First (β)$ を追加します。

ただし、First集合の要素に $ε$ が含まれる場合は、 $ε$ を無視してからFollow集合に追加してください。例えば、 $S \to α A β$ に対して、 $First (β) = {b, c, ε}$ であれば、 $\begin{aligned} Follow (A) + & = First (β) \\ = {b, c} \end{aligned}$ と、Follow集合に $b$ , $c$ の要素を加えます。そのため、 $S \to α A$ のように $A$ の直後の文字列 $β$ がそもそも存在しない場合は、この公式でFollow集合の追加は行われません^[6] $β$ がそもそも存在しない、つまり $β = ε$ のときは、\( \mathrm{First} ( \beta ) = \mathrm{First} ( \varepsilon ) \overset{ \mathrm{R1} }{=} \{ … Continue reading。

さらに、 $First (β)$ に $ε$ が含まれる（＝ $β$ が空文字になる可能性がある）場合や、 $S \to α A$ のように、そもそも $A$ が生成先の文字列の末尾になる場合は公式2を確認します。

公式3. 直後の文字が空文字になる可能性がある場合

生成規則 $S \to α A β$ において、

$β$ 部分がそもそも存在しない
（つまり $A \to α A$ となるとき）
$β$ 部分が存在していた場合でも $S \to α α A B$ , $B \to ε$ のように $β$ に空文字が来る可能性がある場合
（つまり $ε \in First (β)$ となる場合）

は、生成先 $α A β$ に着目するだけでは、 $A$ の直後に来る文字列（＝ $Follow (A)$ ）がわかりません。

ここで、 $S$ の直後の文字を $X$ としてから、 $S X$ に生成規則 $S \to a A$ を適用することを考えましょう。すると、 $S X \to a A X$ となり、「 $A$ の直後の文字」が「 $S$ の直後の文字」と同じになっていることがわかりますね。

青丸部分が空文字なら、 $A$ の直後の文字列は $S$ の直後の文字列となる。

つまり、 $S \to ε \in First (β)$ 、つまり $β$ 部分が空文字になる（つまり $S \to a A$ となる）可能性がある場合は $Follow (A) + = Follow (S)$ と、生成元 $S$ の非終端記号の直後の文字、つまり $Follow (S)$ を $Follow (A)$ に追加します。

$ε \in First (β$ \) のとき、で1つにまとめてもOK
（本記事では分かりやすさ重視のため、2つに分けています）

注意: 右再帰 A → αAが含まれる場合

$A \to a b A$ のように「生成先の文字列の終端が生成元の文字列になっている」生成規則の場合、 $\begin{aligned} Follow (A) + & = Follow (A) \\ = Follow (A) \cup Follow (A) \end{aligned}$ となるため、 $Follow (A)$ に要素が一切追加されません。

そのため、右再帰 $A \to α A$ となる文法に対しては、Follow集合を求める際には無視してください。

特に注意が必要なのが、 $A \to a B, B \to b A$ のように見た目は右再帰な規則は含まれていないものの、変形してみると $A \to a B \to a b A$ のように間接的に右再帰な規則が含まれる場合です。

この場合、生成規則 $A \to a B$ に対しては $A \to a B$ より $\begin{aligned} Follow (B) + & = Follow (A) \\ = Follow (B) \cup Follow (A) \end{aligned}$ が成立するため、 $Follow (B)$ に対して、 $Follow (A)$ の要素を追加されるような式が出てきます。

さらに、 $Follow (A)$ を求めていきましょう。 $B \to b A$ より $\begin{aligned} Follow (A) + & = Follow (B) \\ = Follow (A) \cup Follow (B) \end{aligned}$ なり、 $Follow (A)$ に対して $Follow (B)$ を追加するような式が出てきます。

すると、

$Follow (A)$ を求めるためには追加される要素である $Follow (B)$ を求める必要がある
$Follow (B)$ を求めるためには追加される要素である $Follow (A)$ を求める必要がある

という「無限ループ」が発生し、訳が分からないことが起こってしまいます。

ここで、式ではなく意味的に考えてみましょう。ある非終端記号 $A$ Follow集合 $Follow (A)$ とは、「 $A$ の直後に来る非終端記号の候補を集めた集合」でしたね。

そこで、ある非終端記号 $A$ を間接的な右再帰規則 $A \to a B$ , $B \to b A$ だけで変換していくことで、Follow集合がどうなるかを見てみましょう。

すると、 $A \to a B$ の変化から、 $A$ の直後の非終端記号（ $Follow (A)$ ）と $B$ の直後の非終端記号（ $Follow (B)$ には変化がないことがわかりますね。また $a B \to a b A$ の変化から、 $B$ の直後の非終端記号（ $Follow (B)$ ）と $A$ の直後の非終端記号（ $Follow (A)$ にも変化がないことがわかりますね。

よって、 $A \to a B$ , $B \to b A$ のような間接的な右再帰規則が含まれている場合、Follow集合に追加されるような要素は存在しないこと、および $Follow (A)$ , $Follow (B)$ が等しくなることがわかりますね^[7] $A \to a B$ より、\[\begin{align*}\mathrm{Follow} ( \textcolor{magenta}{B} ) + & = \mathrm{Follow} ( \textcolor{magenta}{A} )\ & = … Continue reading。

そのため、Follow集合を求める際には、直接的な右再帰規則 $A \to α A$ だけでなく、間接的な右再帰規則 $A \to a B$ , $B \to b A$ が含まれている場合（＝一意に答えが決定できないような形が出てきた場合）でも、間接的な左再帰が出てくる式（例えば $A \to a B$ , $B \to b A$ ）をすべて無視し、残りの生成規則からFollow集合を求めてください。ただし、間接的な左再帰に寄与している非終端記号（今回の例だと $A$ , $B$ ）同士のFirst集合は等しくなる点は忘れないでください。

間接的な左再帰に寄与している非終端記号同士の
Follow集合は等しくなる（＝一心同体）

Follow集合を求める際に使う3つの公式まとめ

Follow集合は[公式1]～[公式3]で出てきた要素の和で求められる。

※ ただし、 $X + = Y$ は、 $X = X \cup Y$ を表す。（集合 $Y$ の要素を集合 $X$ に加える）

[公式1] 出発記号 $S$ の場合は文字列の終端を表す $$$ を追加する。 $\begin{array}{r} Follow (S) + = {$} \end{array}$

[公式1]適用後、各非終端記号

A

ごとに、生成先に

A

が含まれる生成規則を

$A$ より前の文字列 $α$
$A$ より後ろの文字列 $β$

に分けて $S \to α A β$ の形に分けたあと、公式1・公式2のどちらか（もしくは両方）を適用し、 $Follow (A)$ に集合を追加する。

※ $α$ と $β$ は空文字でもOK。

例1: $B \to A c$ のとき： $α = ε$ , $β = c$
例2: $B \to d A$ のとき： $α = d$ , $β = ε$
例3: $B \to A$ のとき： $α = ε$ , $β = ε$

[公式2]

$β$ (空文字ではない)何かしらの文字列があれば、 $First (β)$ を除くすべての集合を $Follow (A)$ に加える。 $Follow (A) + = First (β) - {ε}$ ※ $β$ がそもそも空文字（つまり $S \to α A$ ）の場合はこの公式を適用しない。

[公式3]

$β$ がそもそも空文字（つまり $S \to α A$ ）もしくは空文字ではないが $First (β)$ の要素に $ε$ が含まれる場合は、集合 $S$ のFollow集合 $Follow (S)$ を $Follow (A)$ に加える。 $Follow (A) + = Follow (S)$

※ $A \to α A$ のような→再帰が含まれる文法が出てきた場合は無視する（間接的な右再帰、例えば $A \to α B$ , $B \to β A$ など）が出てきた場合も無視するが、間接的な左再帰に寄与する非終端記号（例の場合だと $A$ , $B$ ）同士のFollow集合は等しくなる。）。

(3) 例題で確認！

ここからは、例題1でも出てきた文法を使って、実際にFollow集合を求め方を見ていきましょう。

例題2

次の文法 $G$ がある。 $G = ({S, A, B}, {a, b, c, d}, P, S)$ $\begin{aligned} P = {S & \to a A \\ A & \to b B a | ε \\ B & \to S c | d} \end{aligned}$ この文法 $G$ に対し、

(1) $Follow (S)$
(2) $Follow (A)$
(3) $Follow (B)$

をそれぞれ求めなさい。

※ 必要であれば例題1で求めた $\begin{aligned} First (S) & = {a} \\ First (A) & = {b, ε} \\ First (B) & = {a, d} \end{aligned}$ を用いてもよい。

解説の前に、もう1度Follow集合を求める手順について確認しておきましょう。

Follow集合を求める手順

ある非終端記号 $A$ のFollow集合 $Follow (A)$ はつぎの「準備」の後、下に示す公式[R1]と公式[R2]で出てくる要素を全て追加することで求められる。

[公式1] 出発記号かどうかの確認

$A$ が出発記号であるか確認し、出発記号であれば要素に $$$ を加えた状態でスタート。それ以外の場合は要素なしでスタート。

$A$ が出発記号である: $Follow (A) + = {$}$
$A$ が出発記号でない: なにもしない

[公式2], [公式3] では $S \to a b A B c$ のような生成先に $S$ が出てくる規則それぞれに対し、 $S \to α A β$ のように $A$ の前の文字列 $α$ と $A$ の後の文字列 $β$ に分けてから考える。

※ $α$ , $β$ は空文字OK。例えば、 $S \to A$ であれば、 $α$ , $β$ ともに空文字 $ε$ となる。

[公式2] $β \neq ε$ であれば適用

生成規則 $S \to α A β$ に対し、 $β$ が空文字ではない場合、 $First (β)$ の要素を加える。ただし $ε$ は加えない。 $Follow (A) + = First (β) - {ε}$

[公式3] $ε \in First (β)$ であれば適用

$S \to α A$ のように $β = ε$ となる場合や、 $S \to α A β$ の形だが $ε \in First (β)$ となる場合は、 $Follow (S)$ の要素を加える。 $Follow (A) + = Follow (S)$

(1) Follow(S) の求め方

まず、 $S$ は出発記号なので、初期状態として要素 $$$ を加えます。

つぎに、 $S$ が生成先に出てくる規則は、 $B \to S c$ 1つだけなので、この生成規則に着目しましょう。

着目した生成規則の生成先 $S c$ において、 $S$ より後の文字列は $c$ ですね。よって、 $β = c$ となります。

[公式2] $β = c \neq ε$ なので〇

生成規則 $B \to S \underset{β}{\underset{⏟}{c}}$ より、 $Follow (S)$ に追加される要素は、 $\begin{aligned} Follow (S) + & = First (c) - {ε} \\ \overset{R 1}{=} {c} - {ε} \\ = {c} \end{aligned}$ と求められます。よって、 $Follow (S)$ に $c$ が追加されます。

[公式3] $ε \notin First (c) = {c}$ なので×

よって、 $\begin{aligned} Follow (S) & = {$} \cup {c} \\ = {c, $} \end{aligned}$ となります。

(2) Follow(A) の求め方

[公式1] $A$ は出発記号ではないため×

つぎに、 $A$ が生成先に出てくる規則は、 $S \to a A$ , $A \to b B A$ の2つがありますが、 $A \to b B A$ は右再帰なので無視します。そのため、[公式2], [公式3] に当てはめる生成規則は $S \to a A$ だけでOKです。

着目した規則の生成先 $a A$ において、 $A$ より後の文字列はありません（＝空文字です）ね。よって、 $β = ε$ です。

[公式2] $β = ε$ なので×

[公式3] $ε \in First (ε) = {ε}$ なので〇

生成規則 $S \to a A$ より、 $Follow (A)$ に追加される要素は、

$\begin{aligned} Follow (A) + & = Follow (S) \\ \overset{(1)}{=} {c, $} \end{aligned}$ と求められます。よって、 $Follow (A)$ に $c, $$ が追加されます。

したがって、 $Follow (A)$ は $\begin{aligned} Follow (A) & = {c, $} \end{aligned}$ と計算できます。

(3) Follow(B) の求め方

[公式1] $B$ は出発記号ではないため×

ここで、 $B$ が生成先に出てくる規則は、 $A \to b B A$ の1つだけですね。なので [公式2], [公式3] に当てはめる生成規則は $A \to b B A$ だけです。

着目した生成規則の生成先 $b B A$ において、 $B$ より後の文字列は $A$ ですね。よって、 $β = A$ となります。

[公式2] $β = A \neq ε$ なので〇

生成規則 $A \to b B \underset{β}{\underset{⏟}{A}}$ より、 $Follow (B)$ に追加される要素は、 $\begin{aligned} Follow (B) + & = First (A) - {ε} \\ = {b, ε} - {ε} \\ = {b} \end{aligned}$ と求められます。よって、 $Follow (B)$ に $b$ が追加されます。

[公式3] $ε \in First (A) = {b, ε}$ なので〇

生成規則 $A \to b B A$ より、 $Follow (B)$ に追加される要素は、

$\begin{aligned} Follow (B) + & = Follow (A) \\ \overset{(2)}{=} {c, $} \end{aligned}$ と求められます。よって、 $Follow (B)$ に $c, $$ が追加されます。

したがって、 $Follow (B)$ は $\begin{aligned} Follow (B) & = {b} \cup {c, $} \\ = {b, c, $} \end{aligned}$ と計算できます。

(4) Follow集合の計算ミスを防ぐコツ：図を書く

※ このアイデアは、国島丈生様のこちらのサイトを参考にさせていただきました。
（FOLLOW()の計算を間違えにくくする工夫）

Follow集合は、First集合に比べて計算が複雑になるため、計算ミスがかなり出てきます^[8]実際に私もよく計算ミスします。。

そこで、今回の記事では下の図ように「Follow集合にどの集合の要素が追加されているか」を図で表現しています^[9]下の図の場合「 $Follow (S)$ を求めるためには $First (c)$ と ${$}$ の要素を追加すればOK」ということを表しています。。

さらに、各非終端記号ごとに書いたFollow集合の計算図示を下のように1つにまとめることで、Follow集合同士の関係（どのFollow集合の要素がどのFollow集合に加えられているのか）も明確にすることができます。

図を書くことで、「矢印に従って集合を追加していく」するだけで簡単にFollow集合を求めることができます！

※ 追加時に $ε$ が出てくる場合は無視してください。

さらに図を書くもう1つメリットは検算が容易にできることです。

理由は、「ある集合 $A$ の要素を集合 $B$ に追加」した場合、集合の包含関係 $A \subseteq B$ は必ず成立するからです^[10]集合 $B$ に集合 $A$ の要素を追加したのに、集合 $B$ の要素の中に集合 $A$ … Continue reading。

例えば、下の図は $First (c)$ の要素を $Follow (S)$ に追加しているため、 $First (c) \subseteq Follow (S)$ が必ず成立します。

この包含関係を、書いた図の中に出てくる矢印それぞれ（下の図の場合は5か所）でチェックします^[11]具体的には、 ${$} \subseteq Follow (S)$ , $First (c) \subseteq Follow (S)$ , $Follow (S) \subseteq Follow (A)$ , \( \mathrm{First} (A) … Continue reading。矢印すべての箇所で包含関係が成り立っていればOKです。

※ 1つでも成り立っていないものがあれば、計算ミスをしています。

4. Director集合とLL(1)文法の判定

(1) Director集合とは

ある文法がLL(1)文法、つまり「1文字の先読みをするだけで、与えられた文字列を構文解析できる文法」とはどのような文法なのかをもう少し詳しく見ていきましょう。

例えば、文字列 $b a b a$ が生成規則 $\begin{aligned} S & \to a S \\ S & \to b A \\ S & \to b A b \\ A & \to a \end{aligned}$ の文法を満たすか「1文字の先読み」で判定することを考えましょう。

まず、1文字目を先読みすると $b$ となりますね。出発記号 $S$ から $b$ で始まる規則を探そうとしますが、 $S \to b A$ と $S \to b A b$ の2つが存在してしまっているため、どちらの文法規則を使っていいかわかりません。

このように、同じ非終端記号から生成される文字列を終端記号にした文字列の先頭が $S \to b A, S \to b A b$ のように重複していると、「1文字の先読みだけでは、どの構文規則を適用すればよいかわからなくなるため、与えられた文字列を構文解析できない」ことがわかりますね。

言い換えると、LL(1)文法であるかを判定するためには、同一非終端記号から生成されるすべての生成規則に対し、生成される可能性がある「終端記号の文字列の先頭文字」がすべて異なっていればOKですね。

(2) Director集合の定義と計算公式

LL(1)文法であるかを機械的に判定するために登場したのがDirector集合です。

Director集合は、生成規則 $A \to α$ に対し、「 $A$ から生成される文字列 $α$ をすべて終端記号にしたときの先頭に来る文字の候補」を表しており、 $Director (A, α)$ と表記します。

[Director集合の計算公式1] αに空文字が来ない場合

ここで、生成規則 $A \to α$ の生成先 $α$ をすべて終端記号にしたときの先頭に来る文字の候補というのは、 $α$ に空文字が来ない限り $First (α$ と書き換えることができます。

よって、 $α$ に空文字が来ない場合（ $= ε \notin First (α)$ ）は、 $Director (A, α) = First (α)$ でDirector集合を求めることが可能です。

[Director集合の計算公式2] αに空文字が来る可能性がある場合

しかし、 $A \to ε$ が代入される可能性がある（ $= ε \in First (α)$ ）場合、下のように $A \to ε$ が適用されることで $A$ のつぎの文字列 $X$ が先頭に出てくる可能性があります。 $A X \overset{A \to ε}{\to} X$ そのため、 $ε \in First (α)$ となる場合は $First (α)$ に加えて $A$ の直後に来る終端記号の文字を表す $Follow (A)$ もDirector集合に加えます。

よって、 $α$ に空文字が来る場合（ $= ε \in First (α)$ ）は、 $Director (A, α) = Follow (A)$ でDirector集合を求めることが可能です。

Director集合の定義

ある生成規則 $A \to α$ に対し、 $A$ を変形した際に先頭に来る文字列の候補をDirector集合と呼び、 $Director (A, α)$ で記す。

ここで、Director集合はつぎのように計算ができる。

[公式1]

α

が空文字とならない場合（

ε \notin First (α)

）

Director (A, α) = First (α) - {ε}

[公式2]

α

が空文字となりうる場合（

ε \in First (α)

）

Director (A, α) = First (α) \cup Follow (A) - {ε}

※ 特に $A \to ε$ の場合、 $Director (A, α) = Follow (A)$ と計算できる。（[公式2]の変形）

(3) Director集合を用いたLL(1)文法の判定

LL(1)文法であるかどうかは、同一非終端記号から生成されるすべての生成規則に対し、生成される可能性がある「非終端記号の文字列の先頭文字」がすべて異なっていればOKでしたね。

このLL(1)文法であるかの判定をDirector集合を用いて書くと下のようになります。

Director集合を用いたLL(1)文法の判定法

ある文法がLL(1)文法であることを確認するためには、2つ以上の生成元を持つすべての非終端記号に対し、同じ生成元 $A$ のどの2つの規則 $A \to α_{i}$ , $A \to α_{j}$ を選んでも $Director (A, α_{i}) \cap Director (A, α_{j}) = ϕ$ が成立すればLL(1)文法である。（1つでも成り立たないものがあった時点でLL(1)文法ではない。）

[例]

生成規則 $\begin{aligned} A & \to α_{1} | α_{2} \\ B & \to β_{1} \\ C & \to γ_{1} | γ_{2} | γ_{3} \end{aligned}$ からなる文法の場合、2つ以上の生成元を持つ非終端記号は $A$ （2つ）と $C$ （3つ）である。

(i) $A$ で確認する内容 $Director (A, α_{1}) \cap Director (A, α_{2}) = ϕ$

(ii) $C$ で確認する内容 $\begin{aligned} Director (C, γ_{1}) \cap Director (C, γ_{2}) & = ϕ \\ Director (C, γ_{1}) \cap Director (C, γ_{3}) & = ϕ \\ Director (C, γ_{2}) \cap Director (C, γ_{3}) & = ϕ \end{aligned}$ ※ 3つの生成規則の中から2つを選ぶ組み合わせは、(生成規則1, 生成規則2), (生成規則1, 生成規則3), (生成規則2, 生成規則3) の3通りあるので、3通りとも調べる必要あり。

この(i), (ii)で出てきた式（合計4つ）がすべて成立すればLL(1)文法であることが言えます。一方、どれか1つでも成立しなかった時点でLL(1)文法ではありません。

(4) 例題で確認してみよう

Director集合の算出、およびLL(1)文法の確認を例題で確認していきましょう。

例題3

次の文法 $G$ がある。 $G = ({S, A, B}, {a, b, c, d}, P, S)$ $\begin{aligned} P = {S & \to a A \\ A & \to b B a | ε \\ B & \to S c | d} \end{aligned}$ この文法 $G$ がLL(1)文法であることを確認しなさい。

※ 必要であれば例題1, 例題2で求めた $\begin{aligned} First (S) & = {a} \\ First (A) & = {b, ε} \\ First (B) & = {a, d} \\ Follow (S) & = {c, $} \\ Follow (A) & = {c, $} \\ Follow (B) & = {b . c, $} \end{aligned}$ を用いてもよい。

[解説]

LL(1)文法であるか判定するためには、2つ以上の生成規則を持つ各非終端記号に対して、Director集合を取り、その積を確認します。

(i) $A$ が生成元の生成規則 $A \to b B a$ , $A \to ε$ に対してDirector集合確認

$A \to b B a$ のDirector集合 $\begin{aligned} Director (A, b B a) & = First (b B a) \\ \overset{R 3}{=} First (b) \\ \overset{R 1}{=} {b} \end{aligned}$

$A \to ε$ のDirector集合 $\begin{aligned} Director (A, ε) & = Follow (A) \\ = {c, $} \end{aligned}$

$A$ に関する各Director集合の積を取ると、 $\begin{aligned} Director (A, b B a) \cap Director (A, ε) & = {b} \cap {c, $} \\ = ϕ \end{aligned}$ となるためOK。

(ii) $B$ が生成元の生成規則 $B \to S c$ , $B \to d$ に対してDirector集合確認

$B \to S c$ のDirector集合 $\begin{aligned} Director (B, S c) & = First (S c) \\ \overset{R 3}{=} First (S) \\ = {a} \end{aligned}$

$B \to d$ のDirector集合 $\begin{aligned} Director (B, d) & = First (d) \\ \overset{R 1}{=} {d} \end{aligned}$

$B$ に関する各Director集合の積を取ると、 $\begin{aligned} Director (B, S c) \cap Director (B, d) & = {a} \cap {d} \\ = ϕ \end{aligned}$ となるためOK。

(i), (ii)よりLL(1)文法であることが確認できた。

※ $S$ に対しては、 $S \to a A$ の1つの生成規則しかないため、Director集合は求めなくてOK。

5. 練習問題

それでは、ここまでの学習内容を練習問題を通じておさらいしていきましょう。

今回は、2問の練習問題を用意しています。

練習1.

練習1

次の文法 $G$ がある。 $G = ({S, A, B}, {a, b, c, d}, P, S)$ $\begin{aligned} P = {S & \to a A a \\ A & \to b B | S B \\ B & \to c B | d A b | ε} \end{aligned}$ つぎの(1)～(3)の問いに答えなさい。

(1) $First (S)$ , $First (A)$ , $First (B)$ を求めなさい。
(2) $Follow (S)$ , $Follow (A)$ , $Follow (B)$ を求めなさい。
(3) この文法 $G$ はLL(1)文法かどうかを理由を踏まえて答えなさい。

練習2.

練習2

次の文法 $G$ がある。 $G = ({S, A, B, C}, {a, b, c, d}, P, S)$ $\begin{aligned} P = {S & \to A a B \\ A & \to c C A | c \\ B & \to S | B A | ε \\ C & \to B c} \end{aligned}$ つぎの(1)～(4)の問いに答えなさい。

(1) $First (S)$ , $First (A)$ , $First (B)$ , $First (C)$ を求めなさい。
(2) $Follow (S)$ , $Follow (A)$ , $Follow (B)$ , $Follow (C)$ を求めなさい。
(3) この文法 $G$ はLL(1)文法かどうかを理由を踏まえて答えなさい。

6. 練習問題の答え

解答1.

規則 $\begin{aligned} P = {S & \to a A a \\ A & \to b B | S B \\ B & \to c B | d A b | ε} \end{aligned}$ で表される文法に対してFirst集合、Follow集合、Director集合を求めてLL(1)文法を判定する。

(1) First集合の算出

[略解]

\begin{aligned} First (S) & = {a} \\ First (A) & = {a, b} \\ First (B) & = {c, d, ε} \end{aligned}

(i) $First (S)$ の計算

$S$ が生成元の規則は $S \to a A a$ の1つだけなので、 $S \to a A a$ だけに着目すればOK。

$\begin{aligned} First (S) & \overset{R 2}{=} \underset{S \to a A a}{\underset{⏟}{First (a A a)}} \\ \overset{R 3}{=} First (a) \\ \overset{R 1}{=} {a} \end{aligned}$

(ii) $First (A)$ の計算

$A$ が生成元の規則は $A \to b B$ と $A \to S B$ の2つがある。

そのため、 $First (A)$ を求める際には $A \to b B$ と $A \to S B$ の2つの規則に着目すればOK。 $First (A) \overset{R 2}{=} \underset{A \to b B}{\underset{⏟}{First (b B)}} \cup \underset{A \to S B}{\underset{⏟}{First (S B)}}$

ここでそれぞれの項のFirst集合は以下のように計算できる。

$\begin{aligned} First (b B) & \overset{R 3}{=} First (b) \\ \overset{R 1}{=} {b} \end{aligned}$

$\begin{aligned} First (S B) & \overset{R 3}{=} First (S) \\ \overset{(1)}{=} {a} \end{aligned}$

よって、 $\begin{aligned} First (A) & \overset{R 2}{=} \underset{A \to b B}{\underset{⏟}{First (b B)}} \cup \underset{A \to S B}{\underset{⏟}{First (S B)}} \\ = {b} \cup {a} \\ = {a, b} \end{aligned}$ となる。

(iii) $First (B)$ の計算

$B$ が生成元の規則は $B \to c B$ , $B \to d A b$ , $B \to ε$ の3つがある。

そのため、 $First (B)$ を求める際には $B \to c B$ , $B \to d A b$ , $B \to ε$ の3つの規則に着目すればOK。 $First (B) \overset{R 2}{=} \underset{B \to c B}{\underset{⏟}{First (c B)}} \cup \underset{B \to d A b}{\underset{⏟}{First (d A b)}} \cup \underset{B \to ε}{\underset{⏟}{First (ε)}}$

ここでそれぞれの項のFirst集合は以下のように計算できる。

$\begin{aligned} First (c B) & \overset{R 3}{=} First (c) \\ \overset{R 1}{=} {c} \end{aligned}$

$\begin{aligned} First (d A b) & \overset{R 3}{=} First (d) \\ \overset{(1)}{=} {d} \end{aligned}$

$\begin{array}{r} First (ε) \overset{R 1}{=} {ε} \end{array}$

よって、 $\begin{aligned} First (B) & \overset{R 2}{=} First (c B) \cup First (d A b) \cup First (ε) \\ = {c} \cup {d} \cup {ε} \\ = {c, d, ε} \end{aligned}$ となる。

(2) Follow集合の算出

[略解]

\begin{aligned} Follow (S) & = {a, b, c, d, $} \\ Follow (A) & = {a, b} \\ Follow (B) & = {a, b} \end{aligned}

(i) $Follow (S)$ の算出式

[公式1]

S

は出発記号？ → Yes。なので、

Follow (S)

に

$

を追加。

Follow (S) + = {$}

$S$ が生成先に含まれる規則は、 $A \to S B$ のみなので、 $A \to S B$ にのみ着目すればOK。

ここで、 $A \to S \underset{β}{\underset{⏟}{B}}$ より、 $β = B$ とおく。

[公式2]

β \neq ε

？ →

β = B \neq ε

なのでYes。

なので、 $A \to S B$ に対し、以下の集合の要素を追加。\( A $\begin{aligned} Follow (S) + & = First (B) - {ε} \\ = {c, d, ε} - {ε} \\ = {c, d} \end{aligned}$

[公式3]

ε \in First (β)

？ →

First (β) = {c, d, ε}

なのでYes。

なので、 $A \to S B$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (S) + & = Follow (A) \end{aligned}$

よって、 $Follow (S)$ に追加される要素は以下の図で示す通り。

(ii) $Follow (A)$ の算出式

[公式1]

A

は出発記号？ → No。

$A$ が生成先に含まれる規則は、 $S \to a A a$ , $B \to d A b$ の2つなので、この2つの規則に着目すればOK。

[a] $S \to a A a$ に着目したとき

$S \to a A \underset{β}{\underset{⏟}{a}}$ とおく。（つまり $β = a$ ）

[公式2]

β \neq ε

？ →

β = a \neq ε

なのでYes。

なので、 $S \to a A a$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (A) + & = First (a) \\ = {a} \end{aligned}$

[公式3]

ε \in First (β)

？ →

First (β) = First (a) = {a}

なのでNo。

[b] $B \to d A b$ に着目したとき

[公式2]

β \neq ε

？ →

β = b \neq ε

なのでYes。

なので、 $S \to d A b$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (A) + & = First (b) \\ = {b} \end{aligned}$

[公式3]

ε \in First (β)

？ →

First (β) = First (b) = {b}

なのでNo。

よって、 $Follow (A)$ に追加される要素は以下の図で示す通り。

(iii) $Follow (B)$ の算出式

[公式1]

B

は出発記号？ → No。

$B$ が生成先に含まれる規則は、 $A \to b B$ , , $A \to S B$ , $B \to c B$ の3つ。ただし、 $B \to c B$ は右再帰規則のため無視。なので、 $A \to b B$ , $A \to S B$ の2つの規則に着目すればOK。

[a] $A \to b B$ に着目したとき

$A \to b B$ の $B$ の後ろの文字が存在しない。そのため、 $β = ε$ である。

[公式2]

β \neq ε

？ →

β = ε

なのでNo。

[公式3]

ε \in First (β)

？ →

First (β) = First (ε) = {ε}

なのでYes。

なので、 $A \to b B$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (B) + & = Follow (A) \end{aligned}$

[b] $A \to S B$ に着目したとき

$A \to S B$ の $B$ の後ろの文字が存在しない。そのため、 $β = ε$ である。

[公式2]

β \neq ε

？ →

β = ε

なのでNo。

[公式3]

ε \in First (β)

？ →

First (β) = First (ε) = {ε}

なのでYes。

なので、 $A \to S B$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (B) + & = Follow (A) \end{aligned}$

※ 式から察している人もいるかもしれませんが、[a] の生成式と全く同じ結果が出てきます。

よって、 $Follow (B)$ に追加される要素は以下の図で示す通り。

$Follow (A)$ で追加される要素の図示
（代表として $A \to S B$ を選択）

それぞれの計算結果をまとめてFollow集合を算出

先ほど出した $Follow (S)$ , $Follow (A)$ , $Follow (B)$ の計算過程を1つの図に表すと、下のようになる。

あとは、求められるFollow集合から順にFollow集合を求めていけばOK。

※ 今回の場合は、 $Follow (A)$ を求めてから、 $Follow (S)$ と $Follow (B)$ を求めていく流れになりますね（ $Follow (S)$ と $Follow (B)$ はどっちから求めてもOK）。

(ii) $Follow (A)$ の計算結果

[計算式]

\begin{aligned} Follow (A) & = First (a) \cup First (b) - {ε} \\ = {a} \cup {b} \\ = {a, b} \end{aligned}

(i) $Follow (S)$ の計算結果

[計算式]

\begin{aligned} Follow (S) & = First (B) \cup Follow (A) \cup {$} - {ε} \\ = {c, d, ε} \cup {a, b} \cup {$} - {ε} \\ = {a, b, c, d, $} \end{aligned}

※

ε

を無視するのを忘れずに

(iii) $Follow (B)$ の計算結果

[計算式]

\begin{aligned} Follow (B) & = Follow (A) \\ = {a, b} \end{aligned}

※Follow集合の要素には

ε

が出てこないので、

ε

を引いていません。（引いてもOKです。）

(3) Director集合の算出とLL(1)文法の判定

各非終端記号に対して、生成元から2つ以上の生成規則を持つものは、

$A$ が生成元となる規則： $A \to b B$ , $A \to S B$
$B$ が生成元となる規則： $B \to c B$ , $B \to d A b$ , $B \to ε$

である。あとは、非終端記号ごとに「どの生成規則同士の積をとっても、Director集合が空集合になること」を確認すればOK。

1) $A$ が生成元の生成規則 $A \to b B$ , $A \to S B$ に対してDirector集合確認

$A \to b B$ のDirector集合 $\begin{aligned} Director (A, b B) & = First (b B) \\ \overset{R 3}{=} First (b) \\ \overset{R 1}{=} {b} \end{aligned}$

$A \to S B$ のDirector集合 $\begin{aligned} Director (A, S B) & = First (S B) \\ \overset{R 3}{=} First (S) \\ = {a} \end{aligned}$

$A$ に関する各Director集合同士の積を取ると、 $\begin{aligned} Director (A, b B) \cap Director (A, S B) & = {b} \cap {a} \\ = ϕ \end{aligned}$ となるためOK。

2) $B$ が生成元の生成規則 $B \to c B$ , $B \to d A b$ , $B \to ε$ に対してDirector集合確認

$B \to c B$ のDirector集合 $\begin{aligned} Director (B, c B) & = First (c B) \\ \overset{R 3}{=} First (c) \\ \overset{R 1}{=} {c} \end{aligned}$

$B \to d A b$ のDirector集合 $\begin{aligned} Director (B, d A b) & = First (d A b) \\ \overset{R 3}{=} First (d) \\ \overset{R 1}{=} {d} \end{aligned}$

$B \to ε$ のDirector集合 $\begin{aligned} Director (B, ε) & = Follow (B) \\ = {a, b} \end{aligned}$

$B$ に関する各Director集合同士の積を取ると、 $\begin{aligned} Director (B, c B) \cap Director (B, d A b) & = {c} \cap {d} = ϕ \\ Director (B, c B) \cap Director (B, ε) & = {c} \cap {a, b} = ϕ \\ Director (B, d A b) \cap Director (B, ε) & = {d} \cap {a, b} = ϕ \end{aligned}$ となるためOK。

1), 2) より、題意の文法はLL(1)文法である。

解答2.

規則 $\begin{aligned} P = {S & \to A a B \\ A & \to c C A | c \\ B & \to S | B A | ε \\ C & \to B c} \end{aligned}$ で表される文法に対してFirst集合、Follow集合、Director集合を求めてLL(1)文法を判定する。

(1) First集合の算出

[略解]

\begin{aligned} First (S) & = {c} \\ First (A) & = {c} \\ First (B) & = {c, ε} \\ First (C) & = {c} \end{aligned}

(i) $First (S)$ の計算 (途中まで)

$S$ が生成元の規則は $S \to A a B$ の1つだけなので、 $S \to A a B$ だけに着目すればOK。

$\begin{aligned} First (S) & \overset{R 2}{=} \underset{S \to A a B}{\underset{⏟}{First (A a B)}} \\ \overset{R 3}{=} First (A) \end{aligned}$ ※ まだ $First (A)$ が求まっていないため保留

(ii) $First (A)$ の計算（と $First (S)$ の計算再開）

$A$ が生成元の規則は $A \to c C A$ と $A \to c$ の2つがある。

そのため、 $First (A)$ を求める際には $A \to c C A$ と $A \to c$ の2つの規則に着目すればOK。 $First (A) \overset{R 2}{=} \underset{A \to c C A}{\underset{⏟}{First (c C A)}} \cup \underset{A \to c}{\underset{⏟}{First (c)}}$

ここでそれぞれの項のFirst集合は以下のように計算できる。

$\begin{aligned} First (c C A) & \overset{R 3}{=} First (c) \\ \overset{R 1}{=} {c} \end{aligned}$

$\begin{aligned} First (c) & \overset{R 1}{=} {c} \end{aligned}$

よって、 $\begin{aligned} First (A) & \overset{R 2}{=} First (c C A) \cup First (c) \\ = {c} \cup {c} \\ = {c} \end{aligned}$ となる。また、 $First (S)$ も

$\begin{aligned} First (S) & \overset{R 2}{=} First (A a B) \\ \overset{R 3}{=} First (A) \\ = {c} \end{aligned}$ と求められる。

(iii) $First (B)$ の計算

$B$ が生成元の規則は $B \to S$ , $B \to B A$ , $B \to ε$ の3つがある。

ただし、 $B \to B A$ は左再帰の文法なので無視する。そのため、 $First (B)$ を求める際には $B \to c B$ , $B \to d A b$ の2つの規則に着目すればOK。 $First (B) \overset{R 2}{=} \underset{B \to c B}{\underset{⏟}{First (c B)}} \cup \underset{B \to d A b}{\underset{⏟}{First (d A b)}}$

ここで、 $\begin{array}{r} First (ε) \overset{R 1}{=} {ε} \end{array}$ なので、 $First (B)$ は $\begin{aligned} First (B) & \overset{R 2}{=} First (S) \cup First (ε) \\ = {c} \cup {ε} \\ = {c, ε} \end{aligned}$ と計算できる。

(iv) $First (C)$ の計算

$C$ が生成元の規則は $C \to B c$ だけなので、この規則のみに着目する。

よって、 $\begin{aligned} First (C) & \overset{R 2}{=} \underset{C \to B c}{\underset{⏟}{First (B c)}} \\ \overset{R 3}{=} (First (B) - {ε}) \cup {c} ∵ (ε \in First (B)) \\ = {c} \cup {c} \\ = {c} \end{aligned}$ ※ $First (B)$ に $ε$ が含まれているため、公式が変化する点に注意！

(2) Follow集合の算出

[略解]

\begin{aligned} Follow (S) & = {c, $} \\ Follow (A) & = {a, c, $} \\ Follow (B) & = {c, $} \\ Follow (C) & = {c} \end{aligned}

(i) $Follow (S)$ の算出式

[公式1]

S

は出発記号？ → Yes。なので、

Follow (S)

に

$

を追加。

Follow (S) + = {$}

ここで、 $S$ が生成先に含まれる規則は、 $B \to S$ のみなので、 $B \to S$ にのみ着目すればOK。

$B \to S$ において、 $S$ の後ろの文字が存在しない。そのため、 $β = ε$ である。

[公式2]

β \neq ε

？ →

β = ε

なのでNo。

[公式3]

ε \in First (β)

？ →

First (β) = First (ε) = {ε}

なのでYes。

なので、 $B \to S$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (S) + & = Follow (B) \end{aligned}$

よって、 $Follow (S)$ で追加する要素（計算過程）は以下の図の通りである。

(ii) $Follow (A)$ の算出式

[公式1]

A

は出発記号？ →No。なにもしない。

ここで、 $A$ が生成先に含まれる規則は、 $S \to A a B$ , $A \to c C A$ , $B \to B A$ の3つがあるが、 $A \to c C A$ は右再帰な規則なので無視。よって、 $S \to A a B$ , $B \to B A$ の2つに着目すればOK。

[ii-a] $S \to a A a B$ に着目したとき

$S \to a A \underset{β}{\underset{⏟}{a B}}$ とおく。（つまり $β = a$ ）

[公式2]

β \neq ε

？ →

β = a B \neq ε

なのでYes。

なので、 $S \to a A a B$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (A) + & = First (a B) \\ \overset{R 3}{=} First (a) \\ \overset{R 1}{=} {a} \\ = {a} \end{aligned}$

[公式3]

ε \in First (β)

？ →

First (β) = First (a B) = {ε}

= \{ a \} \) なのでNo。

[ii-b] $B \to B A$ に着目したとき

この規則では、 $S$ の後ろの文字が存在しない。そのため、 $β = ε$ である。

[公式2]

β \neq ε

？ →

β = ε

なのでNo。

[公式3]

ε \in First (β)

？ →

First (β) = {ε}

なのでYes。

なので、 $B \to B A$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (A) + & = Follow (B) \end{aligned}$

よって、 $Follow (A)$ に追加される要素は以下の図で示す通り。

(iii) $Follow (B)$ の算出式

[公式1]

B

は出発記号？ →No。なにもしない。

ここで、 $B$ が生成先に含まれる規則は、 $S \to A a B$ , $B \to B A$ , $C \to B c$ の3つがあるため、この3つの規則に着目すればOK。

[iii-a] $S \to A a B$ に着目したとき

この規則では、 $B$ の後ろの文字が存在しない。そのため、 $β = ε$ である。

[公式2]

β \neq ε

？ →

β = ε

なのでNo。

[公式3]

ε \in First (β)

？ →

First (β) = First (ε) = {ε}

なのでYes。

なので、 $S \to A a B$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (B) + & = Follow (S) \end{aligned}$

[iii-b] $B \to B A$ に着目したとき

$B \to B \underset{β}{\underset{⏟}{A}}$ とおく。（つまり $β = A$ ）

[公式2]

β \neq ε

？ →

β = A \neq ε

なのでYes。

なので、 $B \to a B A$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (B) + & = First (A) \\ = {c} \end{aligned}$

[公式3]

ε \in First (β)

？ →

First (β) = First (A) = {c}

なのでNo。

[iii-c] $C \to B c$ に着目したとき

$C \to B \underset{β}{\underset{⏟}{c}}$ とおく。（つまり $β = c$ ）

[公式2]

β \neq ε

？ →

β = c \neq ε

なのでYes。

なので、 $C \to a B c$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (B) + & = First (c) \\ = {c} \end{aligned}$

[公式3]

ε \in First (β)

？ →

First (β) = First (c) = {c}

なのでNo。

[iii-a]～[iii-c] より、

Follow (B)

に追加される要素は以下の図で示す通り。

(iv) $Follow (C)$ の算出式

[公式1]

C

は出発記号？ →No。なにもしない。

ここで、 $C$ が生成先に含まれる規則は、 $A \to c C A$ のみ。なのでこの規則に着目すればOK。

この規則について、 $A \to c C \underset{β}{\underset{⏟}{A}}$ とおく。（つまり $β = A$ ）

[公式2]

β \neq ε

？ →

β = A \neq ε

なのでYes。

なので、 $C \to c C A$ に対し、以下の集合の要素を追加。 $\begin{aligned} Follow (C) + & = First (A) \\ = {c} \end{aligned}$

[公式3]

ε \in First (β)

？ →

First (β) = First (A) = {c}

なのでNo。

よって、 $Follow (C)$ に追加される要素は以下の図で示す通り。

それぞれの計算結果をまとめてFollow集合を算出

先ほど出した $Follow (S)$ , $Follow (A)$ , $Follow (B)$ , $Follow (C)$ の計算過程を1つの図に表すと、下のようになる。

※ 点線部分は、間接的な右再帰により、2つのFollow集合が等しい（＝一心同体）になっていることを表す。つまり $Follow (S) = Follow (B)$ 。

あとは、求められるFollow集合から順にFollow集合を求めていけばOK。

※ 今回の場合は、 $Follow (A)$ 集合は点線部分のFollow集合が求まらないと計算できません。それ以外の集合は自由な順番で計算できます。

(iv) $Follow (C)$ の計算結果

[計算式]

\begin{aligned} Follow (C) & = First (a) \\ = {c} \end{aligned}

(i), (iii) $Follow (S)$ , $Follow (B)$ の計算結果（2つのFollow集合は等しい）

[計算式]

\begin{aligned} Follow (S) & = {$} \cup First (A) \cup First (c) \\ = {$} \cup {c} \cup {c} \\ = {c, $} \end{aligned}

※

Follow (B)

加えられている要素もいったん

Follow (S)

に足している。

$\begin{aligned} Follow (B) & = Follow (S) \\ = {c, $} \end{aligned}$

(ii) $Follow (A)$ の計算結果

[計算式]

\begin{aligned} Follow (A) & = Follow (B) \cup First (a) \\ = {c, $} \cup {a} \\ = {a, c, $} \end{aligned}

※

Follow (B)

を

Follow (S)

としてもOK。

(3) Director集合の計算・LL(1)文法の判定

各非終端記号に対して、生成元から2つ以上の生成規則を持つものは、

$A$ が生成元となる規則： $A \to c C A$ , $A \to c$
$B$ が生成元となる規則： $B \to S$ , $B \to B A$ , $B \to ε$

である。あとは、非終端記号ごとに「どの生成規則同士の積をとっても、Director集合が空集合になること」を確認すればOK。

1) $A$ が生成元の生成規則 $A \to c C A$ , $A \to c$ に対してDirector集合確認

$A \to c C A$ のDirector集合 $\begin{aligned} Director (A, c C A) & = First (c C A) \\ \overset{R 3}{=} First (c) \\ \overset{R 1}{=} {c} \end{aligned}$

$A \to c$ のDirector集合 $\begin{aligned} Director (A, c) & = First (c) \\ \overset{R 1}{=} {c} \end{aligned}$

$A$ に関する各Director集合同士の積を取ると、 $\begin{aligned} Director (A, c C A) \cap Director (A, c) & = {c} \cap {c} \\ = {c} \end{aligned}$ となるためNG。

よって、題意の文法はLL(1)文法ではない。

※ 1つでも $ϕ$ にならないものがあればその時点でLL(1)文法ではないことが確認できるため、他のDirector集合は求めなくてOKです。

7. さいごに

かなり長い記事となっていましたが、以上が

LL(1)文法
First集合
Follow集合
Director集合

に関する説明でした。

この記事を見て、少しでもLL(1)文法やFirst, Follow, Director集合の計算の方法について理解いただけたのであれば非常にうれしいです。

次回は、左再帰な文法についての「問題点」と「左再帰を解消する方法」について説明する予定です。

[練習問題の中に入れられなかったおまけ問題] 生成規則

A \to B

に対するDirector集合

Director (A, B)

を求めなさい。ただし、

\begin{aligned} First (A) & = {a} \\ First (B) & = {b, ε} \\ Follow (A) & = {c} \\ Follow (B) & = {d, $} \end{aligned}

とする。解答はこの注釈に書いています。

注釈[+]

注釈
↑1	10文字弱、かつ生成規則が4つであればやみくもにやってもそこまで時間はかかりませんが、実際のプログラムに対して構文解析をする場合、膨大な文字数かつ膨大な生成規則があるため、やみくもにやっていると日が暮れてしまいます。
↑2	もう少し詳しく言うと、LL(1)文法はトップダウン構文解析（出発記号を起点として、どんどん生成規則を用いて分解していきながら解析する方法）において、1文字だけ先読みすることで文字列を後戻りすることなく構文解析ができる文法です。
↑3	$A \to A b$ のように左再帰文法となる規則を適用しても、先頭文字列は $A$ のまま変わらないため、無視しても問題ない。
↑4	いったん $\begin{aligned} First (A) & = First (B) \cup First (c) \\ = \underset{無視}{\underset{⏟}{First (A)}} \cup First (c) \\ = First (c) \end{aligned}$ のように、左辺に出てくるFirst集合（今回は $First (A)$ ）が右辺にも出てくる形にしてから、左辺にも右辺にも出てきたFirst集合を無視して計算してもOKです。
↑5	一般化すると、1文字目からn文字目までの文字すべてに空文字があれば、1文字目～n+1文字目の和を取ればOK。
↑6	$β$ がそもそも存在しない、つまり $β = ε$ のときは、 $First (β) = First (ε) \overset{R 1}{=} {ε}$ となるため、 $ε$ を無視すると追加できる集合がなくなる。
↑7	$A \to a B$ より、 $\begin{aligned} Follow (B) + & = Follow (A) \\ = Follow (B) \cup Follow (A) \end{aligned}$ の式が導出でき、 $B \to b A$ より、 $\begin{aligned} Follow (A) + & = Follow (B) \\ = Follow (A) \cup Follow (B) \end{aligned}$ となるため、数式的にも $Follow (A) = Follow (B)$ が言える。\
↑8	実際に私もよく計算ミスします。
↑9	下の図の場合「 $Follow (S)$ を求めるためには $First (c)$ と ${$}$ の要素を追加すればOK」ということを表しています。
↑10	集合 $B$ に集合 $A$ の要素を追加したのに、集合 $B$ の要素の中に集合 $A$ の一部の要素は実は入っていない、なんてことは起こりませんよね…？
↑11	具体的には、 ${$} \subseteq Follow (S)$ , $First (c) \subseteq Follow (S)$ , $Follow (S) \subseteq Follow (A)$ , $First (A) \subseteq Follow (B)$ , $Follow (A) \subseteq Follow (B)$ 5つが成立しているかすべて確かめればOKです。
↑12	$ε \in First (B)$ なので、 $B$ が空文字になる可能性を考慮するのがミソです。 $\begin{aligned} Director (A, B) & = First (B) \cup Follow (A) - {ε} \\ = {a, b} \end{aligned}$