Chương 2: ÔTÔMÁT HỮU HẠN VÀ BIỂU THỨC CHÍNH QUY
Nội dung Biểu thức chính quy Ôtômat hữu hạn Ôtômat hữu hạn tiền định Ôtômat hữu hạn không tiền định Sự tương đương giữa ô tô mát hữu hạn tiền định và không tiền định Sự tương đương giữa ô tô mát và biểu thức chính quy Văn phạm chính quy Các ngôn ngữ chính quy Các tính chất đóng của các ngôn ngữ chính quy Định lý “đùn”
I. Biểu thức chính quy (BTCQ) Định nghĩa: Cho bộ chữ là một BTCQ ε là một BTCQ a thì a là một BTCQ , là các BTCQ(+), (.), (*) là các BTCQ Chú ý: Trong BTCQ chỉ có 3 phép toán và thứ tự ưu tiên là *,.,+ Toán tử ghép tiếp “.” có thể viết:
Giá trị của BTCQ Một BTCQ trên biểu diễn một ngôn ngữ trên L()= ; L(ε)= {ε} L(a)={a} với a L((+))=L()L() L(())=L().L() L((*))=(L())* Ta gọi ngôn ngữ chính quy là mọi ngôn ngữ có thể được chỉ định bởi một biểu thức chính quy.
Ví dụ về BTCQ và giá trị Ví dụ: BTCQ Giá trị 00 {00} (0+1)* {0,1}* 00 {00} (0+1)* {0,1}* (0+1)*00(0+1)* {x|x{0,1}* và x chứa 2 con 0 liên tiếp} (1+10)* {x|x {0,1}* x có con 1 ở đầu và không có hai con 0 liên tiếp}
Tính chất của BTCQ Cho r, s, t là các BTCQ: (8) r+r=r r+s=s+r (9) r(st)=(rs)t (10) (r+s)t=rt+st (11) r=r= (12) *= ε (13) r+r*=r* (14) (r*s*)*=(r+s)* r+s=s+r r+(s+t)=(r+s)+t r(s+t)=rs+rt rε= εr=r r+=r (ε+r)*=r* (r*)*=r*
Ví dụ Hãy mô tả bằng lời các tập hợp chỉ định bởi các biểu thức chính quy sau: (11+0)*(00+1)* (1+01+001)*(ε+0+00)* [00+11+(01+10)(00+11)*(01+10)]* Bài tập: Cho biêu thức chính quy, tìm ngôn ngữ Cho ngôn ngữ tìm biểu thức chính quy
Cấu tạo của OHT Cấu tạo: Một băng vào: chứa xâu cần xử lý (xâu vào), mỗi ô chứa một kí tự Một đầu đọc: tại mỗi thời điểm trỏ vào một ô của băng vào và cho phép đọc kí hiệu trong ô đó Cái điều khiển (bộ chuyển trạng thái): tại mỗi thời điểm có một trạng thái: Các trạng thái là hữu hạn Có một trạng thái đầu và các trạng thái thừa nhận Một hàm dịch chuyển: cho phép xác định trạng thái tiếp theo dựa và trạng thái và kí hiệu đọc được hiện tại
II. Ôtômát hữu hạn Là máy đoán nhận ngôn ngữ Có hai loại: Ôtômát hữu hạn tiền định (đơn định)(ÔHT) Ôtômát hữu hạn không tiền định(ÔHK)
Cấu tạo của OHT 1 q Hình. Ôtômát hữu hạn tiền định Băng vào Đầu đọc Đầu đọc q Cái điều khiển Hình. Ôtômát hữu hạn tiền định
Nguyên lý hoạt động Ban đầu: OHT ở trạng thái đầu, đầu đọc trỏ vào kí hiệu đầu tiên của xâu vào Lặp: ÔHT đọc kí hiệu trên băng, xác định trạng thái tiếp theo dựa vào hàm dịch chuyển, đẩy đầu đọc sang phải một ô OHT dừng khi đọc hết xâu vào, nếu trạng thái cuối là trạng thái thừa nhận thì xâu và được thừa nhận (thuộc ngôn ngữ mà ôtômát mô tả)
Ôtômát hữu hạn tiền định Ví dụ: Cho ôtômát tiền định M, trong đó: Bộ chữ vào ={0,1} Q={q0, q1, q2, q}, q0 là trạng thái đầu F={q0} là tập trạng thái kết thúc Hàm dịch chuyển : Q× Q, cho bởi bảng bên Xâu vào: 1001 , 11, 0110 1 q0 q2 q1 q3
Định nghĩa OHT Định nghĩa: OHT là một bộ năm M=(,Q,,q0,F) trong đó: - tập hữu hạn các kí hiệu (bộ chữ vào) Q – tập hữu hạn các trạng thái, Q= :Q× Q là hàm dịch chuyển q0 Q là trạng thái đầu FQ là các trạng thái thừa nhận (trạng thái cuối)
Ôtômát tiền định Hệ viết lại ngầm định của ôtômát M là W=(V,P), trong đó: V=Q P: tập các sản xuất được xây dựng như sau: Nếu (q,a)=p thì qap là một quy tắc trong P Ngôn ngữ đoán nhận bởi M là: L(M)={| *, q0*qF}
Biểu diễn đồ thị của OHT Biểu diễn OHT bằng đồ thị: Mỗi nút biểu diễn một trạng thái cụ thể: Mỗi nút là một vòng tròn có tên trạng thái Có bao nhiêu trạng thái thì có bấy nhiêu nút Mỗi cung là một mũi tên chỉ hướng chuyển có kèm kí hiệu gây ra sự chuyển Nút trạng thái đầu có mũi tên chỉ vào Nút trạng thái cuối vẽ bằng nét kép
Biểu diễn đồ thị của OHT ĐỒ thị chuyển trạng thái tương ứng: Ví dụ: M=(,Q,,q0,F) ={0,1}; Q={q0, q1, q2}; F={q1} được cho bởi: (q0, 0)=q0, (q0, 1)=q1 (q1, 0)=q0, (q1, 1)=q2 (q2, 0)=q2, (q2, 1)=q1 ĐỒ thị chuyển trạng thái tương ứng:
Ôtômát hữu hạn không tiền định Định nghĩa: OHK là bộ 5 M=(,Q,,q0,F) trong đó: - bộ chữ vào Q – tập hữu hạn các trạng thái, Q= :Q×({ε})(Q) là hàm dịch chuyển q0 Q là trạng thái đầu FQ là các trạng thái thừa (trạng thái cuối)
Ôtômát hữu hạn không tiền định Ví dụ: Sơ đồ chuyển trạng thái của một OHK - Lấy ví dụ về một xâu vào
Ôtômát hữu hạn không tiền định OHK khác OHT: Từ một trạng thái gặp một kí hiệu được đọc vào có thể chuyển sang một số trạng thái tiếp theo (hàm chuyển là hàm đa trị) Từ một trạng thái có thể không cần kí hiệu vào OHK cũng chuyển trạng thái (dịch chuyển ε)
Sự tương đương giữa OHT và OHK Ta gọi: L(OHT) là lớp các ngôn ngữ được đoán nhận bởi OHT L(OHK) là lớp các ngôn ngữ được đoán nhận bởi OHK Ta chứng minh: L(OHT)=L(OHK) (tức là ngôn ngữ L được đoán nhận bởi OHT L cũng được đoán nhận bởi một OHK)
Sự tương đương giữa OHT và OHK L được đoán nhận bởi OHT thì cũng được đoán nhận bởi một OHK: Thêm một số trạng thái qi và một số bước chuyển sao cho: Các qi không thể đến được đích F Phá vỡ tính tiền định Như vậy, OHT trở thành OHK và cũng đoán nhận ngôn ngữ L L được đoán nhận bởi OHK thì cũng được đoán nhận bởi một OHT: Loại bỏ dịch chuyển Loại bỏ các đặc tính không tiền định
Sự tương đương giữa OHT và OHK Loại bỏ dịch chuyển –ε: Định lý II.1: Nếu một ngôn ngữ được thừa nhận bởi một ô tô mát hữu hạn thì nó cũng sẽ được thừa nhận bởi một ô tô mát hữu hạn không có dịch chuyển ε (CM:Lý thuyết ngôn ngữ và tính toán – Nguyễn Văn Ba)
Loại bỏ dịch chuyển Cho OHK M= (, Q, , q0, F), dựng OH M’=(’, Q’, ’, q0’, F’) không còn dc- E(s)={qQ|s=>*q nhờ toàn dc - } (sQ, sE(s)) ’= ; Q’=Q; q0’= q0 ’: p’(q,a)rE(q) sao cho p(r,a) F’=F{s Q|E(s)F}
Loại bỏ dịch chuyển Ví dụ: cho OHK có sơ đồ dịch chuyển sau: Tìm OH tương đương với OHK đã cho
Ví dụ Loại bỏ dịch chuyển-ε: OHK đã cho: M=(,Q,,p,F) ={0,1,2} Q={p,q,r} p- trạng thái đầu F={r} Ta cần tìm M’ =(,Q,’,p,F’) không còn dịch chuyển - ε
Ví dụ Tính E(s) cho mọi trạng thái s: Tính F’: Hàm ’: 1 2 p {p} {q} E(p)={p,q,r}; E(q)={q,r}; E(r)={r} Tính F’: F’={r} {sQ|rE(s)}={r} {p,q,r}={p,q,r} Hàm ’: 1 2 p {p} {q} {r} q r
Ví dụ Ô tô mát hữu hạn không còn dịch chuyển tương đương:
Sự tương đương giữa OHT và OHK Loại bỏ tính không tiền định: Định lý II.2: Nếu một ngôn ngữ được thừa nhận bởi một ô tô mát hữu hạn không có dịch chuyển ε thì nó cũng được thừa nhận bởi một ô tô mát hữu hạn tiền định. (CM:Lý thuyết ngôn ngữ và tính toán – Nguyễn Văn Ba) Bài tập: Cho OHK tìm OH không còn dc-e Cho OHK k có dc-e tìm OHT
Loại bỏ tính không tiền định Cho OHK M= (, Q, , q0, F) không còn dc- , dựng OHT M’=(’, Q’, ’, q0’, F’) ’= ; q0’= q0 Q’=(Q) ( tập các tập con của Q) ’: ’(S,a)=U (s, a) với mọi SQ’, sS, a F’= {S Q’|SF}
Sự tương đương giữa OHT và OHK Ví dụ: Cho ôtômat hữu hạn M={,Q,,q0,F} như sau: Tìm Otomat hữu hạn tiền định tương đương
Sự tương đương giữa OHT và OHK Loại bỏ tính không tiền định OHK đã cho: M=(,Q,,p,F) ={0,1} Q={p,q,r} p- trạng thái đầu F={r}
Sự tương đương giữa OHT và OHK Ta cần tìm M’ =(,(Q),’,{p},F’) trong đó: (S,a)=U(s,a) với S(Q), a F’={S (Q)|SF}
Sự tương đương giữa OHT và OHK Hàm dịch chuyển ’ được biểu diễn như sau: (Q) 1 Đầu {p} {p,q} {q} {r} Cuối {p,q,r} {p,r} {q,r}
Sự tương đương giữa OHT và OHK Ôtômat tiền định tương đương:
Sự tương đương giữa OHT và OHK Định lý II.3: Một ngôn ngữ được thừa nhận bởi một ô tô mát hữu hạn khi và chỉ khi nó được thừa nhận bởi một ô tô mát tiền định (CM:Lý thuyết ngôn ngữ và tính toán – Nguyễn Văn Ba)
III. Sự tương đương giữa ô tô mát hữu hạn và BTCQ Từ biểu thức chính quy đến Ô tô mat hữu hạn Từ ô tô mát hữu hạn tới ngôn ngữ chính quy
Từ biểu thức chính quy đến Ô tô mat hữu hạn Định lý II.4 Mọi ngôn ngữ chính quy trên đều là ngôn ngữ trạng thái hữu hạn trên (ngôn ngữ được đoán nhận bởi OH) Chứng minh: Giả sử có một ngôn ngữ được chỉ định bởi một biểu thức chính quy Ta đi xây dựng một ô tô mát hữu hạn không tiền định thừa nhận ngôn ngữ đó.
Từ biểu thức chính quy đến Ô tô mat hữu hạn Thiết lập các ô tô mát tương ứng với các biểu thức chính quy: được đoán nhận bởi: ( trạng thái đầu) ε được đoán nhận bởi: ( trạng thái cuối) a được đoán nhận bởi:
Từ biểu thức chính quy đến Ô tô mat hữu hạn 1, 2 lần lượt được đoán nhận bởi hai ô tô mát hữu hạn M1 và M2: Thì 1.2 được đoán nhận bởi:
Từ biểu thức chính quy đến Ô tô mat hữu hạn 1* được đoán nhận bởi ô tô mát: Bài tập Cho biểu thức chính quy tìm OH Cho OH tìm biểu thức chính quy
Từ biểu thức chính quy đến Ô tô mat hữu hạn 1 +2
Từ ô tô mát hữu hạn tới ngôn ngữ chính quy Định lý II.5(Kleene) Mọi ngôn ngữ trạng thái hữu hạn đều có thể phân tích được thành các ngôn ngữ thành phần sao cho khi kết hợp các ngôn ngữ thành phần đó lại bằng các phép toán: hợp, ghép tiếp, ghép lặp(*). (CM:Lý thuyết ngôn ngữ và tính toán – Nguyễn Văn Ba)
Từ ô tô mát hữu hạn tới ngôn ngữ chính quy Cho Ô tô mát hữu hạn M=(, {q1, q2, …, qn},, q1, F). Gọi L(M) là ngôn ngữ được đoán nhận bởi M: Đặt Rijk là tập các xâu trên cho phép M dịch chuyển từ trạng thái qi đến qj mà chỉ đi qua các trạng thái ql (l≤k, i,j có thể >k) (qix=>*qj): Hoặc là M không đi qua qk=> xRk-1ij Hoặc là M đi qua qk(một số lần) Như vậy Rn1j chính là ngôn ngữ L (qj F)
Từ ô tô mát hữu hạn tới ngôn ngữ chính quy Nếu M đi qua trạng thái qk, x có thể cắt thành các xâu con: Một xâu dẫn M từ qi đến qk đầu tiên (Rk-1ik) Một xâu dẫn M từ qk đến qk tiếp theo (Rk-1kk) (có thể không có hoặc có nhiều xâu này) Một xâu dẫn M từ qk cuối đến qj (Rk-1kj) Như vậy: Rkij=Rk-1ijRk-1ik(Rk-1kk)*Rk-1kj
Sự tương đương giữa ô tô mát hữu hạn và BTCQ Định lý II.6: Mọi ngôn ngữ trạng thái hữu hạn trên bộ chữ đều là ngôn ngữ chính quy trên Từ định lý II.4 và II.6 ta có Định lý II.7: Một ngôn ngữ trên bộ chữ là một ngôn ngữ trạng thái hữu hạn khi và chỉ khi nó là một ngôn ngữ chính quy
Văn phạm chính quy Văn phạm chính quy là văn phạm tuyến tính (trái hoặc phải) Văn phạm chính quy sinh ra ngôn ngữ chính quy Ngôn ngữ chính quy có thể được ký hiệu đơn giản bằng một biểu thức chính quy Tập hợp các chuỗi được ký hiệu bởi một biểu thức chính quy được gọi là tập hợp chính quy
Sự tương đương giữa VPTT và OH Định lý II.8 Cho văn phạm tuyến tính phải G. Tồn tại một văn phạm tuyến tính phải đơn G’ tương đương với G. Định lý II.9 Mọi ngôn ngữ chính quy đều có thể được sản sinh bởi một văn phạm tuyến tính phải Định lý II.10 Mọi ngôn ngữ sản sinh từ văn phạm tuyến tính phải là ngôn ngữ chính quy Định lý II.11 Mọi ngôn ngữ được sản sinh bởi một văn phạm tuyến tính phải khi và chỉ khi nó là chính quy
Sự tương đương giữa VPTT phải đơn và FA Định lý II.9: Mọi ngôn ngữ chính quy đều có thể được sản sinh bởi một văn phạm tuyến tính phải. Chứng minh: Cho một ngôn ngữ chính quy L được thừa nhận bởi một Ô tô mát hữu hạn tiền định M=(,Q,,q0,F). Ta xây dựng văn phạm G=(,,S,P).
Sự tương đương giữa VPTT phải đơn và FA Xây dựng văn phạm G=(,,S,P) trong đó: =Q; q0 là kí hiệu đầu (tiên đề); P gồm: qap nếu (q,a)=p; q nếu qF.
Sự tương đương giữa VPTT phải đơn và FA Ví dụ 2: Cho DFA như sau: Y/c: Tìm văn pham tuyến tính phải tương đương với DFA đã cho.
Sự tương đương giữa VPTT phải đơn và FA DFA đã cho: M=({0,1},{p, r},,p, {r}) trong đó gồm: (p,1)=p; (p,0)=r; (r,0)=r. Văn phạm tương đương với DFA: G=({0, 1}, {p, r}, p, P) trong đó P gồm: p1p; p0r ; r0r; r.
Sự tương đương giữa VPTT phải đơn và FA Định lý II.10: Mọi ngôn ngữ sinh từ văn phạm tuyến tính phải đều là ngôn ngữ chính quy: Chứng minh: Cho L là một ngôn ngữ sinh bởi một văn phạm tuyến tính phải (giả sử G đơn); Ta lập một ô tô mát không tiền định M tương đương với G thừa nhận L.
Sự tương đương giữa VPTT phải đơn và FA Xây dựng NFA: M=(, {f}, , S, {f}) Trong đó: f ; (A,a)={B|(B và AaBP) hay (B=f và AaP)} ( với mọi a{} và với mọi A)
Sự tương đương giữa VPTT phải đơn và FA Ví dụ 3: Cho Văn phạm: S|aS|bT|b TbT|b Y/c: Tìm Ô tô mát hữu hạn tương đương với văn phạm đã cho.
Sự tương đương giữa VPTT phải đơn và FA Ô tô mát hữu hạn tương đương: M=({a,b}, {S, T, f}, , S, {f}) trong đó gồm: (S,)=f (S,a)=S (S,b)=T (S,b)=f (T,b)=T (T,b)=f Sơ đồ dịch chuyển của Ô tô mát:
Sự tương đương giữa VPTT phải đơn và FA Định lý II.11: Một ngôn ngữ được sản sinh bởi một văn phạm tuyến tính phải khi và chỉ khi nó là chính quy. Chứng minh: Định lý là hệ quả trực tiếp từ các Định lý II.9 và II.10
V. Các ngôn ngữ chính quy Các phương tiện xác định ngôn ngữ chính quy: Biểu thức chính quy Các ô tô mát hữu hạn tiền định Các ô tôt mát hữu hạn không tiền định Các văn phạm tuyến tính phải
Các tính chất đóng của NNCQ L1, L2 là các ngôn ngữ chính quy thì: L1L2 là ngôn ngữ chính quy L1 L2 là ngôn ngữ chính quy L1 . L2 là ngôn ngữ chính quy L1* là ngôn ngữ chính quy L1 =*-L1 là ngôn ngữ chính quy
Các bài toán quyết định trên NNCQ Bài toán từ: Cho L là NNCQ và một từ x*. Phải chăng xL Bài toán ngôn ngữ rỗng: Cho L là NNCQ. Phải chăng L= Bài toán ngôn ngữ đầy: Cho L là NNCQ. Phải chăng L=* Bài toán bao hàm ngôn ngữ: L1 L2 là NNCQ. Phải chăng L1 L2 Bài toán ngôn ngữ bằng nhau: L1 L2 là NNCQ. Phải chăng L1 =L2
Định lý Đùn (Bổ đề Bơm) Cho L là ngôn ngữ chính quy vô hạn và một xâu wL sao cho w#Q (Q là tập các trạng thái của một ô tô mát hữu hạn tiền định thừa nhận L). Khi đó tồn tại x,u,y sao cho w=xuy (uε và |xu|#Q) và xuny L Định lý đùn là điều kiện cần đối với các ngôn ngữ chính quy, mọi ngôn ngữ không thỏa định lý đùn thì không thể là ngôn ngữ chính quy
Một số ví dụ L=an bn không là ngôn ngữ chính quy vì không thể tìm thấy xâu xuy sao cho xunyanbn L=an2 không là ngôn ngữ chính quy. - Bài tập: Chứng minh ngôn ngữ là không chính quy theo định lý đùn