Chương 3 Văn phạm phi ngữ cảnh

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
c¸c thÇy c« gi¸o vÒ dù héi gi¶ng côm
Advertisements

Kiểm thử và đảm bảo chất lượng phần mềm
GV: BÙI VĂN TUYẾN.
Cơ cấu thương mại hàng hóa việt nam – nhật bản giai đoạn
Học phần: LẬP TRÌNH CƠ BẢN
Chương 5. Hàng đợi (Queue) PGS. TS. Hà Quang Thụy.
Phần thứ hai Vai trò của các yếu tố nguồn lực trong tăng trưởng.
Nguyễn Văn Vũ An Bộ môn Tài chính – Ngân hàng (TVU)
ĐẠI SỐ BOOLEAN VÀ MẠCH LOGIC
LASER DIODE CẤU TRÚC CẢI TIẾN DỰA VÀO HỐC CỘNG HƯỞNG
1 BÁO CÁO THỰC TẬP CO-OP 3,4 PHÒNG TRỊ BỆNH TRÊN CHÓ MÈO Sinh viên: Nguyễn Quang Trực Lớp: DA15TYB.
Trường THPT Quang Trung
Trường Đại Học Điện Lực Khoa Đại Cương Hóa Đại Cương.
II Cường độ dòng điện trong chân không
BÀI TIỂU LUẬN KẾT THÚC MÔN LÍ LUẬN DẠY HỌC HIỆN ĐẠI
CHƯƠNG 2 HỒI QUY ĐƠN BIẾN.
Sự nóng lên và lạnh đi của không khí Biến thiên nhiệt độ không khí
TIÊT 3 BÀI 4 CÔNG NGHỆ 9 THỰC HÀNH SỬ DỤNG ĐỒNG HỒ VẠN NĂNG.
Bài giảng tin ứng dụng Gv: Trần Trung Hiếu
ĐỘ PHẨM CHẤT BUỒNG CỘNG HƯỞNG
MA TRẬN VÀ HỆ PHƯƠNG TRÌNH ĐẠI SỐ TUYẾN TÍNH
ĐỒ ÁN: TUABIN HƠI GVHD : LÊ MINH NHỰT NHÓM : 5
BÀI 5: PHÂN TÍCH PHƯƠNG SAI (ANOVA)
NGHIÊN CỨU HÌNH THÁI , CẤU TRÚC GAN , ĐƯỜNG KÍNH VÀ PHỔ DOPPLER TĨNH MẠCH CỬA QUA SIÊU ÂM Ở BỆNH NHÂN XƠ GAN (ĐỀ CƯƠNG CKII NỘI TIÊU HÓA)
Chương 6 TỰ TƯƠNG QUAN.
Chương 2 HỒI QUY 2 BIẾN.
Tối tiểu hoá hàm bool.
CHƯƠNG 7 Thiết kế các bộ lọc số
Máy lái GYLOT 107 Nhóm 6.
TRƯỜNG ĐẠI HỌC TÂY NGUYÊN KHOA: KHTN&CN BỘ MÔN: CÔNG NGHỆ MÔI TRƯỜNG
Bài tập Xử lý số liệu.
HIỆN TƯỢNG TỰ TƯƠNG QUAN (Autocorrelation)
CHƯƠNG 2 DỰ BÁO NHU CẦU SẢN PHẨM
ĐẠI HỌC HÀNG HẢI VIỆT NAM
Chương 2: ÔTÔMÁT HỮU HẠN VÀ BIỂU THỨC CHÍNH QUY
CHƯƠNG 1: KHÁI QUÁT VỀ HỆ THỐNG VIỄN THÔNG
GV giảng dạy: Huỳnh Thái Hoàng Nhóm 4: Bùi Trung Hiếu
(Cải tiến tính chất nhiệt điện bằng cách thêm Sb vào ZnO)
LỌC NHIỄU TÍN HIỆU ĐIỆN TIM THỜI GIAN THỰC BẰNG VI ĐiỀU KHIỂN dsPIC
ĐỊA CHẤT CẤU TẠO VÀ ĐO VẼ BẢN ĐỒ ĐỊA CHẤT
cho Ngân hàng Nhà nước Việt Nam
PHÁT XẠ NHIỆT ĐIỆN TỬ PHẠM THANH TÂM.
ĐỊNH GIÁ CỔ PHẦN.
CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN
Bộ khuyếch đại Raman.
SỰ PHÁT TẦN SỐ HIỆU HIỆU SUẤT CAO TRONG TINH THỂ BBO
Kinh tế vĩ mô của nền kinh tế mở: Những khái niệm cơ bản
BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY
Võ Ngọc Điều Đại học Bách Khoa TP Hồ Chí Minh Lê Đức Thiện Vương
Corynebacterium diphtheriae
CHUYÊN ĐỀ 5: KỸ THUẬT TỔ CHỨC HOẠT ĐỘNG HỌC CỦA HỌC SINH
QUẢN TRỊ HÀNG TỒN KHO VÀ TIỀN MẶT
PHAY MẶT PHẲNG SONG SONG VÀ VUÔNG GÓC
GV: ThS. TRƯƠNG QUANG TRƯỜNG TRƯỜNG ĐẠI HỌC NÔNG LÂM TP.HCM
CHƯƠNG II: LÝ THUYẾT HIỆN ĐẠI VỀ THƯƠNG MẠI QUỐC TẾ.
KIỂM TRA BÀI CŨ CÂU 1: * Nêu định nghĩa đường thẳng vuông góc với mặt phẳng? * Nêu cách chứng minh đường thẳng d vuông góc với mp(α)? d  CÂU 2: * Định.
NHIỆT LIỆT CHÀO MỪNG QUÝ THẦY CÔ VỀ DỰ GIỜ LỚP 7A Tiết 21 - HÌNH HỌC
Tiết 20: §1.SỰ XÁC ĐỊNH ĐƯỜNG TRÒN. TÍNH CHẤT ĐỐI XỨNG CỦA ĐƯỜNG TRÒN
Chương I: BÀI TOÁN QHTT Bài 5. Phương pháp đơn hình cho bài toán QHTT chính tắc có sẵn ma trận đơn vị xét bt: Với I nằm trong A, b không âm.
XLSL VÀ QHTN TRONG HÓA (30)
Líp 10 a2 m«n to¸n.
HÓA HỌC ĐẠI CƯƠNG (30 tiết)
ĐÀI TIẾNG NÓI VIỆT NAM TRƯỜNG CAO ĐẲNG PTTH 1.
PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU MARKETING
Chuyển hóa Hemoglobin BS. Chi Mai.
CƠ HỌC LÝ THUYẾT 1 TRƯỜNG ĐẠI HỌC KĨ THUẬT CÔNG NGHIỆP THÁI NGUYÊN
KHUẾCH ĐẠI VÀ DAO ĐỘNG THÔNG SỐ QUANG HỌC
LỢI NHUẬN VÀ RỦI RO.
CƠ CHẾ PHẢN ỨNG 1. Gốc tự do, carbocation, carbanion, carben, arin
HIDROCARBON 4 TIẾT (3).
Μεταγράφημα παρουσίασης:

Chương 3 Văn phạm phi ngữ cảnh

Nội dung Suy dẫn phi ngữ cảnh Cây suy dẫn và sự nhập nhằng Giản lược văn phạm phi ngữ cảnh Dạng chuẩn Chomsky

Suy dẫn phi ngữ cảnh Văn phạm phi ngữ cảnh: là văn phạm trong đó các sản xuất có dạng: A với A;  ()* Suy dẫn phi ngữ cảnh: tại mỗi bước chỉ áp dụng sản xuất phi ngữ cảnh

Một số ví dụ về suy dẫn phi ngữ cảnh Ví dụ 1: Trong ngôn ngữ lập trình <định danh><chữ cái>|<định danh><chữ cái>|<định danh><chữ số> <chữ cái> A|B|C|…|Z <chữ số>0|1|2|3|4|5|6|7|8|9 Kí hiệu không kết thúc: <định danh>, <chữ cái>, <chữ số> Kí hiệu kết thúc: A, B, C, …, Z, 0, 1, 2, …, 9

Một số ví dụ về suy dẫn phi ngữ cảnh Ví dụ 2: Trong văn phạm tiếng Việt có các quy tắc: <câu><chủ ngữ><vị ngữ> <chủ ngữ><danh từ>|<đại từ> <vị ngữ><động từ> <danh từ>bò|mèo|… <đại từ>tôi|nó|… <động từ>ăn|nằm|… Kí hiệu không kết thúc: <câu>, <chủ ngữ>, <vị ngữ>, <danh từ>, <đại từ>, <động từ> Kí hiệu kết thúc: “bò”, “mèo”, “tôi”, “nó”, “ăn”, “nằm”… là các từ tiếng Việt

(Chứng minh: lý thuyết ngôn ngữ và tính toán – Nguyễn Văn Ba) Suy dẫn phi ngữ cảnh Định lý III.1 (định lý phân dã suy dẫn) Cho G=(, , P, S) là văn phạm phi ngữ cảnh, đặt V= . Nếu trong G có suy dẫn u1u2…un=>kG v trong đó ui, vV* thì tồn tại viV*và kiN (i=1, 2,…, n) sao cho: ui=>ki vi Với mọi i=1, 2, …, n v=v1v2 …vn k1+k2+…+kn=k (Chứng minh: lý thuyết ngôn ngữ và tính toán – Nguyễn Văn Ba)

Cây suy dẫn và sự nhập nhằng Định nghĩa cây suy dẫn: Trong văn phạm phi ngữ cảnh G=(,,P,S), Cây suy dẫn là cây mà mỗi đỉnh được gắn một nhãn là một phần tử thuộc tập {} và thỏa các điều kiện: i. Nhãn của gốc là kí hiệu đầu S. ii. Nhãn của mỗi đỉnh trong là kí hiệu không kết thúc. Nhãn của mỗi lá là kí hiệu kết thúc hoặc . iii. Với mỗi đỉnh trong có nhãn A và các con có nhãn là X1, X2 …Xk thì A X1X2Xk là một sản xuất trong G. iv. Nếu một lá có nhãn là  thì lá đó là con duy nhất của cha nó

Cây suy dẫn (tiếp) Cây con là một cây tạo thành bởi một đỉnh và mọi hậu duệ của nó cùng với các nhãn và cung liên kết chúng. Gốc cây con có nhãn là A ta gọi cây con đó là A-cây Biên (kết quả) của một cây suy dẫn hay của một A-cây là xâu tạo thành bằng cách ghép tiếp các lá của cây theo trật tự từ trái qua phải ta được một câu gọi là kết quả.

Ví dụ về cây suy dẫn Ví dụ: xét văn phạm G({S, A}, {a, b}, P, S}, với P gồm: S  aAS | a A  SbA | SS | ba Một dẫn xuất của G: S => aAS => aSbAS => aabAS => aabbaS => aabbaa 1 3 6 10 2 5 9 4 7 8 11 S A b a

Cây suy dẫn (tiếp) Định lý III.2: Cho G là văn phạm phi ngữ cảnh có một xâu w được sản sinh bởi G (S=>*Gw ) khi và chỉ khi có một cây suy dẫn của văn phạm đó mà biên của nó là w. Chứng minh: Giả sử có cây suy dẫn biên là w thì có suy dẫn S=>*w. Giả sử có suy dẫn S=>*w thì có cây suy dẫn biên là w.

Suy dẫn trái và suy dẫn phải Suy dẫn trái: là suy dẫn mà trong đó, ở mỗi bước, kí hiệu được thay thế luôn luôn là kí hiệu không kết thúc nằm bên trái nhất trong dạng câu. Suy dẫn phải:là suy dẫn mà trong đó, ở mỗi bước, kí hiệu được thay thế luôn luôn là kí hiệu không kết thúc nằm bên phải nhất trong dạng câu.

Suy dẫn trái và suy dẫn phải (tiếp) Ví dụ: Cho văn phạm G với các sản xuất: S AB A  aA|a B  bB|b Các dẫn xuất khác nhau cho từ aaabb: 1. S =>AB => aAB => aaAB => aaaB => aaabB => aaabb 2. S => AB => AbB => Abb => aAbb => aaAbb => aaabb 3. S => AB => aAB => aAbB => aAbb => aaAbb => aaabb 4. S => AB => aAB => aaAB => aaAbB => aaabB => aaabb Dẫn xuất (1) là dẫn xuất trái nhất, (2) là dẫn xuất phải nhất Các dẫn xuất tuy khác nhau, nhưng có cùng một cây dẫn xuất

Văn phạm nhập nhằng Khái niệm: một văn phạm phi ngữ cảnh G được gọi là văn phạm nhập nhằng (ambiguity) nếu nó có nhiều hơn một cây dẫn xuất cho cùng một chuỗi w.

Văn phạm nhập nhằng (tiếp) Một ngôn ngữ có thể được sinh ra từ văn phạm nhập nhằng hoặc văn phạm không nhập nhằng Ngôn ngữ được gọi là nhập nhằng (nhập nhằng cố hữu – không nghiên cứu) nếu mọi văn phạm sinh ra nó đều nhập nhằng

Văn phạm nhập nhằng (tiếp) Để giản trừ nhập nhằng: ta đưa vào một số kí hiệu kết thúc phụ và một vài sản xuất trung gian: Quy định rằng các phép cộng và nhân luôn được thực hiện theo thứ tự từ trái sang phải (trừ khi gặp ngoặc đơn) E  E + T | E * T | T T  (E) | a Quy định rằng khi không có dấu ngoặc đơn ngăn cách thì phép nhân luôn được thực hiện ưu tiên hơn phép cộng E  E + T | T T  T * F | F F  (E) | a

Biến đổi văn phạm phi ngữ cảnh Loại bỏ các kí hiệu vô ích Loại bỏ các sản xuất  Loại bỏ các sản xuất đơn

Loại bỏ kí hiệu vô ích Định nghĩa: Cho văn phạm G=(,,P,S), đặt V=. XV là có ích nếu tồn tại suy dẫn: S=>*Xβ=>*w (, βV*; w* ). Nếu không thì nó là kí hiệu vô ích Vậy kí hiệu có ích X là: Kí hiệu hữu sinh, nghĩa là tồn tại một xâu x* mà X=>*x Kí hiệu đến được, nghĩa là tồn tại hai xâu , β V* sao cho S=>* Xβ

Loại bỏ kí hiệu vô sinh Bổ đề III.1 (Loại bỏ các kí hiệu vô sinh) Tồn tại một thuật toán cho phép, với mọi văn phạm phi ngữ cảnh G mà L(G)≠, thành lập một văn phạm phi ngữ cảnh tương đương G’ chỉ có các kí hiệu hữu sinh Thuật toán: Thành lập tập các kí hiệu hữu sinh W: W0=; Wi=Wi-1{A|ƎWi-1*: AP} (với i>0) W=  Wi (i≥0)  Quá trình bổ sung sẽ dừng vì tập W   Thành lập văn phạm G’=(, ’, P’,S): ’=W ; P’={AuP|A’, u( ’)*}

Loại bỏ kí hiệu vô sinh Ví dụ: Cho G=(, , P, S) trong đó: ={a, b}; ={S, A, B, C} P={SaA| bAB| abA AaB| bA| a BaB| bB CaA| bS| a } Tìm văn phạm G’ tương đương không còn kí hiệu vô sinh

Loại bỏ kí hiệu vô sinh Lời giải: W0={a, b} W1=W0{A, C} (vì có các sản xuất Aa, Ca) W2=W1{S} (vì có sản xuất SaA) W3=W2 W={a, b, A, C, S}; G’={, ’, P’, S} trong đó: ’={S, A, C} P’={SaA| abA, AbA| a, CaA| bS| a}

Loại bỏ các kí hiệu không đến được Bổ đề III.2 (Loại bỏ các kí hiệu không đến được) Tồn tại một thuật toán cho phép với mọi văn phạm phi ngữ cảnh G thành lập một văn phạm phi ngữ cảnh tương đương G’ chỉ có các kí hiệu đến được. Thuật toán: Thành lập tập hợp các kí hiệu đến được: W0={S}; U0= Wi=Wi-1{A| ƎBWi-1, Ǝu1, u2()*: Bu1Au2P} Ui=Ui-1 {a| ƎBWi-1, Ǝu1, u2()*: Bu1au2P} W=Wi; U= Ui (i≥0) Thành lập văn phạm G’=(U, W, P’, S) trong đó: P’={AuP|AW và u(U  W)*}

Loại bỏ các kí hiệu không đến được Ví dụ: Cho G’ ở ví dụ trên, tìm văn phạm G’’ chỉ gồm các kí hiệu đến được: W0={S}; U0= W1= W0{A}; U1=U0 {a, b} W2=W1; U2=U1 W={S, A}; U={a, b} Văn phạm G’’=({a, b}, {S, A}, P’’, S) trong đó: P’’={SaA| abA AbA|a}

Loại bỏ -sản xuất -sản xuất: Định lý III.4: -sản xuất là các sản xuất có dạng A Khi xâu  thuộc ngôn ngữ thì văn phạm phải chứa ít nhất một -sản xuất (thường là S ), ngoài ra các -sản xuất đều là thừa và có thể loại bỏ Định lý III.4: Cho văn phạm G=(, , P, S) là một văn phạm phi ngữ cảnh. Ta có thể thành lập một văn phạm phi ngữ cảnh G’=(, , P’, S) không có -sản xuất mà: L(G’)=L(G)-{}

Loại bỏ -sản xuất Thuật toán: Thành lập tập hợp các kí hiệu không kết thúc sinh ra xâu rỗng: Đặt E0={A|AP} Ei=Ei-1{A| ƎuEi-1*: AuP} (i>0) E= Ei (i≥0) Thành lập các sản xuất P’: Với mỗi sản xuất AX1X2…Xn P ta đưa vào P’ tất cả các sản xuất có dạng A12…n trong đó: (1) Nếu XiE thì i=Xi (2) Nếu XiE thì i=Xi hoặc i=  Loại bỏ tất cả các -sản xuất

Loại bỏ -sản xuất Ví dụ: Cho văn phạm: SABC, ABB|, BCC|a, CAA|b Loại bỏ các -sản xuất của văn phạm trên. Lời giải: E={A, C, B, S} Văn phạm G’ tương đương là: SABC| AB| BC| AC| A| B| C ABB| B B CC| C| a C AA| A| b

Loại bỏ các sản xuất đơn Sản xuất đơn: Sản xuất đơn là sản xuất có dạng AB (A, B) Sản xuất đơn thường làm kéo dài các suy dẫn nên ta cần loại bỏ

Loại bỏ các sản xuất đơn Định lý III.6 Cho một văn phạm phi ngữ cảnh G=(, , P, S). Ta có thể thành lập một văn phạm tương đương G’=(, , P’, S) không có các sản xuất đơn. Thuật toán: Thành lập G’ Cho R là quan hệ trên  được định nghĩa là: ARB khi và chỉ khi ABP Đặt: P’={A| ƎBP, với   và AR*B} (R* là bao đóng phản xạ, bắc cầu của R)

Loại bỏ các sản xuất đơn Ví dụ: Cho văn phạm G: EE+T| T TT*F| F F(E)| a Tìm văn phạm G’ không còn sản xuất đơn

Loại bỏ các sản xuất đơn Ta có: R={(E, T), (T, F)} R*={(E, E), (T, T), (F, F), (E, T), (T, F), (E, F)} Có EE+T mà E+T, có (E, E)R* suy ra có sản xuất: EE+T Có T T*F mà T*F, có (T,T), (E,T) R* suy ra có sản xuất: TT*F và ET*F Có F(E) mà (E), có (F, F), (T, F), (E, F)R* suy ra có sản xuất: F(E) và T(E) và E(E) Có Fa mà a, có (F,F), (T,F), (E,F) R* suy ra có sản xuất: Fa và Ta và Ea

Loại bỏ các sản xuất đơn Văn phạm tương đương không có sản xuất đơn: EE+T| T*F| (E)| a TT*F|(E)| a F(E)|a

Dạng chuẩn Chomsky Dạng chuẩn Chomsky: Văn phạm phi ngữ cảnh ở dạng chuẩn Chomsky là văn phạm mà các sản xuất của nó ở một trong hai dạng: ABC Aa Trong đó: A, B, C, a  Định lý III.9 Cho văn phạm phi ngữ cảnh G. Ta có thể thành lập một văn phạm G’ ở dạng chuẩn Chomsky sao cho L(G’)=L(G)

Đưa văn phạm về dạng chuẩn Chomsky Thuật toán: dựng G’=(, ’, P’, S) tương đương với G Nhặt các sản xuất trong P ở dạng chuẩn Chomsky đưa vào P’ Các sản xuất còn lại đưa về dạng chuẩn Chomsky: Nếu có sản xuất AY1Y2…Yk (k>2) thì thay sản xuất đó bằng hai sản xuất AY1A’ và A’Y2…Yk. Lặp lại cho tới khi độ dài vế phải các sản xuất không lớn hơn 2 Nếu có sản xuất mà vế phải độ dài có chứa kí hiệu kết thúc a, ta thêm một kí hiệu không kết thúc Ca, thay sự xuất hiện của a trong sản xuất bằng Ca và thêm sản xuất Caa

Đưa văn phạm về dạng chuẩn Chomsky Ví dụ: Đưa văn phạm trên về dạng chuẩn Chomsky SaAB| BBBA ABAB| a B AS| b Lời giải: B1: Các sản xuất đã ở dạng chuẩn Chomsky Aa BAS| b B2: Đưa các sản xuất còn lại về dạng chuẩn Chomsky SaAB được thay bằng SCAB và Ca SCAB được thay bằng SCD và DAB SBBBA được thay bằng SBE và EBBA EBBA được thay bằng EBF và FBA ABAB được thay bằng ABT và TAB

Đưa văn phạm về dạng chuẩn Chomsky Ta thu được văn phạm G’=(, ’, P’, S) trong đó: ’={S, A, B, C, D, E, F, T} P’={ SCD| BE Ca DAB EBE FBA ABT| a TAB BAS| b}