Phân tích cú pháp tiếng việt sử dụng văn phạm phụ thuộc
Trang 1PHÂN TÍCH CÚ PHÁP
TIẾNG VIỆT SỬ DỤNG
VĂN PHẠM PHỤ THUỘC
Sinh viên thực hiện:
Giáo viên hướng dẫn: ThS Nguyễn Thị Thu Hương
Trang 2NỘI DUNG
1. Bài toán phân tích cú pháp
2. Văn phạm phụ thuộc
3. Xây dựng văn phạm phụ thuộc cho tiếng Việt
4. Thử nghiệm phân tích cú pháp bằng chương trình
phân tích
Trang 3BÀI TOÁN PHÂN TÍCH CÚ PHÁP
Quá trình phân tích một dãy các từ tố (các từ của câu) để xác định cấu trúc ngữ pháp của chúng
Giải thuật Earley
Trang 4 Phân tích ngôn ngữ có trật tự từ tự do hiệu quả
VĂN PHẠM PHỤ THUỘC
Trang 5KHÁI NIỆM VĂN PHẠM PHỤ THUỘC
Từ chính là head, từ phụ là dependent, từ không phụ thuộc vào
từ nào là root của câu
dependent cùng với nhãn của quan hệ
DT_TT
Trang 6TÍNH CHẤT VĂN PHẠM PHỤ THUỘC
Chỉ có một từ là root trong câu.
Các từ còn lại đều có head.
Tính đơn nhất: Mỗi từ chỉ có
1 head.
Tính xạ ảnh: Các cung không
được cắt nhau.
.
Câu đúng cú pháp nếu thỏa mãn tất cả các tính chất
Trang 7THUẬT TOÁN PHÂN TÍCH CÚ PHÁP
Đầu vào: Các từ đã được tách của câu (dãy các từ liên tiếp nhau)
Đầu ra: Quan hệ phụ thuộc giữa các từ
Phương pháp
Với mỗi từ W chỉ xét quan hệ phụ thuộc với các từ trước nó trong câu.
Tìm dependent D:
Nếu D là dependent của W liên kết W là head của D.
Không xét quan hệ phụ thuộc với từ đã có head.
D có head thì xét quan hệ phụ thuộc với head của D.
Tìm head H:
Nếu H là head của W liên kết H là head của W.
Nếu không thì xét quan hệ phụ thuộc với head của D.
Sau khi tìm được head thì dừng.
Trang 8MINH HỌA CHO THUẬT TOÁN
anh | Quân | đang | ngủ
Danh Danh Phụ Động
từ từ từ từ
Phân tích câu anh Quân đang ngủ
Luật:
Danh từ đứng trước Danh từ: Danh từ đứng trước là head (SDT1)
Phụ từ đứng trước Động từ: Động từ là head (TĐT3)
Danh từ đứng trước Động từ: Động từ là head (DT_ĐT)
SDT1 TĐT3
DT_ĐT
Trang 9XÂY DỰNG VĂN PHẠM PHỤ THUỘC
CHO TIẾNG VIỆT
ĐẶC ĐIỂM CỦA TIẾNG VIỆT
Không có sự biến đổi hình thái từ (giống cái, đực)
Có trật tự từ xác định (đa số có trật tự SVO)
Vị trí của head và dependent có thể dự đoán
Văn phạm phụ thuộc cho tiếng Việt có sự tương đồng với
văn phạm liên kết của Sleator.
Trang 10LUẬT CỦA VĂN PHẠM PHỤ THUỘC
Áo đẹp Áo đẹp
DT_TT DT_TT
Trang 11QUAN HỆ PHỤ THUỘC TRONG CỤM
DANH TỪ
Cụm danh từ = Phần phụ trước + Danh từ + Phần phụ sau
Danh từ: [TDT3_D<] & [TDT2_D< or ST_DT_D<] &
[TDT1_D<] & [SDT1_D>] & [SDT2_D] & [SDT3_D>] &
[SDT4_D>] & [SDT5_D>] & [SDT6_D>] & [GT_DT_H<]
Trang 12QUAN HỆ PHỤ THUỘC TRONG CỤM
ĐỘNG TỪ
Cụm động từ = Phần phụ trước + Động từ + Phần phụ sau
Động từ: (([TĐT1_D<] & [TĐT2_1_D< or TĐT2_2_D<] &
[TĐT3_D<] & [TĐT4_D<]) or [TĐT5_D<]) & [SĐT_D>]
Trang 13QUAN HỆ PHỤ THUỘC TRONG CỤM
TÍNH TỪ
Cụm tính từ = Phần phụ trước + Tính từ + Phần phụ sau
Phần phụ trước và phần phụ sau giống động từ
Tính từ: [TTT1_D<] & [TTT2_1_D< or TTT2_2_D<] &
[TTT3_D<] & [TTT4_D<] & [STT_D>]
Trang 14QUAN HỆ PHỤ THUỘC GIỮA CÁC TỪ
LOẠI
Danh từ: [DT_ĐT_H>] or [ĐT_DT_H<]
Động từ: [DT_ĐT_D<] & [ĐT_DT_D>]
Danh từ: DT_TT_D>
Tính từ: DT_TT_H<
Trang 15QUAN HỆ PHỤ THUỘC GIỮA CÁC TỪ
LOẠI
Động từ: [ĐT_TT_D>] or [TT_ĐT_D<]
Tính từ: [ĐT_TT_H<] or [TT_ĐT_H>]
Động từ không độc lập: ĐT_ĐT_D>
Động từ độc lập: ĐT_ĐT_H<
Trang 16CHƯƠNG TRÌNH PHÂN TÍCH
TIỀN XỬ LÝ
chính xác 94%)
VD: ([TDT3_D<] & [TDT2_D<] & [TDT1_D<] & [SDT1_D>]
& [SDT_D>])
[TDT3_D TDT2_D TDT1_D]: left
[SDT1_D SDT3_D] : right
Trang 17CHƯƠNG TRÌNH PHÂN TÍCH
KẾT QUẢ THU ĐƯỢC
(trời, 1, DT_ĐT), (mưa, -1, ), (rất, 3, TTT2_2), (to,1, ĐT_TT)
Trang 18THỬ NGHIỆM CHƯƠNG TRÌNH
Sai do câu dài, thiếu luật, nhiều luật chưa hợp lí
Trang 19HƯỚNG PHÁT TRIỂN
Cải tiến giải thuật phân tích phân tích những câu không
thỏa mãn tính xạ ảnh
Giải quyết từ “và”
Trang 20Em xin chân thành cảm ơn !