1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phương pháp lọc thư rác tiếng việt dựa trên từ ghép và theo vết người sử dụng

11 296 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 11
Dung lượng 324,12 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

1. Giới thiệu Tách từ là vấn đề quan tâm nhất khi lọc thư rác tiếng Việt do tiếng Việt có các đặc trưng riêng mặc dù tiếng Việt cũng dùng ký tự latinh như tiếng Anh. Tiếng Việt có 2 thành phần cơ bản 1: tiếng và từ. Một số mối liên quan giữa từ và tiếng như sau. Về ngữ pháp, tiếng là đơn vị cấu tạo của từ. Từ là đơn vị nhỏ nhất để tạo câu, hình thức và ý nghĩa của từ độc lập với cú pháp. Có 2 loại từ phổ biến: từ một tiếng (từ đơn) và từ n tiếng trở lên (n

Ngày đăng: 19/12/2014, 09:44

HÌNH ẢNH LIÊN QUAN

Hình 1 –Mô hình tổng quát lọc thư spam tiếng Việt - Phương pháp lọc thư rác tiếng việt dựa trên từ ghép và theo vết người sử dụng
Hình 1 –Mô hình tổng quát lọc thư spam tiếng Việt (Trang 3)
Bảng  1  - Thống kê độ dài của từ trong từ điển (http://dict.vietfun.com) - Phương pháp lọc thư rác tiếng việt dựa trên từ ghép và theo vết người sử dụng
ng 1 - Thống kê độ dài của từ trong từ điển (http://dict.vietfun.com) (Trang 5)
Bảng  2  - Ví dụ minh họa phân tích từ đơn - Phương pháp lọc thư rác tiếng việt dựa trên từ ghép và theo vết người sử dụng
ng 2 - Ví dụ minh họa phân tích từ đơn (Trang 8)
Bảng  3 - Kết quả tách từ trên 800 dữ liệu mẫu - Phương pháp lọc thư rác tiếng việt dựa trên từ ghép và theo vết người sử dụng
ng 3 - Kết quả tách từ trên 800 dữ liệu mẫu (Trang 9)
Bảng  4 - Kết quả phân loại thư rác - Phương pháp lọc thư rác tiếng việt dựa trên từ ghép và theo vết người sử dụng
ng 4 - Kết quả phân loại thư rác (Trang 10)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w