[giaban]0.000 VNĐ[/giaban] [kythuat]
Nghiên cứu mô hình ngôn ngữ N-Gram và ứng dụng trong bài toán thêm dấu cho tiếng Việt không dấu

[/kythuat]
[tomtat]
Nghiên cứu mô hình ngôn ngữ N-Gram và ứng dụng trong bài toán thêm dấu cho tiếng Việt không dấu
MỤC LỤC
CHƯƠNG 1: GIỚI THIỆU CHUNG
1.1. Đặt vấn đề:
1.2. Mục tiêu:
1.3. Cấu trúc của luận văn:
CHƯƠNG 2: MÔ HÌNH NGÔN NGỮ N-GRAM
2.1. Giới thiệu chung
2.2. Công thức tính “xác suất thô”
2.3. Vần đề khó khăn khi xây dựng mô hình ngôn ngữ N-gram
2.4. Các phương pháp làm mịn
2.5. Kỹ thuật làm giảm kích thước dữ liệu
2.6. Độ đo
2.7. Tổng kết chương
CHƯƠNG 3: XÂY DỰNG N-GRAM CHO TIẾNG VIỆT
3.1. Giới thiệu
3.2. Công cụ tách từ cho tiếng Việt - vnTokenizer
3.3. Bộ công cụ SRILM
3.4. Bộ công cụ trợ giúp xây dựng tập văn bản huấn luyện
3.5. Phương pháp tách câu, tách từ, gán nhãn từ loại và phân tích cú pháp.
3.6. Dữ liệu huấn luyện
3.7. Kết quả xây dựng mô hình
3.8. Tần số của tần số
3.9. Cut-off (loại bỏ)
3.10. Các phương pháp làm mịn
3.11. Tổng kết chương
CHƯƠNG 4: ỨNG DỤNG N-GRAM TRONG BÀI TOÁN THÊM DẤU TIẾNG VIỆT
4.1. Bài toán thêm dấu tiếng Việt
4.2. Các phương pháp đánh giá kết quả thêm dấu:
4.3. Các hệ thống thêm dấu ứng dụng về N-gram đã có:
4.4. Đề xuất hệ thống:
4.5. Thử nghiệm hệ thống:
CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI
5.1. Các kết quả đạt được:
5.2. Hạn chế và hướng phát triển của đề tài:

TÀI LIỆU THAM KHẢO
[/tomtat]

Bài viết liên quan