[giaban]0.000 VNĐ[/giaban] [kythuat]
Xây dựng hệ thống phân loại tài liệu tiếng Việt

[/kythuat]
[tomtat]
Xây dựng hệ thống phân loại tài liệu tiếng Việt
MỤC LỤC
CHƯƠNG 1: TỔNG QUAN
1.1 Đặt vấn đề
1.2 Tổng quan tình hình nghiên cứu trong và ngoài nước
1.2.1 Tổng quan thế giới
1.2.2 Tổng quan trong nước
1.3 Mục tiêu của luận văn
1.4 Nội dung thực hiện
CHƯƠNG 2: CÁC PHƯƠNG PHÁP PHÂN LOẠI VĂN BẢN
2.1 Tổng quát về các phương pháp phân loại văn bản
2.2 Mô tả bài toán phân loại văn bản
2.3 Các phương pháp phân loại văn bản tiếng Anh
2.3.1 Support vector Machine (SVM)
2.3.2 Naïve Bayes (NB)
2.3.3 Biểu diễn văn bản
2.3.4 K–Nearest Neighbor (kNN)
2.3.5 Linear Least Square Fit (LLSF)
2.3.6 Neural Network (NNet)
2.3.7 Centroid- based vector
2.4 Kết luận chung về các phương pháp phân loại văn bản tiếng Anh
2.5 Tách từ trong bài toán phân loại văn bản
2.5.1 Khó khăn vướng mắc
2.5.2 Các phương pháp tách từ
CHƯƠNG 3: ỨNG DỤNG PHÂN LOẠI BÀI BÁO KHOA HỌC TRONG LĨNH VỰC CÔNG NGHỆ THÔNG TIN
3.1 Hiện trạng
3.2 Quy trình xử lý phân loại bài báo
3.2.1 Tách từ trong văn bản
3.2.2 Loại bỏ các từ tầm thường
3.3 Trích chọn đặc trưng văn bản
3.3.1 Các ý tưởng cơ bản
3.3.2 Phương pháp rút trích đặc trưng
3.3.3 Phương pháp đặc trưng đề nghị sử dụng
3.4 Sử dụng thuật toán Naïve Bayes để phân loại văn bản
3.4.1 Lý do chọn Naïve Bayes
3.4.2 Ý tưởng và công thức Naïve Bayes
3.4.3 Ước lượng P(X|Y)
3.4.4 Ước lượng P(Y)
3.4.5 Ước lượng P(Y|X)
3.5 Ứng dụng Naïve Bayes vào bài toán phân loại
3.5.1 Ý tưởng
3.5.1 Hướng dẫn cài đặt
CHƯƠNG 4: XÂY DỰNG CHƯƠNG TRÌNH
4.1 Xây dựng cơ sở dữ liệu
4.1.1 Từ điển tiếng việt
4.1.2 Mô tả thực thể
4.1 Xây dựng giao diện phân loại văn bản
4.1.1 Lưu đồ phân loại văn bản
4.1.2 Thiết kế giao diện
4.1.3 Xây dựng các chức năng
CHƯƠNG 5: THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ
5.1 Ví dụ về chương trình phân loại văn bản
5.2 Đánh giá kết quả
5.2.1 Dữ liệu đầu vào
5.2.2 Kết quả thực nghiệm
5.2.3 Đánh giá kết quả
KẾT LUẬN

TÀI LIỆU THAM KHẢO
[/tomtat]

Bài viết liên quan