[giaban]0.000 VNĐ[/giaban] [kythuat]
Khai phá dữ liệu văn bản bằng lý thuyết tập thô

[/kythuat]
[tomtat]
Khai phá dữ liệu văn bản bằng lý thuyết tập thô
MỤC LỤC
LỜI MỞ ĐẦU
CHƯƠNG 1. TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VĂN BẢN VÀ LÝ THUYẾT TẬP THÔ
1.1 Khai phá dữ liệu văn bản
1.1.1 Khai phá dữ liệu
1.1.1.1 Khái niệm
1.1.1.2 Lịch sử nghiên cứu
1.1.1.3 Các khía cạnh khai phá chủ yếu
1.1.1.4 Quy trình của DM
1.1.1.5 Các phương pháp của DM
1.1.2 Khai phá dữ liệu văn bản
1.1.2.1 Khái niệm
1.1.2.2 Các kỹ thuật khai phá văn bản
1.2 Khai phá tri thức ứng dụng lý thuyết tập thô
1.2.1 Khai phá tri thức theo cách tiếp cận tập thô
1.2.1.1 Một số khái niệm
1.2.1.1.1 Hệ thống thông tin
1.2.1.1.2 Khái niêm về bảng quyết định
1.2.1.1.3 Khái niệm quan hệ không phân biệt được trong hệ thông tin.
1.2.1.1.4 Khái niệm tập các nhát cắt, nhát cắt trong bảng quyết định
1.2.1.2 Tập thô trong không gian xấp xỉ
1.2.1.3 Khai phá tri thức theo cách tiếp cận tập thô
1.2.2 Sự rời rạc hoá dữ liệu theo cách tiếp cận tập thô
1.2.3 Lựa chọn thuộc tính dựa trên tập thô
1.2.4 Khám phá luật bới bảng phân bố tổng quát dựa trên tập thô
1.3 Kết luận chương 1
CHƯƠNG 2. MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU TRONG XỬ LÝ VĂN BẢN
2.1 Biểu diễn văn bản
2.1.1 Biểu diễn văn bản
2.1.2 Các phương pháp biểu diễn văn bản
2.1.2.1 Tiền xử lý văn bản
2.1.2.2 Mô hình Logic
2.1.2.3 Mô hình phân tích cú pháp
2.1.2.4 Mô hình không gian vector
2.1.2.5 Mô hình Boolean
2.1.2.6 Mô hình tần suất
2.1.2.7 Mô hình dựa trên tập mờ (Fuzzy Set)
2.1.2.8 Mô hình tập thô dung sai (Tolerance Rough Set Model-TRSM)
2.2 Các thuật toán lập nhóm văn bản
2.2.1 Thuật toán K – Means
2.2.2 Thuật toán lập nhóm theo cây phân cấp
2.2.2.1 Thuật toán theo cây phân cấp từ trên xuống ( Top Down Hierachical Clustering)
2.2.2.2 Thuật toán theo cây phân cấp từ dưới lên ( Bottom Up Hierachical Clustering)
2.2.2.3 Giải thuật lập nhóm Non Hierachical Clustering Overlap
2.2.2.4 Giải thuật lập nhóm Non Hierachical Clustering Non Overlap
2.2.3 Xác định các thuật đại diện cho nhóm
2.2.4 Độ tương tự giữa văn bản và nhóm văn bản
2.3 Bài toán phân lớp văn bản
2.3.1 Bài toán
2.3.2 Các nghiên cứu liên quan
2.4 Các phương pháp phân lớp
2.4.1 Phân lớp dựa trên thuật toán Naive Bayes
2.4.2 Phương pháp K – Nearest Neighbor ( K-NN)
2.4.3 Phân lớp sử dụng Support Vector Machines (SVM)
2.5 Kết luận chương 2
CHƯƠNG 3. PHÂN LOẠI VĂN BẢN TIẾNG VIỆT THEO CHỦ ĐỀ ÁP DỤNG LÝ THUYẾT TẬP THÔ
3.1 Kiến trúc hệ thống phân loại văn bản tiếng Việt tự động
3.2. Các chức năng của hệ thống
3.2.1 Xây dựng tập văn bản dùng cho huấn luyện
3.2.2 Xây dựng tập từ dừng, từ tầm thường
3.2.3 Xây dựng tập thuật ngữ
3.2.4 Tiền xử lý văn bản đầu vào
3.2.5 Huấn luyện
3.2.6 Phân lớp văn bản
3.3 Kết luận chương 3
CHƯƠNG 4. XÂY DỰNG HỆ THỐNG PHÂN LOẠI VĂN BẢN TIẾNG VIỆT THEO CHỦ ĐỀ
4.1 Môi trường và nền tảng ứng dụng
4.2 Giao diện hệ thống
4.3 Kết luận chương 4
KẾT LUẬN
TÀI LIỆU THAM KHẢO

PHỤ LỤC
[/tomtat]

Bài viết liên quan