[giaban]0.000 VNĐ[/giaban] [kythuat]
Xây dựng hệ thống rút trích các nội dung chính của văn bản khoa học dựa trên cấu trúc

[/kythuat]
[tomtat]
Xây dựng hệ thống rút trích các nội dung chính của văn bản khoa học dựa trên cấu trúc
MỤC LỤC
MỞ ĐẦU
CHƯƠNG 1: TỔNG QUAN VỀ TÓM TẮT VĂN BẢN TỰ ĐỘNG
1.1. Giới thiệu
1.2. Mô hình tóm tắt văn bản
1.3. Phân loại bài toán tóm tắt văn bản
1.4. Các phương pháp tóm tắt văn bản
1.5. Tình hình nghiên cứu trong và ngoài nước
1.5.1. Ngoài nước
1.5.2. Trong nước
1.6. Một số hệ thống tóm tắt văn bản trên thế giới
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VỀ XỬ LÝ VÀ TÓM TẮT VĂN BẢN TIẾNG VIỆT
2.1. Một số đặc điểm của ngôn ngữ tiếng Việt
2.1.1. Văn bản, chủ đề văn bản và cấu trúc văn bản
2.1.2. Tiêu đề của văn bản
2.1.3. Đoạn văn
2.1.4. Câu và cấu trúc câu tiếng Việt
2.1.5. Từ
2.2. Bài toán tách câu
2.2.1. Giới thiệu bài toán
2.2.2. Dấu hiệu đặc trưng nhận dạng câu
2.3. Bài toán tách từ tiếng việt
2.3.1. Giới thiệu bài toán
2.3.2. Các phương pháp tách từ
2.3.2.1. Phương pháp dựa trên otomat
2.3.2.2. Dùng mô hình n-gram và phương pháp xác suất thống kê
2.3.2.3. Sử dụng giải thuật di truyền và thống kê trên Internet
2.4. Các thách thức của quá trình rút trích văn bản khoa học
2.4.1. Văn phong
2.4.2. Lỗi văn phạm
CHƯƠNG 3: PHƯƠNG PHÁP RÚT TRÍCH Ý CHÍNH TRONG VĂN BẢN TIẾNG VIỆT
3.1. Các phương pháp rút trích
3.1.1. Các phương pháp thống kê (Statistical Methods)
3.1.1.1. Phương pháp vị trí (Position-Based)
3.1.1.2. Phương pháp cụm từ gợi ý (Cue phrases-Based)
3.1.1.3. Phương pháp thống kê tần suất từ (Word frequency-Based)
3.1.2 . Phương pháp mạng ngữ nghĩa
3.1.2.1. Phương pháp quan hệ lẫn nhau
3.1.2.2. Phương pháp liên kết từ vựng (Lexical Chains)
3.1.2.3. Phương pháp Liên kết tham chiếu (Word Coreferences)
3.1.2.4. Phương pháp quan hệ câu (Discourse-Based)
3.1.3. Kết luận về các phương pháp trong giai đoạn phân tích
3.1.4. Hướng tiếp cận của đề tài
3.2. Mô hình rút trích ý chính của văn bản khoa học
3.2.1. Mô hình tổng quát
3.2.1.1. Giai đoạn tiền xử lý văn bản
3.2.1.2. Giai đoạn tách và lọc câu
3.2.1.3. Giai đoạn rút trích cơ sở
3.2.1.4. Giai đoạn phân lớp câu
3.2.1.5. Tính độ quan trọng của câu
3.2.2. Đánh giá kết quả tóm tắt, rút trích
3.2.2.1. Phương pháp thủ công
3.2.2.2. Các phương pháp đánh giá khác
CHƯƠNG 4: THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ
4.1. Kiến trúc và các chức năng chương trình
4.1.1. Tiền xử lý
4.1.2. Tách từ toàn văn bản
4.1.3. Tách câu
4.1.4. Lọc câu
4.1.5. Rút trích cơ sở
4.1.6. Phân lớp câu
4.1.7. Đánh giá câu
4.1.8. Hiển thị kết quả xử lý
4.2. Thực nghiệm chương trình
4.2.1. Giao diện tiền xử lý, tách từ và huấn luyện văn bản
4.2.2. Giao diện tách câu
4.2.3. Giao diện phân lớp câu
4.2.4. Giao diện hiển thị kết quả
4.2.5. Giao diện hiển thị thành phần quan trọng của bài báo khoa học
4.3. Đánh giá kết quả
4.3.1. Đánh giá kết quả xử lý tổng quát
4.3.2. Đánh giá kết quả thực nghiệm từ hai công thức sử dụng
4.3.3. Đánh giá từ phía người đọc
KẾT LUẬN

TÀI LIỆU THAM KHẢO
[/tomtat]

Bài viết liên quan