[giaban]0.000 VNĐ[/giaban]
[kythuat]
[/kythuat]
[tomtat]
[tomtat]
Xử
lý giá trị thiếu trong khai phá dữ liệu
MỤC
LỤC
DANH
SÁCH CÁC HÌNH VẼ
DANH
SÁCH CÁC BẢNG
MỞ
ĐẦU
CHƯƠNG
1: KHÁI QUÁT VỀ KHAI PHÁ DỮ LIỆU VÀ VẤN ĐỀ DỮ LIỆU THIẾU
1.1
Khai phá dữ liệu
1.2
Vấn đề dữ liệu thiếu trong cơ sở dữ liệu cần khai phá
1.3
Kết luận chương 1
CHƯƠNG
2: CÁC PHƯƠNG PHÁP CƠ BẢN XỬ LÝ GIÁ TRỊ THIẾU
2.1
Các phương pháp thống kê
2.1.1
Phương pháp Trung bình-Mốt (Mean-Mode - MM)
2.1.2
Phương pháp Trung bình-Mốt dựa vào cụm tự nhiên (Natural Cluster Based
Mean-Mode - NCBMM)
2.1.3
Thay giá trị thiếu bằng giá trị cho cùng độ lệch chuẩn (Replacement Under Same
Standard Deviation - RUSSD)
2.1.4
Hồi quy tuyến tính (Linear regression – LR)
2.2
Các phương pháp học máy
2.2.1
Phương pháp Trung bình-Mốt dựa vào cụm sinh bởi thuộc tính gần nhất (Attribute
Rank Cluster Based Mean-Mode algorithm - RCBMM)
2.2.2
Phương pháp Trung bình – Mốt dựa vào phân cụm k-Means (K-means clustering based
Mean - Mode - KMCMM)
2.3
Các phương pháp nhúng
2.3.1
Loại bỏ các bộ dữ liệu có chứa giá trị thiếu (discarding data tuples with
missing values)
2.3.2
Phương pháp C4.5
2.3.3
Phương pháp CART
2.4
Đánh giá
2.4.1
Đánh giá lý thuyết
2.4.2
Đánh giá thực nghiệm
2.5.
Kết luận chương 2
CHƯƠNG
3: PHƯƠNG PHÁP XỬ LÝ GIÁ TRỊ THIẾU PHỐI HỢP KHAI PHÁ LUẬT KẾT HỢP VỚI PHƯƠNG
PHÁP K-LÁNG GIỀNG GẦN NHẤT
3.1
Mở đầu
3.2
Khai phá luật kết hợp
3.3
Thuật toán RAR khai phá luật kết hợp trong cơ sở dữ liệu không đầy đủ
3.4
Phương pháp xử lý giá trị thiếu HMiT
3.5
Tính toán thực nghiệm
3.6
Kết luận chương 3
TÀI
LIỆU THAM KHẢO
Bài viết liên quan