Home
1-luan-an-thac-si
cong-nghe-thong-tin-thac-si
Khai phá dữ liệu trên cơ sở phương pháp Luật kết hợp và ứng dụng
Khai phá dữ liệu trên cơ sở phương pháp Luật kết hợp và ứng dụng
Khai phá dữ liệu trên cơ sở phương
pháp Luật kết hợp và ứng dụng
MỤC LỤC
MỞ ĐẦU
CHƯƠNG I: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU
1.1. Khai phá dữ liệu
1.1.1. Khái niệm về khám phá tri thức và
khai phá dữ liệu
1.1.2. Kiến trúc của một hệ thống khai
phá dữ liệu
1.1.3. Các loại dữ liệu được khai phá
1.1.4. Chức năng khai phá dữ liệu
1.2. Một số phương pháp khai phá dữ liệu
thông dụng
1.2.1. Phương pháp luật kết hợp
1.2.2. Phương pháp cây quyết định
1.2.3. Phương pháp k-Mean
1.3. Một số ứng dụng của khai phá dữ liệu
1.3.1. Phân tích dữ liệu gen và sinh học
y học
1.3.2. Phân tích dữ liệu tài chính
1.3.3. Dịch vụ bán lẻ
1.3.4. Công nghiệp viễn thông
1.4. Các khuynh hướng và thách thức
trong khai phá dữ liệu
CHƯƠNG 2: KHAI PHÁ LUẬT KẾT HỢP TRONG CƠ
SỞ DỮ LIỆU LỚN
2.1. Khai phá luật kết hợp
2.1.1. Một số khái niệm cơ bản
2.1.2. Cách khai phá luật kết hợp
2.1.3. Các tính chất của frequent
itemset
2.1.4. Các tiêu chuẩn để phân loại luật
kết hợp
2.1.4.1. Kiểu của giá trị được quản lý
trong luật
2.1.4.2. Chiều của dữ liệu được đề cập
trong luật
2.1.4.3. Mức trừu tượng được đề cập
trong luật
2.2. Khai phá luật kết hợp boolean một
chiều từ CSDL giao dịch
2.2.1. Thuật toán Apriori: Tìm các
frequent itemset sử dụng việc sinh ra các ứng viên
2.2.2. Sinh luật kết hợp từ các frequent
temset [5, 8, 15]
2.2.3. Cải tiến hiệu quả thuật toán
Apriori
2.2.3.1. Phương pháp dựa trên bảng băm
2.2.3.2. Giảm số giao dịch
2.2.3.3. Phân đoạn
2.2.3.4. Lấy mẫu
2.2.4. Khai phá các frequent itemset bằng
cách không sinh ứng cử viên
2.3. Khai phá luật kết hợp đa thức từ
CSDL giao dịch
2.3.1. Luật kết hợp đa thức
2.3.2. Các phương pháp khai phá luật kết
hợp đa mức
2.3.2.1. Đồng nhất độ hỗ trợ tối thiểu
cho tất cả các mức
2.3.2.2. Giảm dần độ hỗ trợ tối thiểu ở
mức thấp hơn
2.3.2.3. Độc lập theo từng mức
2.3.2.4. Lọc chéo mức bởi một itemset
2.4. Khai phá luật kết hợp đa chiều từ
CSDL quan hệ và kho dữ liệu
2.4.1. Luật kết hợp đa chiều
2.4.2. Khai phá luật kết hợp đa chiều sử
dụng việc rời rạc hoá tĩnh các thuộc tính số lượng
2.4.3. Khai phá luật kết hợp số lượng
2.4.4. Khai phá luật kết hợp dựa vào khoảng
cách
CHƯƠNG 3: MỘT SỐ THUẬT TOÁN KHAI PHÁ LUẬT
KẾT HỢP
3.1. Khám phá các frequent itemset
3.1.1. Thuật toán AIS
3.1.2. Thuật toán SETM
3.1.3. Thuật toán Apriori
3.1.3.1. Hàm Apriori_gen
3.1.3.2. Hàm subset
3.1.4. Thuật toán AprioriTID
3.1.5. Thuật toán AprioriHybrid
3.2. Khám phá luật kết hợp
3.2.1. Thuật toán sinh luật đơn giản
3.2.2. Thuật toán nhanh
3.3. Thuật toán DHP (Direct Hashing with
Efficent Pruning)
3.3.1 Thuật toán DHP
3.3.2. Giảm kích thước của cơ sở dữ liệu
giao dịch
3.3.3. Giảm số lần quét cơ sở dữ liệu
(Scan – Reduction method)
3.4. Thuật toán PHP (Perfect Hash and
Pruning)
3.5. So sánh các thuật toán khám phá các
frequent itemset
3.5.1. Sinh dữ liệu tổng hợp
3.5.2. So sánh các thuật toán AIS, SETM,
Apriori và AprioriTID
CHƯƠNG 4: CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM
“MÔ PHỎNG THUẬT TOÁN APRIORI”
4.1. Phát biểu bài toán
4.2. Phân tích bài toán
4.3. Xây dựng dữ liệu
4.4. Cài đặt chương trình thử nghiệm
4.5. Giao diện chính của chương trình
KẾT LUẬN VÀ ĐỀ NGHỊ
TÀI LIỆU THAM KHẢO
Bài viết liên quan
Giá Bán:0.000 VNĐ
Giá Bán:0.000 VNĐ
Giá Bán:0.000 VNĐ