Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi
MỤC LỤC
MỞ ĐẦU
Chương 1: TỔNG QUAN VỀ TÁC TỬ VÀ ĐA TÁC TỬ
1.1. Tác tử.
1.2. Hệ đa tác tử.
1.3. Kết luận.
Chương 2: TƯƠNG TÁC VÀ PHỐI HỢP TRONG HỆ ĐA TÁC TỬ
2.1. Tương tác trong hệ đa tác tử.
2.2. Phối hợp trong hệ đa tác tử.
2.3. Kết luận.
Chương 3: PHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VỚI SỰ CÓ MẶT CỦA TÁC TỬ THEO DÕI
3.1. Quá trình định nghĩa Markov.
3.2. Thuật toán học tăng cường (Q-Learning).
3.3. Phương pháp huấn luyện cho hệ đa tác tử.
3.4. Chương trình demo.
3.5. Kết luận.
KẾT LUẬN
TÀI LIỆU THA KHẢO