ĐỀ CƯƠNG MÔN HỌC
KHAI PHÁ DỮ LIỆU
Data mining
1- Tên môn học: Khai phá dữ liệu
2- Bộ môn phụ trách môn học: Hệ thống thông tin
3- Mã số môn học: CSE404
4- Số tín chỉ: 3 tín chỉ (LT: 2; TH/BT/TL: 1)
5- Mô tả môn học:
Học phần trang bị cho sinh viên kiến thức tổng quan về khai phá dữ liệu, giới thiệu các phương pháp tiền xử lý dữ liệu cũng như các phương pháp thường dùng trong khai phá dữ liệu (hồi quy dữ liệu, phân lớp và dự đoán dữ liệu, gom cụm dữ liệu, luật kết hợp). Ngoài ra học phần cũng giới thiệu cho sinh viên về các ứng dụng và công cụ dùng khai phá dữ liệu.
6- Mục đích:
- Trang bị cho sinh viên các kiến thức cơ bản về khai phá dữ liệu nói chung, hiểu được các kỹ thuật khai phá dữ liệu hiện nay, hiểu biết và sử dụng các công cụ để khai phá dữ liệu trên các bài toán thực tế.
- Giúp người học có thể phát triển các ứng dụng nâng cao xung quanh các tác vụ khai phá dữ liệu.
7- Yêu cầu: Đối với sinh viên:
- Dự lớp đầy đủ, Nộp tiểu luận
- Tham gia thảo luận, Dự kiểm tra và thi
8- Phân bổ thời gian:
Tổng số: 45 tiết
- Lý thuyết: 30 tiết;
- Bài tập, thảo luận: 15 tiết.
9- Logic môn học:
- Môn học tiên quyết:
- Môn học trước: Cơ sở dữ liệu, hệ quản trị CSDL
10- Giảng viên tham gia: Các giảng viên thuộc Bộ môn Hệ thống thông tin
11- Định hướng bài tập:
- Bài tập nhỏ: theo các bài tập mẫu trong từng chương.
- Bài tập lớn
12- Tư vấn và hướng dẫn học viên:
- Hướng dẫn bài tập và thảo luận tại lớp
- Giới thiệu các tài liệu tham khảo trong và ngoài nước.
- Tư vấn các đề tài tốt nghiệp theo hướng của môn học
13- Tài liệu học tập:
A. Tài liệu học tập
Bài giảng của giảng viên
B. Tài liệu tham khảo
2. Tom M. Mitchell, "Machine learning", McGraw-Hill, 1997
3. Jiawei Han, “Data Mining: Concepts and Techniques”, MichelineKamber
4. Andrew Webb, “Statistical Pattern Recognition”, Wiley, 2002
5. David G. Stork, “Pattern Classification”, Wiley
6. David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data
Mining”, MIT Press, 2001.
7. David L. Olson, Dursun Delen, “Advanced Data Mining
Techniques”, Springer-Verlag, 2008
8. Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory,
Methodology, Techniques, and Applications”, Springer-Verlag, 2006.
9. Hillol Kargupta, Jiawei Han, Philip S. Yu, Rajeev Motwani, and Vipin
Kumar, “Next Generation of Data Mining”, Taylor & Francis Group, LLC,
2009.
10. Daniel T. Larose, “Data mining methods and models”, John Wiley &
Sons, Inc, 2006.
12. Ian H.Witten, Frank Eibe, Mark A. Hall, “Data mining: practical
machine learning tools and techniques”, Third Edition, Elsevier Inc,
2011.
14- Nội dung chi tiết môn học:
A- Nội dung tổng quát và phân bổ thời gian.
B- Nội dung chi tiết:
Chương 1 – Tổng quan về tiêng khai phá dữ liệu
1.1. Khái niệm
1.1. Quá trình khám phá tri thức
1.2. Các khái niệm
1.3. Ý nghĩa và vai trò của khai phá dữ liệu
1.4. Ứng dụng của khai phá dữ liệu
1.5. Những vấn đề chính trong khai phá dữ liệu
1.6. Tóm tắt
Chương 2 - Tiền xử lý dữ liệu
2.1. Tổng quan về giai đoạn tiền xử lý dữ liệu
2.2. Tóm tắt mô tả về dữ liệu
2.3. Làm sạch dữ liệu
2.4. Tích hợp dữ liệu
2.5. Biến đổi dữ liệu
2.6. Thu giảm dữ liệu
2.7. Rời rạc hóa dữ liệu
2.8. Tạo cây phân cấp ý niệm
2.9. Tóm tắt
Chương 3 – Hồi quy dữ liệu
3.1. Tổng quan về hồi qui
3.2. Hồi qui tuyến tính
3.3. Hồi qui phi tuyến
3.4. Ứng dụng
3.5. Các vấn đề với hồi qui
3.6. Tóm tắt
Chương 4 – Phân lớp dữ liệu
4.1. Tổng quan về phân lớp dữ liệu
4.2. Phân lớp dữ liệu với cây quyết định
4.3. Phân lớp dữ liệu với mạng Bayesian
4.4. Phân lớp dữ liệu với mạng Neural
4.5. Các phương pháp phân lớp dữ liệu khác
4.6. Tóm tắt
Chương 5 – Phân cụm dữ liệu
5.1. Tổng quan về phân cụm dữ liệu
5.2. Phân cụm dữ liệu bằng phân hoạch
5.3. Phân cụm dữ liệu bằng phân cấp
5.4. Phân cụm dữ liệu dựa trên mật độ
5.5. Phân cụm dữ liệu dựa trên mô hình
5.6. Các phương pháp phân cụm dữ liệu khác
5.7. Tóm tắt
Chương 6 – Luật kết hợp
6.1. Tổng quan về khai phá luật kết hợp
6.2. Biểu diễn luật kết hợp
6.3. Khám phá các mẫu thường xuyên
6.4. Khám phá các luật kết hợp từ các mẫu thường xuyên
6.5. Khám phá các luật kết hợp dựa trên ràng buộc
6.6. Phân tích tương quan
6.7. Tóm tắt
Chương 7 – Công nghệ khai phá dữ liệu
7.1. Tổng quan về công nghệ cơ sở dữ liệu
7.2. Khả năng hỗ trợ khai phá dữ liệu của công nghệ cơ sở dữ liệu.
7.3. Các ngôn ngữ truy vấn dành cho khai phá dữ liệu.
7.4. Hỗ trợ của các DBMS ngày nay dành cho khai phá dữ liệu.
7.5. Tóm tắt
Chương 8 - Ứng dụng của khai phá dữ liệu
8.1. Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệu
8.2. Qui trình phát triển ứng dụng khai phá dữ liệu
8.3. Các chuẩn dành cho khai phá dữ liệu
8.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu
8.5. Ứng dụng minh họa
8.6. Tóm tắt
15- Phương pháp giảng dạy và học tập:
- Thuyết trình, có minh họa.
- Nêu vấn đề, thảo luận tại lớp.
- Người học tự nghiên cứu, làm bài tập.
16- Tổ chức đánh giá môn học:
Visit ARC Templates now!