Luận án Tiến sĩ Khoa học máy tính: Phương pháp lựa chọn thuộc tính và kỹ thuật gom cụm dữ liệu phân loại sử dụng tập thô
Số trang: 107
Loại file: pdf
Dung lượng: 1.65 MB
Lượt xem: 7
Lượt tải: 0
Xem trước 10 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu nghiên cứu của luận án "Phương pháp lựa chọn thuộc tính và kỹ thuật gom cụm dữ liệu phân loại sử dụng tập thô" tập trung vào hai vấn đề của đề tài: nghiên cứu phương pháp mới tìm tập rút gọn trong một bảng quyết định; kỹ thuật gom cụm dữ liệu phân loại sử dụng tập thô. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Khoa học máy tính: Phương pháp lựa chọn thuộc tính và kỹ thuật gom cụm dữ liệu phân loại sử dụng tập thô BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG ĐỖ SĨ TRƯỜNG PHƯƠNG PHÁP LỰA CHỌN THUỘC TÍNHVÀ KỸ THUẬT GOM CỤM DỮ LIỆU PHÂN LOẠI SỬ DỤNG TẬP THÔ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Đồng Nai – năm 2023 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG ĐỖ SĨ TRƯỜNG PHƯƠNG PHÁP LỰA CHỌN THUỘC TÍNH VÀ KỸ THUẬT GOM CỤM DỮ LIỆU PHÂN LOẠI SỬ DỤNG TẬP THÔ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNHChuyên ngành: Khoa học máy tínhMã số ngành: 9480101 NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS NGUYỄN THANH TÙNG Đồng Nai, năm 2023 LỜI CẢM ƠN Xin trân trọng cảm ơn PGS.TS. Nguyễn Thanh Tùng đã tận tình hướng dẫn nghiêncứu sinh hoàn thành luận án tiến sĩ. Xin trân trọng cảm ơn quý thầy/cô khoa sau đại học, trường đại học Lạc Hồng đã tạođiện kiện thuận lợi và hỗ trợ nghiên cứu sinh hoàn thành luận án. Xin trân trọng cảm ơn trường đại học Lạc Hồng đã tạo điều kiện thuận lợi trong côngtác và hỗ trợ nghiên cứu sinh tham gia học tập. Xin chân thành cám ơn quý bạn bè, đồng nghiệp đã tạo điều kiện mọi mặt giúp nghiêncứu sinh hoàn thành luận án. Đồng Nai, ngày tháng năm 2023 Nghiên cứu sinh Đỗ Sĩ Trường LỜI CAM ĐOAN Tôi xin cam đoan luận án này là công trình nghiên cứu của riêng tôi dưới sự hướngdẫn của PGS.TS. Nguyễn Thanh Tùng. Các số liệu và tài liệu trong nghiên cứu là trungthực và chưa được công bố trong bất kỳ công trình nghiên cứu nào. Tất cả các tham khảovà kế thừa đều được trích dẫn và tham chiếu đầy đủ. Đồng Nai, ngày tháng năm 2023 Nghiên cứu sinh Đỗ Sĩ Trường MỤC LỤCCHƯƠNG 1. MỞ ĐẦU ............................................................................................................ 1CHƯƠNG 2. KHÁI QUÁT VỀ LÝ THUYẾT TẬP THÔ VÀ ỨNG DỤNG TRONGKHAI PHÁ DỮ LIỆU ................................................................................................................... 92.1 Mở đầu .......................................................................................................................... 92.2 Các khái niệm cơ bản của lý thuyết tập thô .................................................................. 92.2.1 Hệ thông tin .................................................................................................................. 92.2.2 Quan hệ không phân biệt được và các xấp xỉ của một tập hợp .................................. 102.2.3 Bảng quyết định .......................................................................................................... 112.2.4 Các khái niệm lý thuyết thông tin liên quan ............................................................... 132.3 Một số thuật toán hiệu quả của lý thuyết tập thô ........................................................ 162.4 Ứng dụng của lý thuyết tập thô trong khám phá tri thức từ cơ sở dữ liệu .................. 192.5 Kết luận chương 2....................................................................................................... 21CHƯƠNG 3. LỰA CHỌN THUỘC TÍNH SỬ DỤNG LÝ THUYẾT TẬP THÔ ........... 233.1 Mở đầu ........................................................................................................................ 233.2 Khái quát về bài toán lựa chọn thuộc tính .................................................................. 243.3 Các phương pháp lựa chọn thuộc tính sử dụng lý thuyết tập thô ............................... 273.3.1 Phương pháp lựa chọn thuộc tính sử dụng ma trận phân biệt .................................... 283.3.2 Phương pháp rút gọn thuộc tính dựa vào độ phụ thuộc .............................................. 323.3.3 Phương pháp rút gọn thuộc tính sử dụng sử dụng độ phụ thuộc tương đối................ 343.3.4 Phương pháp rút gọn thuộc tính sử dụng Entropy thông tin ...................................... 373.3.5 Phương pháp lựa chọn thuộc tính dựa trên gom cụm ................................................. 393.4 Đề xuất thuật toán rút gọn thuộc tính dựa vào gom cụm ACBRC ............................. 423.4.1 Ý tưởng và những định nghĩa cơ bản ......................................................................... 423.4.2 Giới thiệu thuật toán k-medoids ................................................................................. 433.4.3 Thuật toán rút gọn thuộc tính dựa vào gom cụm ACBRC ......................................... 453.4.4 Kết quả thực nghiệm thuật toán ACBRC ................................................................... 483.5 Kết luận chương 3....................................................................................................... 52CHƯƠNG 4. GOM CỤM DỮ LIỆU SỬ DỤNG LÝ THUYẾT TẬP THÔ ..................... 544.1 Mở đầu ................................................................................................. ...
Nội dung trích xuất từ tài liệu:
Luận án Tiến sĩ Khoa học máy tính: Phương pháp lựa chọn thuộc tính và kỹ thuật gom cụm dữ liệu phân loại sử dụng tập thô BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG ĐỖ SĨ TRƯỜNG PHƯƠNG PHÁP LỰA CHỌN THUỘC TÍNHVÀ KỸ THUẬT GOM CỤM DỮ LIỆU PHÂN LOẠI SỬ DỤNG TẬP THÔ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Đồng Nai – năm 2023 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG ĐỖ SĨ TRƯỜNG PHƯƠNG PHÁP LỰA CHỌN THUỘC TÍNH VÀ KỸ THUẬT GOM CỤM DỮ LIỆU PHÂN LOẠI SỬ DỤNG TẬP THÔ LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNHChuyên ngành: Khoa học máy tínhMã số ngành: 9480101 NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS NGUYỄN THANH TÙNG Đồng Nai, năm 2023 LỜI CẢM ƠN Xin trân trọng cảm ơn PGS.TS. Nguyễn Thanh Tùng đã tận tình hướng dẫn nghiêncứu sinh hoàn thành luận án tiến sĩ. Xin trân trọng cảm ơn quý thầy/cô khoa sau đại học, trường đại học Lạc Hồng đã tạođiện kiện thuận lợi và hỗ trợ nghiên cứu sinh hoàn thành luận án. Xin trân trọng cảm ơn trường đại học Lạc Hồng đã tạo điều kiện thuận lợi trong côngtác và hỗ trợ nghiên cứu sinh tham gia học tập. Xin chân thành cám ơn quý bạn bè, đồng nghiệp đã tạo điều kiện mọi mặt giúp nghiêncứu sinh hoàn thành luận án. Đồng Nai, ngày tháng năm 2023 Nghiên cứu sinh Đỗ Sĩ Trường LỜI CAM ĐOAN Tôi xin cam đoan luận án này là công trình nghiên cứu của riêng tôi dưới sự hướngdẫn của PGS.TS. Nguyễn Thanh Tùng. Các số liệu và tài liệu trong nghiên cứu là trungthực và chưa được công bố trong bất kỳ công trình nghiên cứu nào. Tất cả các tham khảovà kế thừa đều được trích dẫn và tham chiếu đầy đủ. Đồng Nai, ngày tháng năm 2023 Nghiên cứu sinh Đỗ Sĩ Trường MỤC LỤCCHƯƠNG 1. MỞ ĐẦU ............................................................................................................ 1CHƯƠNG 2. KHÁI QUÁT VỀ LÝ THUYẾT TẬP THÔ VÀ ỨNG DỤNG TRONGKHAI PHÁ DỮ LIỆU ................................................................................................................... 92.1 Mở đầu .......................................................................................................................... 92.2 Các khái niệm cơ bản của lý thuyết tập thô .................................................................. 92.2.1 Hệ thông tin .................................................................................................................. 92.2.2 Quan hệ không phân biệt được và các xấp xỉ của một tập hợp .................................. 102.2.3 Bảng quyết định .......................................................................................................... 112.2.4 Các khái niệm lý thuyết thông tin liên quan ............................................................... 132.3 Một số thuật toán hiệu quả của lý thuyết tập thô ........................................................ 162.4 Ứng dụng của lý thuyết tập thô trong khám phá tri thức từ cơ sở dữ liệu .................. 192.5 Kết luận chương 2....................................................................................................... 21CHƯƠNG 3. LỰA CHỌN THUỘC TÍNH SỬ DỤNG LÝ THUYẾT TẬP THÔ ........... 233.1 Mở đầu ........................................................................................................................ 233.2 Khái quát về bài toán lựa chọn thuộc tính .................................................................. 243.3 Các phương pháp lựa chọn thuộc tính sử dụng lý thuyết tập thô ............................... 273.3.1 Phương pháp lựa chọn thuộc tính sử dụng ma trận phân biệt .................................... 283.3.2 Phương pháp rút gọn thuộc tính dựa vào độ phụ thuộc .............................................. 323.3.3 Phương pháp rút gọn thuộc tính sử dụng sử dụng độ phụ thuộc tương đối................ 343.3.4 Phương pháp rút gọn thuộc tính sử dụng Entropy thông tin ...................................... 373.3.5 Phương pháp lựa chọn thuộc tính dựa trên gom cụm ................................................. 393.4 Đề xuất thuật toán rút gọn thuộc tính dựa vào gom cụm ACBRC ............................. 423.4.1 Ý tưởng và những định nghĩa cơ bản ......................................................................... 423.4.2 Giới thiệu thuật toán k-medoids ................................................................................. 433.4.3 Thuật toán rút gọn thuộc tính dựa vào gom cụm ACBRC ......................................... 453.4.4 Kết quả thực nghiệm thuật toán ACBRC ................................................................... 483.5 Kết luận chương 3....................................................................................................... 52CHƯƠNG 4. GOM CỤM DỮ LIỆU SỬ DỤNG LÝ THUYẾT TẬP THÔ ..................... 544.1 Mở đầu ................................................................................................. ...
Tìm kiếm theo từ khóa liên quan:
Luận án Tiến sĩ Luận án Tiến sĩ Khoa học máy tính Khoa học máy tính Lý thuyết tập thô Khai phá dữ liệu Kỹ thuật gom cụm dữ liệu phân loạiTài liệu có liên quan:
-
Tóm tắt Đồ án tốt nghiệp Khoa học máy tính: Xây dựng ứng dụng quản lý quán cà phê
15 trang 509 1 0 -
205 trang 463 0 0
-
Luận án Tiến sĩ Tài chính - Ngân hàng: Phát triển tín dụng xanh tại ngân hàng thương mại Việt Nam
267 trang 417 1 0 -
Đề thi kết thúc học phần học kì 2 môn Cơ sở dữ liệu năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp
5 trang 388 6 0 -
174 trang 382 0 0
-
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 357 1 0 -
206 trang 310 2 0
-
228 trang 277 0 0
-
32 trang 258 0 0
-
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 248 0 0