Danh mục tài liệu

Tóm tắt luận văn Thạc sĩ Kỹ thuật: Ứng dụng Random Forest để tư vấn chọn lộ trình học trong học chế tín chỉ

Số trang: 26      Loại file: pdf      Dung lượng: 1.78 MB      Lượt xem: 6      Lượt tải: 0    
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Đề tài nghiên cứu về khai phá dữ liệu, phân lớp dữ liệu và Random Forest; ứng dụng để khai phá dữ liệu sinh viên, qua đó tư vấn chọn lộ trình học trong học chế tín chỉ phù hợp cho sinh viên để đạt được kết quả tốt. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Ứng dụng Random Forest để tư vấn chọn lộ trình học trong học chế tín chỉBỘ GIÁO DỤC VÀ ĐÀO TẠOĐẠI HỌC ĐÀ NẴNGTRẦN HOÀNG BÌNHỨNG DỤNG RANDOM FORESTĐỂ TƯ VẤN CHỌN LỘ TRÌNH HỌCTRONG HỌC CHẾ TÍN CHỈChuyên ngành : Khoa học máy tínhMã số: 60.48.01.01TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬTĐà Nẵng - Năm 2015Chương trình được hoàn thành tạiĐẠI HỌC ĐÀ NẴNGNgười hướng dẫn khoa học: TS. NGUYỄN TRẦN QUỐC VINHPhản biện 1: TS. Phạm Minh TuấnPhản biện 2: GS. TS. Nguyễn Thanh ThủyLuận văn đã được bảo vệ trước Hội đồng chấm Luận văn tốtnghiệp Thạc sĩ Kỹ thuật chuyên ngành Khoa học máy tính họptại Đại học Đà Nẵng vào ngày 18 tháng7 năm 2015Có thể tìm hiểu luận văn tại:- Trung tâm Thông tin-Học liệu, Đại học Đà Nẵng- Trung tâm Học liệu, Đại học Đà Nẵng1MỞ ĐẦU1. Lý do chọn đề tàiTrong những năm gần đây, công nghệ thông tin phát triểnmạnh mẽ và việc ứng dụng cộng nghệ thông tin trong nhiều lĩnh vựcnhư đời sống, kinh tế xã hội đã làm lượng dữ liệu được thu thập vàlưu trữ ở các hệ thống thông tin tăng lên một cách nhanh chóng dẫntới sự bùng nổ thông tin. Lượng dữ liệu đó là một tài nguyên vô giánếu như chúng ta biết cách phát hiện và khai thác những thông tinhữu ích có trong đó. Các phương pháp khai thác dữ liệu truyền thốngngày càng không đáp ứng được như cầu thục tế.Với những lý do đó, để đáp ứng nhu cầu xử lý, phân tích,sử dụng thông tin hiệu quả hơn, đã làm phát triển kỹ thuật mới vàvới kỹ thuật này cho phép ta khai thác được tri thức hữu dụng từCSDL lớn được gọi là các kỹ thuật khai phá dữ liệu. Các kỹ thuậtkhai phá dữ liệu ra đời đã cho phép ta khai thác được những trithức hữu dụng bằng việc trích xuất những thông tin có mối quanhệ hoặc mối tương quan nhất định từ một kho dữ liệu lớn (cựclớn) mà bình thường không thể nhận diện được từ đó giải quyếtcác bài toán tìm kiếm, dự báo các xu thế, các hành vi trong tươnglai, và nhiều tính năng thông minh khác. Các kỹ thuật khai phá dữliệu đã được ứng dụng trong nhiều lĩnh vực như: kinh tế, tàichính, y tế, giáo dục.Trong việc ứng dụng khai phá dữ liệu vào nhiều lĩnh vựckhác nhau của đời sống, khai phá dữ liệu trong lĩnh vực giáo dụcđang dần có được sự quan tâm đúng mức. Giáo dục đào tạo có nhiệmvụ định hướng và hoạch định chính sách trong tương lai một cáchđúng đắn và kịp thời. Để những đối tượng chính của giáo dục là thế2hệ trẻ, là lực lượng kế thừa của việc xây dựng, bảo vệ và phát triểnđất nước có môi trường tốt phát huy khả năng của mình.Ngày nay, các trường đại học và cao đẳng đa số chuyển sangđào tạo theo học chế tín chỉ. Việc tư vấn học tập, liên quan đến lựachọn lộ trình học trong học chế tín chỉ phù hợp nhầm đạt được kếtquả học tập cao nhất cho mỗi sinh viên rất được quan tâm.Trước thực tế đó và được sự đồng ý của TS. Nguyễn TrầnQuốc Vinh, tôi chọn đề tài “Ứng dụng Random Forest để tư vấnchọn lộ trình học trong học chế tín chỉ”.2. Mục tiêu và nhiệm vụ- Nghiên cứu về khai phá dữ liệu, phân lớp dữ liệu vàRandom Forest.- Ứng dụng để khai phá dữ liệu sinh viên, qua đó tư vấn chọnlộ trình học trong học chế tín chỉ phù hợp cho sinh viên để đạt đượckết quả tốt.3. Đối tượng và phạm vi nghiên cứua. Đối tượng nghiên cứu- Các kỹ thuật khai phá dữ liệu;- Tổng quan về phân lớp dữ liệu;- Random Forest;b. Phạm vi nghiên cứu- Triển khai kỹ thuật khai phá dữ liệu sử dụng phân lớp dữliệu dựa trên cây quyết định và Random Forest.- Dữ liệu tại trường Cao Đẳng Kinh tế - Kỹ thuật QuảngNam gồm: kết quả học tập và thông tin các nhân của 2000 sinh viênvới cách ngành học như sau: Kế toán, Quản trị, Quản lý đất đai, Nuôitrồng thủy sản, Lâm nghiệp...34. Phương pháp nghiên cứua. Nghiên cứu lý thuyết- Tổng hợp và nghiên cứu các tài liệu liên quan lý thuyếtkhai phá dữ liệu, phân lớp dữ liệu, cây quyết định và Random Forest.- Phân tích và thiết kế mô hình phân lớp với Random Forest.b. Nghiên cứu thực nghiệm- Sử dụng mô hình Random Forest trên CSDL lý lịch, lộtrình học chế tín chỉ, kết quả học tập của sinh viên tại trường CaoĐẳng Kinh tế - Kỹ thuật Quảng Nam để tạo ra mô hình phân lớp đểdự đoán kết quả học tập.- Ứng dụng để tư vấn chọn lộ trình học cho sinh viên.5. Ý nghĩa khoa học và thực tiễn của đề tàia. Về mặt khoa học- Nghiên cứu về Khai phá dữ liệu: lý thuyết tổng quan, ýnghĩa, ứng dụng.- Nghiên cứu phân lớp trong khai phá dữ liệu.- Nghiên cứu về Random Forest trong việc dự đoán và phânloại thông tin.b. Về mặt thực tiễnỨng dụng việc dự khai phá dữ liệu học tập để tư vấn chọn lộtrình học trong học chế tín chỉ sẽ giúp sinh viên đạt kết quả tốt trongcác kỳ học kế tiếp.6. Bố cục của luận vănNội dụng chính của luận văn chia thành 3 chương:Chương 1: Nghiên cứu tổng quan, chương này giới thiệu tổngquan về khai phá dữ liệu, các kỹ thuật khai phá dữ liệu, mô hình tổngquan về khai phá dữ liệu. Giới thiệu về phân lớp dữ liệu và cây quyếtđịnh trong phân lớp dữ liệu, thuật toán xây dựng cây quyết định. ...

Tài liệu có liên quan: