Bài giảng Khai phá dữ liệu - Chương 3: Khai phá luật kết hợp
Số trang: 70
Loại file: pptx
Dung lượng: 2.75 MB
Lượt xem: 12
Lượt tải: 0
Xem trước 7 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng cung cấp cho người học các kiến thức: Khai phá luật kết hợp. Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu.
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu - Chương 3: Khai phá luật kết hợp TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KHOA CÔNG NGHỆ THÔNG TINBÀI GIẢNG MÔN HỌCKHAI PHÁ DỮ LIỆU CHƯƠNG3:KHAIPHÁLUẬTKẾTHỢP Giảngviên: ThS.NguyễnVươngThịnh B ộm ô n : H ệt h ốn g t h ô n g t in HảiPhòng,2013 Th ô n g t in v ềg i ản g v iê n Họ và tên Nguyễn Vương Thịnh Đơn vị công tác Bộ môn Hệ thống thông tin – Khoa Công nghệ thông tin Học vị Thạc sỹ Chuyên ngành Hệ thống thông tin Cơ sở đào tạo Trường Đại học Công nghệ - Đại học Quốc Gia Hà Nội Năm tốt nghiệp 2012 Điện thoại 0983283791 Email thinhnv@vimaru.edu.vn Website cá nhân http://scholar.vimaru.edu.vn/thinhnv2 Th ô n g t in v ềh ọc p h ần Tên học phần Khai phá dữ liệu Tên tiếng Anh Data Mining Mã học phần 17409 Số tín chỉ 03 tín chỉ Số tiết lý thuyết 39 tiết (13 tuần x 03 tiết/tuần) Số tiết thực hành 10 tiết (05 tuần x 02 tiết/tuần) Bộ môn phụ trách Hệ thống thông tin P H ƯƠN GP HÁP H ỌCTẬP, N GHIÊN CỨU v N g h e g i ản g , t h ảo lu ận , t ra o đ ổiv ớig i ản g v iê n t rê n l ớp . P H ƯƠTNựGP n g HÁP h iê nĐ c ứ ÁNu tHGIÁ à ili ệu v à là m b à it ập ởn h à . v v S Vp h ảit h a m d ự ít n h ất 7 5 %t h ờig ia n . v Có 0 2 b à i k i ểm t ra v i ết g i ữa h ọc p h ần ( X = X2 = ( L1 + L2 ) /2 ) .3 v Th i k ết t h ú c h ọc p h ần b ằn g h ìn h t h ức t r ắc n g h i ệm k h á c h q u a n t rê n m á y t ín h ( Z= 0 . 5 X+ 0 . 5 Y) . Tàiliệuthamkhảo1. Jiawei Han and Micheline Kamber, Data Mining Concepts and Techniques, Elsevier Inc, 2006.2. Ian H. Witten, Eibe Frank,DataMining–PracticalMachineLearningToolsand Techniques (the second edition), Elsevier Inc, 2005 (sử dụng kèm với công cụ W e k a ).3. Elmasri, Navathe, Somayajulu, Gupta, Fundamentals of Database Systems (the4thEdition), Pearson Education Inc, 2004.4. Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú, Giáo trình Khai phá dữ liệu Web, NXB Giáo dục, 2009 45 Cô n g c ụp h ần m ềm h ỗ t rợPhầnmềmWekađượcpháttriểnbởinhómnghiêncứucủatrườngĐạih ọc Wa ik a t o ( N e w Ze a la n d ) t ừ n ă m 1 9 9 9 . Có t h ểd o w n lo a d v ề t ại đ ịa c h ỉ: h t t p ://w w w . c s . w a ik a t o . a c . n z /m l/w e k a /d o w n lo a d in g . h t m l6 CHƯƠNG 3: KHAI PHÁ LUẬT KẾT HỢP3.1. MỘT SỐ KHÁI NIỆM CƠ BẢN3.2. TÌM TẬP PHỔ BIẾN VỚI GIẢI THUẬT APRIORI3.3. SINH LUẬT KẾT HỢP TỪ CÁC TẬP PHỔ BIẾN3.4. TÌM TẬP PHỔ BIẾN VỚI GIẢI THUẬT FP - GROWTH3.5. MỘT SỐ DẠNG THỨC CỦA CSDL GIAO DỊCH3.6. KHAI PHÁ LUẬT KẾT HỢP VỚI PHẦN MỀM WEKA7 3.1.MỘTSỐKHÁINIỆMCƠBẢN 3.1.1. Khái niệm mục (item) và tập mục (item set) Cho một tập gồm n đối tượng I = {I1, I2, I3,…, In}, mỗi phần tử Ii ∈ I được gọi là một mục (item). Một tập con bất kỳ X ⊆ I được gọi là một tập mục (item set). Cho một tập D = {T1, T2,…, Tm}, mỗi phần tử Tj ∈ D được gọi là một giao dịch (transaction) và là một tập con nào đó của I (Tj ⊆ I). Víd ụ:I= { A, B, C, D , E, F} , X = Người ta, gọi { A, D E} D làlà m cơộsở dữ t tập liệu m ụgiao c . Mdịch ột c(transaction ơ s ở d ữ lidatabase). ệu g ia o d ịc hSố D giao g ồmdịchc ácó c ttrong ập c Do nký Tjk hiệuh là á c|D|. n h a u c ủa I: T1 {A, B, C, D} T2 {A, C, E} T3 {A, E} T4 {A, E, F} T5 {A, B, C, E, F}8 Milk,Bread,Coke Beer,Bread Beer,Milk,Diaper,Coke 10:05 10:12 10:15 Beer,Milk,Diaper,Bread Milk,Diaper,Coke 10:23 10:309 3.1.2. Độ hỗ trợ (support) ứng với một tập mục “Độ hỗ trợ ứng với tập mục X là xác suất xuất hiện của X trong cơ sở dữ liệu giao dịch D” Hoặc “Đỗ hỗ trợ ứng với tập mục X là C tỷ( X lệ )các giao dịch có chứa X sup( X ) = trên tổng số các giao dịch có trong| cơ ...
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu - Chương 3: Khai phá luật kết hợp TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KHOA CÔNG NGHỆ THÔNG TINBÀI GIẢNG MÔN HỌCKHAI PHÁ DỮ LIỆU CHƯƠNG3:KHAIPHÁLUẬTKẾTHỢP Giảngviên: ThS.NguyễnVươngThịnh B ộm ô n : H ệt h ốn g t h ô n g t in HảiPhòng,2013 Th ô n g t in v ềg i ản g v iê n Họ và tên Nguyễn Vương Thịnh Đơn vị công tác Bộ môn Hệ thống thông tin – Khoa Công nghệ thông tin Học vị Thạc sỹ Chuyên ngành Hệ thống thông tin Cơ sở đào tạo Trường Đại học Công nghệ - Đại học Quốc Gia Hà Nội Năm tốt nghiệp 2012 Điện thoại 0983283791 Email thinhnv@vimaru.edu.vn Website cá nhân http://scholar.vimaru.edu.vn/thinhnv2 Th ô n g t in v ềh ọc p h ần Tên học phần Khai phá dữ liệu Tên tiếng Anh Data Mining Mã học phần 17409 Số tín chỉ 03 tín chỉ Số tiết lý thuyết 39 tiết (13 tuần x 03 tiết/tuần) Số tiết thực hành 10 tiết (05 tuần x 02 tiết/tuần) Bộ môn phụ trách Hệ thống thông tin P H ƯƠN GP HÁP H ỌCTẬP, N GHIÊN CỨU v N g h e g i ản g , t h ảo lu ận , t ra o đ ổiv ớig i ản g v iê n t rê n l ớp . P H ƯƠTNựGP n g HÁP h iê nĐ c ứ ÁNu tHGIÁ à ili ệu v à là m b à it ập ởn h à . v v S Vp h ảit h a m d ự ít n h ất 7 5 %t h ờig ia n . v Có 0 2 b à i k i ểm t ra v i ết g i ữa h ọc p h ần ( X = X2 = ( L1 + L2 ) /2 ) .3 v Th i k ết t h ú c h ọc p h ần b ằn g h ìn h t h ức t r ắc n g h i ệm k h á c h q u a n t rê n m á y t ín h ( Z= 0 . 5 X+ 0 . 5 Y) . Tàiliệuthamkhảo1. Jiawei Han and Micheline Kamber, Data Mining Concepts and Techniques, Elsevier Inc, 2006.2. Ian H. Witten, Eibe Frank,DataMining–PracticalMachineLearningToolsand Techniques (the second edition), Elsevier Inc, 2005 (sử dụng kèm với công cụ W e k a ).3. Elmasri, Navathe, Somayajulu, Gupta, Fundamentals of Database Systems (the4thEdition), Pearson Education Inc, 2004.4. Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú, Giáo trình Khai phá dữ liệu Web, NXB Giáo dục, 2009 45 Cô n g c ụp h ần m ềm h ỗ t rợPhầnmềmWekađượcpháttriểnbởinhómnghiêncứucủatrườngĐạih ọc Wa ik a t o ( N e w Ze a la n d ) t ừ n ă m 1 9 9 9 . Có t h ểd o w n lo a d v ề t ại đ ịa c h ỉ: h t t p ://w w w . c s . w a ik a t o . a c . n z /m l/w e k a /d o w n lo a d in g . h t m l6 CHƯƠNG 3: KHAI PHÁ LUẬT KẾT HỢP3.1. MỘT SỐ KHÁI NIỆM CƠ BẢN3.2. TÌM TẬP PHỔ BIẾN VỚI GIẢI THUẬT APRIORI3.3. SINH LUẬT KẾT HỢP TỪ CÁC TẬP PHỔ BIẾN3.4. TÌM TẬP PHỔ BIẾN VỚI GIẢI THUẬT FP - GROWTH3.5. MỘT SỐ DẠNG THỨC CỦA CSDL GIAO DỊCH3.6. KHAI PHÁ LUẬT KẾT HỢP VỚI PHẦN MỀM WEKA7 3.1.MỘTSỐKHÁINIỆMCƠBẢN 3.1.1. Khái niệm mục (item) và tập mục (item set) Cho một tập gồm n đối tượng I = {I1, I2, I3,…, In}, mỗi phần tử Ii ∈ I được gọi là một mục (item). Một tập con bất kỳ X ⊆ I được gọi là một tập mục (item set). Cho một tập D = {T1, T2,…, Tm}, mỗi phần tử Tj ∈ D được gọi là một giao dịch (transaction) và là một tập con nào đó của I (Tj ⊆ I). Víd ụ:I= { A, B, C, D , E, F} , X = Người ta, gọi { A, D E} D làlà m cơộsở dữ t tập liệu m ụgiao c . Mdịch ột c(transaction ơ s ở d ữ lidatabase). ệu g ia o d ịc hSố D giao g ồmdịchc ácó c ttrong ập c Do nký Tjk hiệuh là á c|D|. n h a u c ủa I: T1 {A, B, C, D} T2 {A, C, E} T3 {A, E} T4 {A, E, F} T5 {A, B, C, E, F}8 Milk,Bread,Coke Beer,Bread Beer,Milk,Diaper,Coke 10:05 10:12 10:15 Beer,Milk,Diaper,Bread Milk,Diaper,Coke 10:23 10:309 3.1.2. Độ hỗ trợ (support) ứng với một tập mục “Độ hỗ trợ ứng với tập mục X là xác suất xuất hiện của X trong cơ sở dữ liệu giao dịch D” Hoặc “Đỗ hỗ trợ ứng với tập mục X là C tỷ( X lệ )các giao dịch có chứa X sup( X ) = trên tổng số các giao dịch có trong| cơ ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Khai phá dữ liệu Khai phá dữ liệu ThS. Nguyễn Vương Thịnh Hệ thống thông tin Khai phá luật kết hợpTài liệu có liên quan:
-
Bài tập thực hành môn Phân tích thiết kế hệ thống thông tin
6 trang 358 0 0 -
Bài tập lớn môn Khai phá dữ liệu: Phân lớp dữ liệu số bằng giải thuật K-NN
22 trang 357 1 0 -
Bài thuyết trình Hệ thống thông tin trong bệnh viện
44 trang 289 0 0 -
Phương pháp và và ứng dụng Phân tích thiết kế hệ thống thông tin: Phần 1 - TS. Nguyễn Hồng Phương
124 trang 251 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 249 0 0 -
Ứng dụng khai phá dữ liệu nâng cao dịch vụ thư viện số
16 trang 240 0 0 -
Bài giảng HỆ THỐNG THÔNG TIN KẾ TOÁN - Chương 2
31 trang 238 0 0 -
Đồ án tốt nghiệp: Xây dựng ứng dụng quản lý kho hàng trên nền Web
61 trang 222 0 0 -
62 trang 214 2 0
-
Bài giảng Phân tích thiết kế hệ thống thông tin - Chương 9: Thiết kế giao diện
21 trang 211 0 0