Danh mục tài liệu

Bài giảng Khai phá dữ liệu - Chương 3: Khai phá luật kết hợp

Số trang: 70      Loại file: pptx      Dung lượng: 2.75 MB      Lượt xem: 12      Lượt tải: 0    
Xem trước 7 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng cung cấp cho người học các kiến thức: Khai phá luật kết hợp. Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu.
Nội dung trích xuất từ tài liệu:
Bài giảng Khai phá dữ liệu - Chương 3: Khai phá luật kết hợp TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KHOA CÔNG NGHỆ THÔNG TINBÀI GIẢNG MÔN HỌCKHAI PHÁ DỮ LIỆU CHƯƠNG3:KHAIPHÁLUẬTKẾTHỢP Giảngviên: ThS.NguyễnVươngThịnh B ộm ô n : H ệt h ốn g t h ô n g t in HảiPhòng,2013 Th ô n g t in v ềg i ản g v iê n Họ và tên Nguyễn Vương Thịnh Đơn vị công tác Bộ môn Hệ thống thông tin – Khoa Công nghệ thông tin Học vị Thạc sỹ Chuyên ngành Hệ thống thông tin Cơ sở đào tạo Trường Đại học Công nghệ - Đại học Quốc Gia Hà Nội Năm tốt nghiệp 2012 Điện thoại 0983283791 Email thinhnv@vimaru.edu.vn Website cá nhân http://scholar.vimaru.edu.vn/thinhnv2 Th ô n g t in v ềh ọc p h ần Tên học phần Khai phá dữ liệu Tên tiếng Anh Data Mining Mã học phần 17409 Số tín chỉ 03 tín chỉ Số tiết lý thuyết 39 tiết (13 tuần x 03 tiết/tuần) Số tiết thực hành 10 tiết (05 tuần x 02 tiết/tuần) Bộ môn phụ trách Hệ thống thông tin P H ƯƠN GP HÁP H ỌCTẬP, N GHIÊN CỨU v N g h e g i ản g , t h ảo lu ận , t ra o đ ổiv ớig i ản g v iê n t rê n l ớp . P H ƯƠTNựGP n g HÁP h iê nĐ c ứ ÁNu tHGIÁ à ili ệu v à là m b à it ập ởn h à . v v S Vp h ảit h a m d ự ít n h ất 7 5 %t h ờig ia n . v Có 0 2 b à i k i ểm t ra v i ết g i ữa h ọc p h ần ( X = X2 = ( L1 + L2 ) /2 ) .3 v Th i k ết t h ú c h ọc p h ần b ằn g h ìn h t h ức t r ắc n g h i ệm k h á c h q u a n t rê n m á y t ín h ( Z= 0 . 5 X+ 0 . 5 Y) . Tàiliệuthamkhảo1. Jiawei Han and Micheline Kamber, Data Mining Concepts and Techniques, Elsevier Inc, 2006.2. Ian H. Witten, Eibe Frank,DataMining–PracticalMachineLearningToolsand Techniques (the second edition), Elsevier Inc, 2005 (sử dụng kèm với công cụ W e k a ).3. Elmasri, Navathe, Somayajulu, Gupta, Fundamentals of Database Systems (the4thEdition), Pearson Education Inc, 2004.4. Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú, Giáo trình Khai phá dữ liệu Web, NXB Giáo dục, 2009 45 Cô n g c ụp h ần m ềm h ỗ t rợPhầnmềmWekađượcpháttriểnbởinhómnghiêncứucủatrườngĐạih ọc Wa ik a t o ( N e w Ze a la n d ) t ừ n ă m 1 9 9 9 . Có t h ểd o w n lo a d v ề t ại đ ịa c h ỉ: h t t p ://w w w . c s . w a ik a t o . a c . n z /m l/w e k a /d o w n lo a d in g . h t m l6 CHƯƠNG 3: KHAI PHÁ LUẬT KẾT HỢP3.1. MỘT SỐ KHÁI NIỆM CƠ BẢN3.2. TÌM TẬP PHỔ BIẾN VỚI GIẢI THUẬT APRIORI3.3. SINH LUẬT KẾT HỢP TỪ CÁC TẬP PHỔ BIẾN3.4. TÌM TẬP PHỔ BIẾN VỚI GIẢI THUẬT FP - GROWTH3.5. MỘT SỐ DẠNG THỨC CỦA CSDL GIAO DỊCH3.6. KHAI PHÁ LUẬT KẾT HỢP VỚI PHẦN MỀM WEKA7 3.1.MỘTSỐKHÁINIỆMCƠBẢN 3.1.1. Khái niệm mục (item) và tập mục (item set)  Cho một tập gồm n đối tượng I = {I1, I2, I3,…, In}, mỗi phần tử Ii ∈ I được gọi là một mục (item). Một tập con bất kỳ X ⊆ I được gọi là một tập mục (item set).  Cho một tập D = {T1, T2,…, Tm}, mỗi phần tử Tj ∈ D được gọi là một giao dịch (transaction) và là một tập con nào đó của I (Tj ⊆ I). Víd ụ:I= { A, B, C, D , E, F} , X = Người ta, gọi { A, D E} D làlà m cơộsở dữ t tập liệu m ụgiao c . Mdịch ột c(transaction ơ s ở d ữ lidatabase). ệu g ia o d ịc hSố D giao g ồmdịchc ácó c ttrong ập c Do nký Tjk hiệuh là á c|D|. n h a u c ủa I: T1 {A, B, C, D} T2 {A, C, E} T3 {A, E} T4 {A, E, F} T5 {A, B, C, E, F}8 Milk,Bread,Coke Beer,Bread Beer,Milk,Diaper,Coke 10:05 10:12 10:15 Beer,Milk,Diaper,Bread Milk,Diaper,Coke 10:23 10:309 3.1.2. Độ hỗ trợ (support) ứng với một tập mục “Độ hỗ trợ ứng với tập mục X là xác suất xuất hiện của X trong cơ sở dữ liệu giao dịch D” Hoặc “Đỗ hỗ trợ ứng với tập mục X là C tỷ( X lệ )các giao dịch có chứa X sup( X ) = trên tổng số các giao dịch có trong| cơ ...