Danh mục tài liệu

Hệ quyết định nhất quán và luật quan trọng

Số trang: 6      Loại file: pdf      Dung lượng: 206.19 KB      Lượt xem: 66      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong bài này nhóm tác giả giới thiệu một số tính chất liên quan đến các ma trận độ hỗ trợ, độ chính xác và độ phủ của các luật quyết đinh. Mục đích chính của bài viết là trình bày thuật toán tìm luật quan trọng sau khi dựa vào các tính chất được nêu ở trên. Đó là dựa vào các ma trận thưa của độ phủ, độ chính xác để tìm các luật quan trọng trong hệ quyết định nhất quán.
Nội dung trích xuất từ tài liệu:
Hệ quyết định nhất quán và luật quan trọngNghiên cứu khoa học công nghệ HỆ QUYẾT ĐỊNH NHẤT QUÁN VÀ LUẬT QUAN TRỌNG Nguyễn Đức Thọ1, Nguyễn Bá Tường2*, Nguyễn Hữu Đông2 Tóm tắt: Trong bài này nhóm tác giả giới thiệu một số tính chất liên quan đến các ma trận độ hỗ trợ, độ chính xác và độ phủ của các luật quyết đinh. Mục đích chính của bài viết là trình bày thuật toán tìm luật quan trọng sau khi dựa vào các tính chất được nêu ở trên. Đó là dựa vào các ma trận thưa của độ phủ, độ chính xác để tìm các luật quan trọng trong hệ quyết định nhất quán.Từ khóa: Tập thô, Độ hỗ trợ, Độ chính xác, Độ phủ, Khai thác dữ liệu. 1. ĐẶT VẤN ĐỀ Các luật trong hệ quyết định dựa trên nền lý thuyết tập thô được phát triển và nghiên cứu trong[1, 2, 3]. Mô hình xác suất tối thiểu của các luật được nghiên cứu để phân loại luật dựa vào độchính xác và độ phủ cao được các tác giả quan tâm nghiên cứu và đã trình bày trong [4, 5]. Bản chất cốt lõi và cũng là kỹ thuật cơ bản khi nghiên cứu các luật trong hệ quyết định là xácđịnh độ đo chất lượng của luật, các khái niệm về độ đo chất lượng của luật được nêu và xéttrong [1, 4, 5, 6, 7, 8, 9, 14, 15]. Trong bài viết này chúng tôi tiếp tục nghiên cứu và phát triểncác ý tưởng trên và dựa vào các ma trận độ hỗ trợ, độ chính xác, độ phủ v.v để xét và nghiêncứu phát triển các tri thức mới. Trong bài viết chúng tôi đã đưa ra được một số tính chất của cácma trận liện quan các luật từ đó nêu được thuật toán tìm luật quan trọng đơn giản và hiệu quả. 2. TỔNG QUAN VỀ LÝ THUYẾT HỆ TIN Các khái niệm cơ bản trong bài viết của chúng tôi được trích trong các tài liệu [1, 5, 6, 14, 15]. Định nghĩa 2.1. Hệ tin đầy đủ là S = ( U, A ), với U là tập hữu hạn khác rỗng các đốitượng, A là tập khác rỗng các thuộc tính. Giá trị thuộc tính a  A của đối tượng u  U là a(u)và a(u) khác rỗng ( not null). Định nghia 2.2. Hệ quyết định đầy đủ DS = (U, C  D) là hệ tin đầy đủ, trong đó U là tậphữu hạn khác rỗng các đối tượng, A= C  D, với C là tập khác rỗng các thuộc tính được gọi làcác thuộc tính điều kiện và D là tập các thuộc tính được gọi là các thuộc tính quyết định và C  D= . Định nghĩa 2.3. Cho S = ( U, A) là hệ tin đầy đủ. Với mỗi tập con B  A, ta xác định quan hệ tương đương IND(B)  UxU, với IND(B) = { (u,v)  UxU:  a  B, a(u) = a(v)}. Phân hoạch của U sinh bởi IND(B) ký hiệulà U/B. Lớp tương đương ứng với u  U là [u]B và [u]B = { v  U: (u,v)  IND(B)} Định nghĩa 2.4. Cho DS = ( U, C  D ) là hệ quyết định đầy đủ. Ta sẽ ký hiệu U/C = {C1, C2, …, Cm}, với Ci ( i = 1, 2, …, m) là lớp điều kiện; U/D = { D1, D2, …, Dn}, với Dj ( j= 1,2, …, n) là lớp quyết định.  Ci  U/C & Dj  U/D, độ hỗ trợ ( support), độ chính xác(accuracy), độ phủ (coverage), độ lệch (error ratio) của luật Ci → Dj được xác định như sau: Độ hỗ trợ của luật Ci → Dj , ký hiệu Supp(Ci|Dj ) và Supp(Ci|Dj ) = | Ci  DJ| / | U| ; Độ chính xác của luật Ci → Dj, ký hiệu Acc(Ci|Dj ) và Acc(Ci|Dj ) = | Ci  DJ| / | Ci|; Độ phủ của luật Ci → Dj, ký hiệu Cov(Ci|Dj ) và Cov(Ci|Dj ) = | Ci  DJ| / | Dj|. Độ lệch của luật Ci → Dj, ký hiệu E(Ci|Dj ) và E(Ci|Dj ) = 1- Acc(Ci|Dj ). Ở đây | Ci| và | Dj|là lực lượng của các tập Ci và Dj tương ứng. Từ định nghĩa ta có các ma trận độ hỗ trợ, độ chính xác và độ phủ như sau:Tạp chí Nghiên cứu KH&CN quân sự, Số 39, 10 - 2015 69 Công nghệ thông tin & Khoa học máy tính Supp(C1 | D1 ) Supp(C1 | D 2 )... Supp(C1 | D n )  Supp(C | D ) Supp(C | D )... Supp(C | D )   2 1 2 2 2 n Supp(C|D) = .    .  Supp(C m | D1 ) Supp(C m | D 2 ) ... Supp(C m | D n )   Cov(C1 | D1 ) Cov(C1 | D 2 )... Cov(C1 | D n )    Cov(C2 | D1 ) Cov(C2 | D 2 )... Cov(C2 | D n ) Cov(C|D) = .    .    Cov(Cm | D1 ) cov(Cm | D 2 ) ... Cov(Cm | D n ) Tương cho các a trận độ chính xác Acc(C⃒D) và độ lệch E(C⃒D). n Tính chất 2.1.[15] 0  Acc(Ci|Dj )  1 và  Acc(C | D ...