Danh mục tài liệu

Báo cáo Khai phá Luật kết hợp trong cơ sở dữ liệu đa phương tiện

Số trang: 22      Loại file: pdf      Dung lượng: 669.50 KB      Lượt xem: 17      Lượt tải: 0    
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Tổng quan về phát hiện tri thức, quá trình phát hiện tri thức từ cơ sở dữ liệu và khai phá dữ liệu. Nghiên cứu cơ sở dữ liệu đa phương tiện cũng như hệ quản trị cơ sở dữ liệu đa phương tiện. Tìm hiểu về luật kết hợp trong khai phá dữ liệu qua định nghĩa, bài toán, hướng tiếp cận và một số thuật toán phát hiện luận kết hợp. Trình bày khai phá luật kết hợp trong cơ sở dữ liệu hình ảnh: dữ liệu hình ảnh; trích chọn đặc trưng trong khai phá ảnh;...
Nội dung trích xuất từ tài liệu:
Báo cáo "Khai phá Luật kết hợp trong cơ sở dữ liệu đa phương tiện " Khai phá Luật kết hợp trong cơ sở dữ liệu đa phương tiện Nguyễn Thị Biên Trường Đại học Công nghệ Luận văn ThS. ngành: Công nghệ phần mềm; Mã số: 60 48 10 Người hướng dẫn: PGS.TS. Đặng Văn Đức Năm bảo vệ: 2012 Abstract. Tổng quan về phát hiện tri thức, quá trình phát hiện tri thức từ cơ sở dữ liệu và khai phá dữ liệu. Nghiên cứu cơ sở dữ liệu đa phương tiện cũng như hệ quản trị cơ sở dữ liệu đa phương tiện. Tìm hiểu về luật kết hợp trong khai phá dữ liệu qua định nghĩa, bài toán, hướng tiếp cận và một số thuật toán phát hiện luận kết hợp. Trình bày khai phá luật kết hợp trong cơ sở dữ liệu hình ảnh: dữ liệu hình ảnh; trích chọn đặc trưng trong khai phá ảnh; khai phá luật kết hợp dựa trên nội dung ảnh bằng thuật toán Apriori. Keywords. Công nghệ phần mềm; Cơ sở dữ liệu đa phương tiện; Khai phá dữ liệuContent MỞ ĐẦU Trong điều kiện và yêu cầu của thương trường, đòi hỏi phải có những phương phápnhanh, phù hợp, tự động, chính xác và có hiệu quả để lấy được thông tin có giá trị. Các trithức chiết xuất được từ cơ sở dữ liệu sẽ là một nguồn tài liệu hỗ trợ cho lãnh đạo trong việclên kế hoạch hoạt động hoặc trong việc ra quyết định sản xuất kinh doanh. Vì vậy, tính ứngdụng của khai thác luật kết hợp từ cơ sở dữ liệu là một vấn đề đang được quan tâm. Khai phá dữ liệu là giai đoạn quan trọng trong tiến trình khai thác tri thức từ cơ sở dữ liệu,các tri thức này hỗ trợ cho việc ra quyết định trong khoa học và kinh doanh. Công nghệ Multimedia liên quan tới việc mô tả sự kết hợp các dạng thông tin khác nhau(âm thanh, hình ảnh, văn bản, video) dưới dạng tín hiệu số. Một cơ sở dữ liệu Multimedia đòihỏi phải có các phương thức đặc biệt nhằm mục đích tối ưu hóa việc lưu trữ, truy cập và khaithác các dạng thông tin đặc biệt này. Luật kết hợp là phương tiện hữu ích để khám phá các mối liên kết trong dữ liệu. Khai pháluật kết hợp trong cơ sở dữ liệu Multimedia cho phép tiết kiệm chi phí và làm tăng hiệu suấtlàm việc. CHƢƠNG 1- TỔNG QUAN VỀ PHÁT HIỆN TRI THỨC VÀ KHAI PHÁ DỮ LIỆU1.1. Phát hiện tri thức và khai phá dữ liệu Việc thu thập và lưu trữ các kho chứa dữ liệu khổng lồ dẫn tới một yêu cầu cấp thiếtlà cần có những kỹ thuật và công cụ mới để tự động chuyển đổi lượng dữ liệu khổng lồ thànhcác tri thức có ích. Do vậy, khai phá dữ liệu (KPDL) nhằm phát hiện các tri thức mới giúp íchcho hoạt động của con người đã trở thành một lĩnh vực quan trọng của ngành Công nghệthông tin.1.2. Quá trình phát hiện tri thức từ cơ sở dữ liệu Thông tin là một khái niệm trừu tượng, được thể hiện dưới nhiều dạng thức khácnhau. Thông tin có thể được phát sinh, lưu trữ, biến đổi trong những vật mang tin. Dữ liệu làsự biểu diễn thông tin và được thể hiện bằng các tín hiệu vật lý. Dữ liệu là một dãy các bitcác số, sử dụng các bit để đo lường các thông tin và xem nó như là các dữ liệu đã được lọc bỏcác dư thừa, được rút gọn tới mức tối thiểu để đặc trưng một cách cơ bản cho dữ liệu. Có thể xem tri thức như là các thông tin tích hợp, bao gồm các sự kiện và các mốiquan hệ giữa chúng. Các mối quan hệ này có thể được hiểu ra, có thể được phát hiện, hoặc cóthể được học. Mục đích của phát hiện tri thức và KPDL là tìm ra các mẫu và các mô hình đang tồntại trong các cơ sở dữ liệu nhưng vẫn còn bị che khuất bởi hàng “núi” dữ liệu. Quá trình pháthiện tri thức được mô tả tóm tắt trên Hình 1.1: Hình 1.1: Quy trình phát hiện tri thức từ cơ sở dữ liệu Làm sạch dữ liệu: Loại bỏ dữ liệu nhiễu hoặc dữ liệu không thích hợp. Tích hợp dữ liệu: Tích hợp dữ liệu từ các nguồn khác nhau. Chọn dữ liệu: Chọn những dữ liệu liên quan trực tiếp đến nhiệm vụ. Chuyển đổi dữ liệu: Chuyển DL về những dạng phù hợp cho việc khai phá. Khai phá dữ liệu. Đánh giá mẫu: Đánh giá mẫu hoặc tri thức đã thu được. Trình diễn dữ liệu: Biểu diễn những tri thức khai phá được cho người sử dụng.1.2.1. Xác định vấn đề Trong thực tế, các cơ sở dữ liệu được chuyên môn hóa và phân chia theo các lĩnh vựckhác nhau như sản phẩm, kinh doanh, tài chính, … Vì vậy mà việc xác định lĩnh vực và địnhnghĩa bài toán giúp định hướng cho giai đoạn tiếp theo thu thập và tiền xử lý dữ liệu.1.2.2. Thu thập và tiền xử lý dữ liệu Các cơ sở dữ liệu thu được thường chứa rất nhiều thuộc tính nhưng lại không đầy đủ,không thuần nhất, có nhiều lỗi và các giá trị đặc biệt. Vì vậy, giai đoạn thu thập và tiền xử lýdữ liệu trở nên rất quan trọng trong quá trình phát hiện tri thức từ cơ sở dữ liệu. Người ta chiagiai đoạn thu thập và tiền xử lý dữ liệu thành các công đo ...

Tài liệu có liên quan: