Danh mục tài liệu

Luận văn Một số giải pháp cho bài toán tìm kiếm trong CSDL Hypertext

Số trang: 81      Loại file: pdf      Dung lượng: 1.86 MB      Lượt xem: 16      Lượt tải: 0    
Xem trước 9 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong những năm gần đây, trên cơ sở phát triển và ứng dụng công nghệ Internet,khối lượng dữ liệu trên máy tính đã tăng trưởng không ngừng theo cả hai phương diệntạo mới và thu thập. Sự mở rộng các dữ liệu khoa học về địa lý, địa chất, khí tượng dovệ tinh thu thập, sự giới thiệu quảng bá mã vạch đối với hầu hết các sản phẩm thươngmại, việc tin học hoá sâu rộng các thương vụ và giao dịch, sự phát triển việc ứng dụngCNTT trong quản lý hành chính nhà nước ... đã phát sinh ra...
Nội dung trích xuất từ tài liệu:
Luận văn Một số giải pháp cho bài toán tìm kiếm trong CSDL Hypertext 1 Luận văn Một số giải pháp cho bàitoán tìm kiếm trong CSDL Hypertext Mét sè gi¶i ph¸p cho bµi to¸n t×m kiÕm trong CSDL Hypertext 2PHẦN MỞ ĐẦU……………………………………………………………………………….2CHƯƠNG I. TỔNG QUAN VỀ WEB-MINING ................................................................... 9 Giới thiệu về cơ sở dữ liệu Fulltext và Hypertext .................................................... 9 1.1 Cơ sở dữ liệu Fulltext ...................................................................................... 9 1.1.1 Cơ sở dữ liệu Hypertext .................................................................................12 1.1.2 So sánh đặc điểm của dữ liệu Fulltext và dữ liệu trang web ............................15 1.1.3 Tổng quan về phương pháp biểu diễn văn bản trong cơ sở dữ liệu trang web..........16 1.2 Giới thiệu sơ bộ về các phương pháp biểu diễn trang web ..............................17 1.2.1 Cách tiếp cận theo web site ............................................................................19 1.2.2 Kết luận chương một .........................................................................................................29CHƯƠNG II. MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN TRANG WEB VÀ GIẢI PHÁP KẾTHỢP. .....................................................................................................................................30 Phương pháp biểu diễn trong các máy t ìm kiếm .....................................................31 2.1 Cấu trúc cơ bản và hoạt động của một máy t ìm kiếm ......................................32 2.1.1 Phương pháp biểu diễn dữ liệu trong các máy t ìm kiếm ..................................35 2.1.2 Phương pháp biểu diễn trang web theo mô hình vector...........................................46 2.2 Phương pháp biểu diễn vector ........................................................................46 2.2.1 Phương pháp biểu diễn trang web theo mô hình vector ...................................49 2.2.2 Đề xuất giải pháp biểu diễn vector trong máy tìm kiếm ..........................................56 2.3 Kết luận chương 2 .............................................................................................................61CHƯƠNG III. MÁY TÌM KIẾM VIETSEEK VÀ THỬ NGHIỆM THUẬT TOÁN TÌMKIẾM THEO NỘI DUNG .....................................................................................................63 Máy tìm kiếm VietSeek .........................................................................................63 3.1 Các đặc điểm cơ bản của Vietseek ..................................................................63 3.1.1 Cơ sở dữ liệu của Vietseek .............................................................................64 3.1.2 Đề xuất thuật toán tìm kiếm mới cho máy t ìm kiếm VietSeek ................................71 3.2 Những cơ sở để đề xuất thuật toán ..................................................................71 3.2.1 Thuật toán ......................................................................................................73 3.2.2 Kết luận chương 3 .............................................................................................................76PHẦN KẾT LUẬN……………………………………………………………………………75TÀI LIỆU THAM KHẢO…………………………………………………………………….77 Mét sè gi¶i ph¸p cho bµi to¸n t×m kiÕm trong CSDL Hypertext 3 PHẦN MỞ ĐẦU Trong những năm gần đây, trên cơ sở phát triển và ứng dụng công nghệ Internet,khối lượng dữ liệu trên máy tính đã tăng trưởng không ngừng theo cả hai phương diệntạo mới và thu thập. Sự mở rộng các dữ liệu khoa học về địa lý, địa chất, khí tượng dovệ tinh thu thập, sự giới thiệu quảng bá mã vạch đối với hầu hết các sản phẩm thươngmại, việc tin học hoá sâu rộng các thương vụ và giao dịch, sự phát triển việc ứng dụngCNTT trong quản lý hành chính nhà n ước ... đã phát sinh ra một khối lượng dữ liệukhổng lồ. Mặt khác, trong bối cảnh nền tảng cho một xã hội thông tin, nhu cầu nhậnđược thông tin một cách nhanh chóng, chính xác cũng như nhu cầu thu nhận được trithức từ khối lượng thông tin khổng lồ nói trên đã trở nên cấp thiết. Bối cảnh đó đã đòihỏi những phương pháp tiếp cận mới mà trong đó ...