Luận văn Một số giải pháp cho bài toán tìm kiếm trong CSDL Hypertext
Số trang: 81
Loại file: pdf
Dung lượng: 1.86 MB
Lượt xem: 16
Lượt tải: 0
Xem trước 9 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Trong những năm gần đây, trên cơ sở phát triển và ứng dụng công nghệ Internet,khối lượng dữ liệu trên máy tính đã tăng trưởng không ngừng theo cả hai phương diệntạo mới và thu thập. Sự mở rộng các dữ liệu khoa học về địa lý, địa chất, khí tượng dovệ tinh thu thập, sự giới thiệu quảng bá mã vạch đối với hầu hết các sản phẩm thươngmại, việc tin học hoá sâu rộng các thương vụ và giao dịch, sự phát triển việc ứng dụngCNTT trong quản lý hành chính nhà nước ... đã phát sinh ra...
Nội dung trích xuất từ tài liệu:
Luận văn Một số giải pháp cho bài toán tìm kiếm trong CSDL Hypertext 1 Luận văn Một số giải pháp cho bàitoán tìm kiếm trong CSDL Hypertext Mét sè gi¶i ph¸p cho bµi to¸n t×m kiÕm trong CSDL Hypertext 2PHẦN MỞ ĐẦU……………………………………………………………………………….2CHƯƠNG I. TỔNG QUAN VỀ WEB-MINING ................................................................... 9 Giới thiệu về cơ sở dữ liệu Fulltext và Hypertext .................................................... 9 1.1 Cơ sở dữ liệu Fulltext ...................................................................................... 9 1.1.1 Cơ sở dữ liệu Hypertext .................................................................................12 1.1.2 So sánh đặc điểm của dữ liệu Fulltext và dữ liệu trang web ............................15 1.1.3 Tổng quan về phương pháp biểu diễn văn bản trong cơ sở dữ liệu trang web..........16 1.2 Giới thiệu sơ bộ về các phương pháp biểu diễn trang web ..............................17 1.2.1 Cách tiếp cận theo web site ............................................................................19 1.2.2 Kết luận chương một .........................................................................................................29CHƯƠNG II. MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN TRANG WEB VÀ GIẢI PHÁP KẾTHỢP. .....................................................................................................................................30 Phương pháp biểu diễn trong các máy t ìm kiếm .....................................................31 2.1 Cấu trúc cơ bản và hoạt động của một máy t ìm kiếm ......................................32 2.1.1 Phương pháp biểu diễn dữ liệu trong các máy t ìm kiếm ..................................35 2.1.2 Phương pháp biểu diễn trang web theo mô hình vector...........................................46 2.2 Phương pháp biểu diễn vector ........................................................................46 2.2.1 Phương pháp biểu diễn trang web theo mô hình vector ...................................49 2.2.2 Đề xuất giải pháp biểu diễn vector trong máy tìm kiếm ..........................................56 2.3 Kết luận chương 2 .............................................................................................................61CHƯƠNG III. MÁY TÌM KIẾM VIETSEEK VÀ THỬ NGHIỆM THUẬT TOÁN TÌMKIẾM THEO NỘI DUNG .....................................................................................................63 Máy tìm kiếm VietSeek .........................................................................................63 3.1 Các đặc điểm cơ bản của Vietseek ..................................................................63 3.1.1 Cơ sở dữ liệu của Vietseek .............................................................................64 3.1.2 Đề xuất thuật toán tìm kiếm mới cho máy t ìm kiếm VietSeek ................................71 3.2 Những cơ sở để đề xuất thuật toán ..................................................................71 3.2.1 Thuật toán ......................................................................................................73 3.2.2 Kết luận chương 3 .............................................................................................................76PHẦN KẾT LUẬN……………………………………………………………………………75TÀI LIỆU THAM KHẢO…………………………………………………………………….77 Mét sè gi¶i ph¸p cho bµi to¸n t×m kiÕm trong CSDL Hypertext 3 PHẦN MỞ ĐẦU Trong những năm gần đây, trên cơ sở phát triển và ứng dụng công nghệ Internet,khối lượng dữ liệu trên máy tính đã tăng trưởng không ngừng theo cả hai phương diệntạo mới và thu thập. Sự mở rộng các dữ liệu khoa học về địa lý, địa chất, khí tượng dovệ tinh thu thập, sự giới thiệu quảng bá mã vạch đối với hầu hết các sản phẩm thươngmại, việc tin học hoá sâu rộng các thương vụ và giao dịch, sự phát triển việc ứng dụngCNTT trong quản lý hành chính nhà n ước ... đã phát sinh ra một khối lượng dữ liệukhổng lồ. Mặt khác, trong bối cảnh nền tảng cho một xã hội thông tin, nhu cầu nhậnđược thông tin một cách nhanh chóng, chính xác cũng như nhu cầu thu nhận được trithức từ khối lượng thông tin khổng lồ nói trên đã trở nên cấp thiết. Bối cảnh đó đã đòihỏi những phương pháp tiếp cận mới mà trong đó ...
Nội dung trích xuất từ tài liệu:
Luận văn Một số giải pháp cho bài toán tìm kiếm trong CSDL Hypertext 1 Luận văn Một số giải pháp cho bàitoán tìm kiếm trong CSDL Hypertext Mét sè gi¶i ph¸p cho bµi to¸n t×m kiÕm trong CSDL Hypertext 2PHẦN MỞ ĐẦU……………………………………………………………………………….2CHƯƠNG I. TỔNG QUAN VỀ WEB-MINING ................................................................... 9 Giới thiệu về cơ sở dữ liệu Fulltext và Hypertext .................................................... 9 1.1 Cơ sở dữ liệu Fulltext ...................................................................................... 9 1.1.1 Cơ sở dữ liệu Hypertext .................................................................................12 1.1.2 So sánh đặc điểm của dữ liệu Fulltext và dữ liệu trang web ............................15 1.1.3 Tổng quan về phương pháp biểu diễn văn bản trong cơ sở dữ liệu trang web..........16 1.2 Giới thiệu sơ bộ về các phương pháp biểu diễn trang web ..............................17 1.2.1 Cách tiếp cận theo web site ............................................................................19 1.2.2 Kết luận chương một .........................................................................................................29CHƯƠNG II. MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN TRANG WEB VÀ GIẢI PHÁP KẾTHỢP. .....................................................................................................................................30 Phương pháp biểu diễn trong các máy t ìm kiếm .....................................................31 2.1 Cấu trúc cơ bản và hoạt động của một máy t ìm kiếm ......................................32 2.1.1 Phương pháp biểu diễn dữ liệu trong các máy t ìm kiếm ..................................35 2.1.2 Phương pháp biểu diễn trang web theo mô hình vector...........................................46 2.2 Phương pháp biểu diễn vector ........................................................................46 2.2.1 Phương pháp biểu diễn trang web theo mô hình vector ...................................49 2.2.2 Đề xuất giải pháp biểu diễn vector trong máy tìm kiếm ..........................................56 2.3 Kết luận chương 2 .............................................................................................................61CHƯƠNG III. MÁY TÌM KIẾM VIETSEEK VÀ THỬ NGHIỆM THUẬT TOÁN TÌMKIẾM THEO NỘI DUNG .....................................................................................................63 Máy tìm kiếm VietSeek .........................................................................................63 3.1 Các đặc điểm cơ bản của Vietseek ..................................................................63 3.1.1 Cơ sở dữ liệu của Vietseek .............................................................................64 3.1.2 Đề xuất thuật toán tìm kiếm mới cho máy t ìm kiếm VietSeek ................................71 3.2 Những cơ sở để đề xuất thuật toán ..................................................................71 3.2.1 Thuật toán ......................................................................................................73 3.2.2 Kết luận chương 3 .............................................................................................................76PHẦN KẾT LUẬN……………………………………………………………………………75TÀI LIỆU THAM KHẢO…………………………………………………………………….77 Mét sè gi¶i ph¸p cho bµi to¸n t×m kiÕm trong CSDL Hypertext 3 PHẦN MỞ ĐẦU Trong những năm gần đây, trên cơ sở phát triển và ứng dụng công nghệ Internet,khối lượng dữ liệu trên máy tính đã tăng trưởng không ngừng theo cả hai phương diệntạo mới và thu thập. Sự mở rộng các dữ liệu khoa học về địa lý, địa chất, khí tượng dovệ tinh thu thập, sự giới thiệu quảng bá mã vạch đối với hầu hết các sản phẩm thươngmại, việc tin học hoá sâu rộng các thương vụ và giao dịch, sự phát triển việc ứng dụngCNTT trong quản lý hành chính nhà n ước ... đã phát sinh ra một khối lượng dữ liệukhổng lồ. Mặt khác, trong bối cảnh nền tảng cho một xã hội thông tin, nhu cầu nhậnđược thông tin một cách nhanh chóng, chính xác cũng như nhu cầu thu nhận được trithức từ khối lượng thông tin khổng lồ nói trên đã trở nên cấp thiết. Bối cảnh đó đã đòihỏi những phương pháp tiếp cận mới mà trong đó ...
Tìm kiếm theo từ khóa liên quan:
luận văn công nghệ phần mềm cơ sở dữ liệu Fulltext mô hình vector Máy tìm kiếm VietSeek thuật toán tìm kiếmTài liệu có liên quan:
-
62 trang 422 3 0
-
Thảo luận đề tài: Mối quan hệ giữa đầu tư theo chiều rộng và đầu tư theo chiều sâu
98 trang 344 0 0 -
LUẬN VĂN: TÌM HIỂU PHƯƠNG PHÁP HỌC TÍCH CỰC VÀ ỨNG DỤNG CHO BÀI TOÁN LỌC THƯ RÁC
65 trang 263 0 0 -
79 trang 250 0 0
-
Giáo trình Toán rời rạc: Phần 1 - Nguyễn Gia Định
67 trang 244 0 0 -
Giáo trình Công nghệ phần mềm nâng cao: Phần 2
202 trang 242 0 0 -
Luận văn: Thiết kế xây dựng bộ đếm xung, ứng dụng đo tốc độ động cơ trong hệ thống truyền động điện
63 trang 240 0 0 -
Báo cáo thực tập nhà máy đường Bến Tre
68 trang 237 0 0 -
BÀI THUYẾT TRÌNH CÔNG TY CỔ PHẦN
11 trang 235 0 0 -
Tiểu luận: Phân tích chiến lược của Công ty Sữa Vinamilk
25 trang 233 0 0