Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Nghiên Cứu, Xây Dựng Ứng Dụng Đọc Tin Nhanh Bằng Cách Trích Rút Và Tổng Hợp Thông Tin Từ Các Trang Web
Số trang: 26
Loại file: pdf
Dung lượng: 769.94 KB
Lượt xem: 10
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Mục tiêu nghiên cứu của đề tài là nghiên cứu các thuật toán trích rút thông tin từ trang web. Xây dựng ứng dụng đọc tin nhanh trên thiết bị di động đáp ứng nhu cầu cập nhật tin tức nhanh chóng hiệu quả. Để đạt được mục đích trên, nhiệm vụ chính của đề tài là: Tìm hiểu các nội dung lý thuyết liên về xử lý ngôn ngữ tự nhiên, khai phá dữ liệu web. Trích rút thông tin từ trang web để xây dựng ứng dụng. Biểu diễn kết quả trích rút thông tin từ trang web.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Nghiên Cứu, Xây Dựng Ứng Dụng Đọc Tin Nhanh Bằng Cách Trích Rút Và Tổng Hợp Thông Tin Từ Các Trang Web BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN THỊ KHUYẾN NGHIÊN CỨU, XÂY DỰNG ỨNG DỤNGĐỌC TIN NHANH BẰNG CÁCH TRÍCH RÚT VÀ TỔNG HỢP THÔNG TIN TỪ CÁC TRANG WEB Chuyên ngành: Hệ Thống Thông Tin Mã số: 60.48.01.04TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng - Năm 2016 Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS. HUỲNH CÔNG PHÁP Phản biện 1: TS. HOÀNG THỊ THANH HÀ Phản biện 2: PGS.TS. LÊ MẠNH THẠNH Luận văn được bảo vệ tại Hội đồng chấm Luận văn tốtnghiệp thạc sĩ Hệ thống thông tin họp tại Đại học Đà Nẵng vàongày 31 tháng 07 năm 2016.Có thể tìm hiểu luận văn tại: Trung tâm Thông tin - Học liệu, Đại Học Đà Nẵng 1 MỞ ĐẦU 1. Lý do chọn đề tài Ngày nay công nghệ thông đóng một vai trò rất quan trọng tronghầu hết các lĩnh vực của đời sống xã hội. Sự phát triển nhanh chóngcủa của công nghệ thông tin nói chung và công nghệ World WideWeb nói riêng đã tạo ra một nguồn tài nguyên thông tin vô cùng rộnglớn, một kho tàng tri thức phong phú cho nhân loại. Tuy nhiên,nguồn tài nguyên thông tin này không biểu diễn một cách tập trungmà nằm rải rác phân tán khắp nơi trên mạng, không được sắp xếp,phân loại như mong muốn đã gây không ít những khó khăn cho conngười khi tìm kiếm và khai thác thông tin. Trong hoàn cảnh đó, tríchrút và tổng hợp thông tin ra đời giúp cho việc tìm kiếm và thu thậpthông tin trở nên hiệu quả, tiết kiệm thời gian và công sức trong việcsàng lọc và tổng hợp tri thức. Như tìm hiểu, tôi biết được trích rút thông tin là một trong nhữngphương thức điển hình của chủ đề khai thác nguồn thông tin gồm: - Tìm kiếm thông tin (Information Retrieval) - Tóm lược văn bản (Text Summarization) - Trích rút thông tin (Information Extraction) Trích rút thông tin là phương thức trích chọn để lấy ra thông tinhữu ích từ kho thông tin chưa được tổng hợp chọn lọc. Trích rútthông tin từ trang web là công nghệ bao gồm nhiều phương thứcgiúp trích xuất một phần thông tin hữu ích theo mục đích từ cáctrang web chứa nhiều danh mục, chủ đề, nội dung khác nhau. Khisử dụng công nghệ trích rút thông tin, con người không còn phải 2mất nhiều thời gian để đọc hết các kết quả tìm kiếm trên mạng haycác trang web với nhiều những thông tin, nội dung dung không liênquan để lọc ra những tin cần thiết. Ví dụ như khi chúng ta đọc báotrên mạng, các trang web chứa đầy các nội dung quảng cáo, cácdanh mục, các bài viết. Để biết được kết quả bóng đá, sổ số, bảngtin chứng khoán hay một mục nào đó, chúng ta phải lướt hết nộidung của trang web và tìm ra phần nội dung cần thiết. Việc làm đókhông những lãng phí thời gian mà còn gây ra tình trạng tốn lưulượng, tốn bộ nhớ. Bên cạnh đó, sự ra đời của báo điện tử đã thay đổi diện mạo củaphương thức tiếp cận tri thức, cũng như thay đổi trong thói quenđọc báo của con người. Với ưu thế về tốc độ và khả năng vươn xa,Internet giúp cho độc giả có thể tiếp cận tin tức mọi lúc, mọi nơivới sự hỗ trợ của các thiết bị di động thông minh như điện thoại diđộng thông minh (smartphone), thiết bị đọc sách thông minh(playbook), máy tính cầm tay thông minh (tablet),... Các thiết bị diđộng thông minh không những giao diện đẹp, thiết bị gọn nhẹ, màcòn hỗ trợ truy cập Internet với nhiều loại hình như mạng 3G, mạngkhông dây, GPRS,… đã tạo tiền đề cho nhu cầu đọc báo và cậpnhật tin tức trở thành nhu cầu thiết yếu, không thể thay thế của conngười. Tuy nhiên, việc đọc báo trên các thiết bị di động còn nhiều bấttiện vì màn hình nhỏ không cho phép hiển thị trang web được thiếtkế cho máy tính để bàn, phông chữ bị lỗi, thông tin quảng cáo và tiêuđề của ứng dụng cũng được tải về cùng lúc với ứng dụng làm giảmtốc độ và gây khó chịu cho người dùng,… Chính vì vậy, mục đích 3của luận văn này là xây dựng một hệ thống cho phép dễ dàng vàthuận tiện xem tin tức tiếng Việt của báo điện tử bất kỳ trên thiết bịdi động thông minh, mà chi tiết hơn là trên thiết bị di động hệ điềuhành android. Đó cũng chính là lý do tôi chọn đề tài “Nghiên Cứu, Xây DựngỨng Dụng Đọc Tin Nhanh Bằng Cách Trích Rút Và Tổng HợpThông Tin Từ Các Trang Web” 2. Mục tiêu và nhiệm vụ - Nghiên cứu các thuật toán trích rút thông tin từ trang web. - Xây dựng ứng dụng đọc tin nhanh trên thiết bị di động đáp ứngnhu cầu cập nhật tin tức nhanh chóng hiệu quả. - Để đạt được mục đích trên, nhiệm vụ chính của đề tài là: - Tìm hiểu các nội dung lý thuyết liên về xử lý ngôn ngữ tựnhiên, khai phá dữ liệu web. - Trích rút thông tin từ trang web để x ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Nghiên Cứu, Xây Dựng Ứng Dụng Đọc Tin Nhanh Bằng Cách Trích Rút Và Tổng Hợp Thông Tin Từ Các Trang Web BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN THỊ KHUYẾN NGHIÊN CỨU, XÂY DỰNG ỨNG DỤNGĐỌC TIN NHANH BẰNG CÁCH TRÍCH RÚT VÀ TỔNG HỢP THÔNG TIN TỪ CÁC TRANG WEB Chuyên ngành: Hệ Thống Thông Tin Mã số: 60.48.01.04TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng - Năm 2016 Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS. HUỲNH CÔNG PHÁP Phản biện 1: TS. HOÀNG THỊ THANH HÀ Phản biện 2: PGS.TS. LÊ MẠNH THẠNH Luận văn được bảo vệ tại Hội đồng chấm Luận văn tốtnghiệp thạc sĩ Hệ thống thông tin họp tại Đại học Đà Nẵng vàongày 31 tháng 07 năm 2016.Có thể tìm hiểu luận văn tại: Trung tâm Thông tin - Học liệu, Đại Học Đà Nẵng 1 MỞ ĐẦU 1. Lý do chọn đề tài Ngày nay công nghệ thông đóng một vai trò rất quan trọng tronghầu hết các lĩnh vực của đời sống xã hội. Sự phát triển nhanh chóngcủa của công nghệ thông tin nói chung và công nghệ World WideWeb nói riêng đã tạo ra một nguồn tài nguyên thông tin vô cùng rộnglớn, một kho tàng tri thức phong phú cho nhân loại. Tuy nhiên,nguồn tài nguyên thông tin này không biểu diễn một cách tập trungmà nằm rải rác phân tán khắp nơi trên mạng, không được sắp xếp,phân loại như mong muốn đã gây không ít những khó khăn cho conngười khi tìm kiếm và khai thác thông tin. Trong hoàn cảnh đó, tríchrút và tổng hợp thông tin ra đời giúp cho việc tìm kiếm và thu thậpthông tin trở nên hiệu quả, tiết kiệm thời gian và công sức trong việcsàng lọc và tổng hợp tri thức. Như tìm hiểu, tôi biết được trích rút thông tin là một trong nhữngphương thức điển hình của chủ đề khai thác nguồn thông tin gồm: - Tìm kiếm thông tin (Information Retrieval) - Tóm lược văn bản (Text Summarization) - Trích rút thông tin (Information Extraction) Trích rút thông tin là phương thức trích chọn để lấy ra thông tinhữu ích từ kho thông tin chưa được tổng hợp chọn lọc. Trích rútthông tin từ trang web là công nghệ bao gồm nhiều phương thứcgiúp trích xuất một phần thông tin hữu ích theo mục đích từ cáctrang web chứa nhiều danh mục, chủ đề, nội dung khác nhau. Khisử dụng công nghệ trích rút thông tin, con người không còn phải 2mất nhiều thời gian để đọc hết các kết quả tìm kiếm trên mạng haycác trang web với nhiều những thông tin, nội dung dung không liênquan để lọc ra những tin cần thiết. Ví dụ như khi chúng ta đọc báotrên mạng, các trang web chứa đầy các nội dung quảng cáo, cácdanh mục, các bài viết. Để biết được kết quả bóng đá, sổ số, bảngtin chứng khoán hay một mục nào đó, chúng ta phải lướt hết nộidung của trang web và tìm ra phần nội dung cần thiết. Việc làm đókhông những lãng phí thời gian mà còn gây ra tình trạng tốn lưulượng, tốn bộ nhớ. Bên cạnh đó, sự ra đời của báo điện tử đã thay đổi diện mạo củaphương thức tiếp cận tri thức, cũng như thay đổi trong thói quenđọc báo của con người. Với ưu thế về tốc độ và khả năng vươn xa,Internet giúp cho độc giả có thể tiếp cận tin tức mọi lúc, mọi nơivới sự hỗ trợ của các thiết bị di động thông minh như điện thoại diđộng thông minh (smartphone), thiết bị đọc sách thông minh(playbook), máy tính cầm tay thông minh (tablet),... Các thiết bị diđộng thông minh không những giao diện đẹp, thiết bị gọn nhẹ, màcòn hỗ trợ truy cập Internet với nhiều loại hình như mạng 3G, mạngkhông dây, GPRS,… đã tạo tiền đề cho nhu cầu đọc báo và cậpnhật tin tức trở thành nhu cầu thiết yếu, không thể thay thế của conngười. Tuy nhiên, việc đọc báo trên các thiết bị di động còn nhiều bấttiện vì màn hình nhỏ không cho phép hiển thị trang web được thiếtkế cho máy tính để bàn, phông chữ bị lỗi, thông tin quảng cáo và tiêuđề của ứng dụng cũng được tải về cùng lúc với ứng dụng làm giảmtốc độ và gây khó chịu cho người dùng,… Chính vì vậy, mục đích 3của luận văn này là xây dựng một hệ thống cho phép dễ dàng vàthuận tiện xem tin tức tiếng Việt của báo điện tử bất kỳ trên thiết bịdi động thông minh, mà chi tiết hơn là trên thiết bị di động hệ điềuhành android. Đó cũng chính là lý do tôi chọn đề tài “Nghiên Cứu, Xây DựngỨng Dụng Đọc Tin Nhanh Bằng Cách Trích Rút Và Tổng HợpThông Tin Từ Các Trang Web” 2. Mục tiêu và nhiệm vụ - Nghiên cứu các thuật toán trích rút thông tin từ trang web. - Xây dựng ứng dụng đọc tin nhanh trên thiết bị di động đáp ứngnhu cầu cập nhật tin tức nhanh chóng hiệu quả. - Để đạt được mục đích trên, nhiệm vụ chính của đề tài là: - Tìm hiểu các nội dung lý thuyết liên về xử lý ngôn ngữ tựnhiên, khai phá dữ liệu web. - Trích rút thông tin từ trang web để x ...
Tìm kiếm theo từ khóa liên quan:
Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin Xây Dựng ứng dụng đọc tin nhanh Tổng hợp thông tin từ các trang web Xử lý ngôn ngữ tự nhiênTài liệu có liên quan:
-
30 trang 600 0 0
-
Bài tập thực hành môn Phân tích thiết kế hệ thống thông tin
6 trang 357 0 0 -
12 trang 338 0 0
-
26 trang 304 0 0
-
Bài thuyết trình Hệ thống thông tin trong bệnh viện
44 trang 289 0 0 -
Phương pháp tạo ra văn bản tiếng Việt có đề tài xác định
7 trang 285 0 0 -
26 trang 279 0 0
-
Phương pháp và và ứng dụng Phân tích thiết kế hệ thống thông tin: Phần 1 - TS. Nguyễn Hồng Phương
124 trang 251 0 0 -
Bài giảng HỆ THỐNG THÔNG TIN KẾ TOÁN - Chương 2
31 trang 238 0 0 -
Giáo trình Lập trình logic trong prolog: Phần 1
114 trang 224 0 0